生物物理計算化学者の雛

主に科学に関する諸々を書き留めています。

ネットワークトラブル時にはハブのLANケーブル接続部位を変えてみよう

複数コアによる並列MDシミュレーションを実行していた際に、特定のマシンでのみCPU使用率が100%に貼りつかず、計算速度が100%使用時の半分程度まで落ちてしまう現象に遭遇しました。最終的にスイッチングハブのLANケーブル接続ポートを変更することで解決できたのでいきさつを書いておきます。


12コア搭載マシンでMPIによる12スレッド並列計算をおこなっていたところ、やけに計算が遅いマシンがあることに気付きました。
top コマンドによりCPU使用率をチェックしたところ、12スレッドのうち1スレッドのみが時折CPU使用率が0%近くまで落ち、また100%まで戻るという挙動を示していました。
また ls, df 等のコマンド実行にも他のマシンよりも明らかに長い遅延が起きていましたので、おそらくネットワークに問題が生じており、ネットワーク越しにNFSへと書き込む際に大きな遅延が生じているのだろうと推測しました。
そこでネットワーク周りを中心に様々な試行錯誤を行った結果、LANケーブルを接続していたハブの接続ポートを別のポートに変更することで、問題となっていたネットワーク遅延が解決されることに気付きました。


ネットワーク越しのマシンの反応が鈍い、遅延があるといった具合に調子が悪いときにはLANケーブルの接続ポートを変更すると解決できるケースもあるという体験談でした。