約8台のLinuxサーバー、Cisco 2600ルーター、およびCisco3500XLスイッチを備えた小規模なネットワークがあります。ルーターとスイッチは、何年にもわたって構成され、適切に機能しています。
約6時間前、特定のプロトコルを介して接続を確立する時間が急増しました。 SSH経由でサーバーに接続すると、確立に数分かかる場合があります。ただし、接続が確立されると、正常に機能します。 scpを介したファイルのコピーも高速ですが、最初の接続を確立するには永遠に時間がかかります。 telnetと同じです。
ただし、HTTPまたはHTTPSを介した接続はまったく問題ありません。彼らは通常のように巡航します。また、SFTPも問題ないようです。
SNMP接続も影響を受けているようです。私のCactiモニタリングサーバーは、ログのタイムアウトエラーで正しく動作を停止しました。 PHPSVR: Poller[0] Maximum runtime of 292 seconds exceeded for the Script Server. Exiting.
断続的になりますが、ほとんどの場合、ホストからの結果は失敗しますが、ルーターとスイッチのCPUとメモリのレポートにはかなり信頼性があります。
スイッチのsnmpモニタリングの奇妙な点は、一部のスイッチポートが引き続き報告され、サボテングラフに表示されることと、約6時間前に停止することです。ただし、スイッチCLIにログインすると、これらのポートでのアクティビティが表示されます。
私のコロ施設は、現時点ではネットワークの問題はないと主張しています。私はそれが私のネットワークの何かだと思いますが、何を理解することができません。重大なトラフィックの急増は見られず、問題なくDNSクエリを実行できます(Dig
クエリには約34ミリ秒かかります)。ネットワーク内のホスト間で接続している場合でも、遅延が発生します。
これのトラブルシューティングを進める方法についてのポインタはありますか?スイッチとルーターの両方をリロードしましたが、問題は解決しません。以下に、ssh -vv
の出力と、ログインプロセスのさまざまな時点で何秒の遅延があったかを示すコメントを示します。 https://Gist.github.com/963682
あなたの名前解決は壊れています。