web-dev-qa-db-ja.com

「遅い」ネットワークのトラブルシューティング

ある時点で「ネットワーク」が「遅い」という不満がありました。1つの部屋(スイッチ)または1つのコンピューターにローカライズされている可能性があります。インターネット(DNS?ブラウザーの問題ですか?) (実行時間の長いSQLクエリ?AVスキャンは実行中?).

システムやアプリケーションの明らかな問題を除外したら、ネットワークの速度低下や不安定な動作をテストするにはどうすればよいですか? OSIレイヤーを上に上っていますか?もしそうなら、どのように各レイヤーをチェックするのですか?未知の環境で物理ネットワークに問題がないことを確認するために何をしますか?あまりにも多くのブロードキャストやブロードキャストストームはどうですか?レイヤー3以上? traceroute?他のヒント、方法、アイデアはありますか?すべての規模のネットワークに必要な機能とツール(ポートミラーリング、SNMP、監視など)はありますか?

21
WuckaChucka

tcpdumpとwiresharkはあなたの友達です。

「遅い」ネットワークと「良い」ネットワークのワイヤ上のパケットを監視することは、通常、問題を特定するものであることがわかりました。

「遅い」には多くの種類があります。

SmokePingなどのツールを使用して、ローカルサイトやインターネットサイトへの待ち時間を追跡できます。 (SmokePingは、TCPサービス)からICMPレイテンシとサービスレイテンシを追跡するように構成できます)

スイッチは、ブロードキャストパケットとユニキャストパケットを追跡する必要があります。その比率をグラフ化します。

Tracerouteを監視することも好きです(自分の「重要な」サイト間のISPホップのドメイン名を確認する)。

これらのコメントがお役に立てば幸いです。

9
Joel K

この仕事の90%は、どの種類の問題を探すべきかを教えてくれる経験であり、残りの90%は、どこから始めるべきかのヒントを得るためにGoogleのどこを見ればよいかを知っているため、具体的な答えを出すのは困難です。

私は通常、お客様に問題を実演してもらい(ほとんどの場合、お客様の指の問題と、お客様が問題を説明している可能性のある問題を除外するため)、次に別のコンピューターで問題を再現しようとします。そうすることで、どこを見ればよいかがよくわかります。

今日でも、特にWindowsシステムの場合、再起動の修正問題を忘れないでください。以前はこのようなものでしたので、「再起動しましたか?よく試して、問題が解決しない場合はお知らせください」と尋ねるので、質問された問題のかなりの部分が修正されました。

また、DNS解決の問題と基本的な接続(ルーターのACL、ネットワークのエアギャップ、リモートサイトへのping/traceroutes/mtrsなど)には、頻繁に問題が発生します。

直接制御できるサービスの場合、nagiosなどを実行してサービスが実際に実行されていることを確認すると、顧客から通知される前に問題を修正するように頻繁にトリガーされることがあります。おそらく、直接muninなどを介して、またはSNMPを介してCactiなどの統計収集を実行することもできます。

私は通常、少なくともすべてのコアスイッチとファイアウォールに対してCactiを実行しようとします。可能であれば、私はできる限りすべてに対してサボテンを実行します。これらの場合、私は通常、ポートエラー数や過剰なトラフィックなどを探しています。一部のデバイスのファイアウォールグラフは、CPU使用率と同時セッションを示します。ファイアウォールデバイスで問題が発生し始めるしきい値を知ることができます。

ファイアウォールがsyslogデバイスにログを記録できる場合があります。もしそうなら、できる限りすべてをログに記録し、ヒントを探します。これは、1つのモノリシックファイルを処理するのではなく、syslog-ng、rsyslog、またはsplunkなどのログをいくらか分割できる場合に、より簡単になります。

また、少なくともファイアウォールの内側と、可能な場合はインターネットプロバイダーへのアップリンクに対してnfsenを実行しようとします。これにより、時間を遡ってセッションを確認し、誰が何をしていたかを確認できます。これにより、興味深い動作が見つかることがあります。

6

レイテンシやその他のネットワーク問題のトラブルシューティングに役立つツールをいくつか紹介します。

  • OSIモード l-下から始めて上に向かって作業します
  • ping-RTT(つまり、レイテンシー)を確認します
  • HTTP ping -ファイアウォールが通常のICMPをブロックする場合に役立ちます
  • ping -r 9-非対称ルーティング状況の識別に役立ちます
  • traceroute-パケットはどのように到達し、途中のルーターはどのように応答していますか?多くの場合、ルーターはこれらのパケットを低い優先度で処理するため、実際のパフォーマンスが向上する可能性があることに注意してください。
  • Wireshark -ある程度の専門知識が必要ですが、それより低いレベルを取得することはできません
  • SpeedGuide.net TCP/IPアナライザー -PCのTCP設定を確認します
  • SG TCPオプティマイザWindowsのみ)NIC設定を最適化する方法を提案します
  • ---(IPチキン -ソース(非NAT)IPアドレスは何ですか?
  • http://downforeveryoneorjustme.com/ -多分それはあなた...
  • 帯域幅速度テスト -ダウンロード/アップロード速度を確認します
  • ネットワークツール -ネットワークの外部からツール/テストを実行します
  • ネットワークポートでエラー/ CRCなどを確認します。 -
  • 使用率(帯域幅モニター)とブロードキャストストームについてネットワークを確認する
  • ユニキャストフラッディングを確認します。wiresharkを使用して、ワークステーション宛てでないユニキャストトラフィックを監視します。
  • スパニングツリールートブリッジが適切に配置されていることを確認します
5
Peter

ワイヤレスネットワークを実行している場合、よくあるスローダウンの1つはチャネル干渉です。 1つのエリアに多数のSSIDが存在すると、ネットワークトラフィックが実際に遅くなる可能性があります。 (考えてください:WWDC '10でのiPhone 4のデモ)。

この問題のトラブルシューティングは、地域のワイヤレストラフィックパターンを表示できるソフトウェアを使用すれば、かなり簡単です。 http://meraki.com/tools/stumbler には、無料でWebベースの優れたものがあります。 (開示:私はMerakiで働いています)

干渉を減らすには、チャネル1、6、または11を使用するのが最適です。802.11nギアを5GHz周波数で使用することも役立ちます。

4
joeybaker

私は常に Cacti を使用してレイヤー2のものを監視することから始めます。これにより、パターンを探すために使用できる十分な量のデータが得られ、すべてが正常に機能しているときとユーザーが遅くなっているときのCactiグラフを比較できます。

正確な問題を見つけることはおそらくできませんが、問題を絞り込むのに役立つ良い出発点になります。

1
TonyB

私は最も外側のルーターから始めて、次の段階に進み、最も基本的な方法でパフォーマンスを測定します。帯域幅テストサイト、またはアップロード/ダウンロード速度を提供する既知の外部FTPサイトを使用し、あなたがダウンするまでダウンし続けます。問題が存在するレベルを見つけます。

問題がどこにあるかがわかったら、空想的なツールとモニターを配備します。しかし、すべてのレイヤーでそれを行う時間を無駄にしないでください。それは永遠にかかります。

1
Satanicpuppy

また、ユーザーが「ネットワークが遅い」と言ったときにユーザーが正しいと単純に想定するのではなく、サーバーとデスクトップ/クライアント環境を知る必要もあります。各問題を系統的にトラブルシューティングする必要があります-他の人が言ったように、最初にエラーを表示し、理想的には再現でき、次にシナリオに適した方法でそこから作業できるはずです。

ただし、ネットワークとサーバーを適切に管理および監視することで、多くの時間を節約できます。なぜなら、おそらくalso症状、および不平を言うユーザー/顧客に対処します。

TcpdumpとWiresharkの答えは間違っていません。これらはツールキットの重要な部分になる可能性があります。しかし、それが実際にネットワークであることが確実である場合を除いて、それらが最初に到達するものであってはなりません。

1
mfinni

遅いネットワークは一般的な現象です。ネットワーク速度が遅い原因はいくつかあります。遅いネットワークのトラブルシューティングは、日常のネットワーク管理で最も一般的で面倒な作業の1つです。

分析によると、ネットワークが遅い主な理由は次のとおりです。

Loopback
Broadcast/Multicast storm
Virus attack
Server slow response
Too many clients
Application slow response
Error client mask

ネットワークが遅くなる原因をすばやく見つけるにはどうすればよいですか?ネットワークアナライザー(Ax3soft Unicorn、wiresharkなど)でパケットをキャプチャして分析することをお勧めします。

また、「遅いネットワークの理由を見つける」という記事を読んで、URLをクリックします( http://www.ids-sax2.com//Unicorn/Tutorials/Find-Reasons-for-Slow-Network-with -Ax3soft-Unicorn.htm )にアクセスしてください。

0
Andy.H