私は米国中の人々にサービスを提供するウェブサイトを持っています。単一のWebサーバーからWebサイトをホストします。
今日、私のウェブサイトを読み込めないと主張する人もいますが、これはある種のインターネットルーティングの問題またはDNSの問題である可能性が高いのではないかと思います。
問題が何であるかを正確に把握するにはどうすればよいですか?できれば、ユーザーにpingやnslookupを使用するように依頼したくないのは、ほとんどの場合Windowsボックスを実行していて、デフォルトでインストールされているとは思わないからです。
注意事項:ユーザーは、実際にはサービスにまったく関係のないあらゆる種類の問題について「ウェブサイトがダウンしている」と報告します。独自にサイトが稼働していることを確認し(友人に尋ね、所有している別のサーバーを使用します)、すぐに自分のネットワークを疑ってください。私は自分のリンクでDNSチェックを2番目にします: 私のDNSは何ですか? 誰があなたのDNSを実行しますか?サーバーがドメインに対して権限を持っていることを確認し、ネームサーバーを再確認してください。
Pingとnslookupは、Windowsボックスで確実に利用できます。 pingを実行し、ホスト名とgoogle.comなどの正しく構成された接続を介してアクセスできることがほぼ保証されているものに対してnslookupを実行するように依頼します。彼らの反応の間のパターンを見つけてみてください。
http://www.intodns.com/ のようなオンラインツールでDNSを確認してください
大まかな順序で報告されたときに潜在的なサイトの問題をチェックするために私が行ういくつかのこと:
top
を使用してサーバーの基本的なステータスを確認できます。高負荷、高CPU使用率、高IO待機、および任意のVM使用率。「高」負荷はサーバー/アプリケーションによって異なりますが、通常は10を超えるものはおそらく高すぎ、2〜10はチェックできません。サーバーとトラフィックに慣れてくると、何が良いか悪いかがわかり始めます。top
、free -m
、またはvmstat
を使用して、VMの使用状況を確認します。重要なVM使用量は悪いことであり、何かが本来よりも多くのメモリを使用していることを示しています。df
でディスクの使用状況を確認します。場合によっては、ディスクまたはtmpパーティションがいっぱいになると奇妙な形で現れることがあります。ディスクエラー/障害は、smartctl
またはシステムログファイルで確認できます。server-status
ページを確認して、何が提供されているかを確認します。 netstat
を使用して接続の数/タイプを確認することもできますが、何を探すべきか、何が正常で何が正常でないかを知るにはある程度の経験が必要です。/var/log/messages
および/var/log
のその他のさまざまなログと、アプリケーション固有のログ(Apache、データベースなど)を確認し、関連するエラーメッセージを探します。「サイトがダウンしている」と誰かに言われると、レポートの内容と数によって、反応/パニックの速さが異なります。 「サイトがダウンしています」と言っているだけで無視するかもしれませんが、エラーコード/メッセージを含む詳細レポートを投稿すると、複数のレポートと同様に、より速く移動できます。
Pingとnslookup(およびtracert)は、デフォルトですべてのWindowsOSで使用できます。
問題は特定の顧客または地理的地域に限定されている可能性があるため、影響を受ける顧客にnslookupを(最初に)実行して、Webサイトがその場所から正しく解決されることを確認してから、tracertをIPアドレスに実行することをお勧めします。 Webサイトまたはネットワーク入力(ファイアウォール/ルーター)の。
問題を再現できない場合は、絶対にユーザーに問題のデバッグを依頼する必要があります。彼らは通常(時間があれば)助けてくれてとても幸せです。カスタマーサービスの帽子をかぶって彼らにアプローチします。
Www.downforeveryoneorjustme.comについて説明し、基本的なpingとtracerouteを案内します。 DNS、ルーティング、またはサーバーの問題かどうかを調べます。
これがないと、問題がまったく修正されているかどうかわからないまま、暗闇の中でランダムに刺されることになります。これは、あなたとあなたのユーザーにとって苛立たしいことです。弾丸をかみ、彼らと連絡を取ってください、あなたの質問は数分で答えられます。