web-dev-qa-db-ja.com

サーバーがインターネット接続を失った場合、どのシステムログが教えてくれますか?

私はサーバーを持っています:

CentOS Linux release 7.3.1611 (Core)
3.10.0-514.2.2.el7.x86_64 #1 SMP Tue Dec 6 23:06:41 UTC 2016 x86_64 x86_64 x86_64 GNU/Linux

ある時点でのネットワーク接続の切断(現在は戻っている)だと思います。/var/log/messagesで何も見つけることができませんでした-何を探すべきかわからないのでしょうか?

本質的に私は2つのことを探しています:NICに問題があった場合、サーバーがインターネット接続を失った場合。

2番目のものは明らかに理解するのが難しいです(たぶん不可能ですか?)。明らかに、外部監視ソリューションが必要ですが、教育の観点から、この謎を解決するために(ローカルでホスト上で)どこを調べますか?

2
user1028270

リングカーネルバッファ(dmesg)を確認します-ネットワーク接続イベントの情報が表示されます。

1
13dimitar

カーネルログ(dmesgで表示可能な最新、journalctl -kで古い、または/etc/rsyslog.confで構成されている場所)には、NICが失われた場合、メッセージが含まれる可能性があります。もちろん、ケーブルを抜くと、これらのメッセージがどのように表示されるかを簡単に見つけることができます。例:

Jan 13 11:16:33 Zia kernel: r8169 0000:07:01.0 lan: link down

インターネット接続の喪失はさらに難しく、通常、これを検出するために何かを設定します(外部監視、またはマシンからの外部マシンの監視)。また、実際にはバイナリ状態ではありません。部分的なインターネット接続を使用できます(一部のホストに到達できますが、すべてではありません)。ただし、手がかりを探すことはできます。

  • NTPからのメッセージ(たとえば、ピアの喪失について))、またはNTPピア統計(有効な場合)を確認します。
  • 失敗したネットワーク接続に関するジャーナル/ログのメッセージ(たとえば、fetchmailを定期的に実行している場合、POP3サーバーに接続できなかったと文句を言う)
  • VPN接続がダウンしています(インターネット接続がダウンすると、OpenVPNログが大量に取得されます)。
  • webサーバーなどの突然の0負荷。多くのサーバーは、受信したすべてのリクエストをサーバー固有のログに記録します。
  • 同様に、システム負荷(負荷平均、実行キューなど)をログに記録する場合は、0にすばやくドロップすることが手がかりになります。
  • ファイアウォールログにノイズがない(少なくとも、ブロックされたパケットをログに記録する場合)
  • ランダムワーム攻撃の突然の欠如(実行しているさまざまなサービスから失敗した認証メッセージをたくさん受け取ります。何時間も何も受け取らないことは、インターネット接続がなかった良い手がかりになります)
  • 監視している場合のトラフィックレベル(Cacti、MRTG、collectdなどを使用)。そうでない場合、あなたのISPはおそらくそうです—多分彼らは喜んで共有するでしょう?
  • このマシンと通信する他のマシンがある場合は、それらのマシンのログを確認してください。失敗メッセージがあるかもしれません
  • あなたが他の人々にサービスを提供するならば、彼らはログを持っているかもしれません。
  • あなたがサポートデスクを持っているなら、彼らはおそらく(彼らが受けたすべての電話から)知っています。

基本的に、あなたは探偵の仕事をしています:あなたは手がかりを探す必要があります。監視しないと、Interwebsがダウンしていますログメッセージは表示されません。

1
derobert