web-dev-qa-db-ja.com

カーネルパニックをキャッチするためにHPiLOVSPのタイムアウトを設定する

だから私は最近2回ロックアップしたサーバーを持っています。

私がやりたいのは、シリアルコンソールに書き込まれたカーネルパニック/おっとをキャッチすることです。 sshでVSPを起動でき、スクリプトを使用してbashでSSHセッションを実行しているため、コンソールに書き込まれたものはすべてスクリプトでログに記録する必要があります。

問題はiLOのタイムアウトであり、SSHセッションを閉じます。

Webインターフェイスをざっと見ると、iLOアイドルタイムアウトがあることがわかりますが、これは最大120分に設定することしかできず、無効にすることはできません。

SSHセッションを閉じるiLOを無効にして、仮想シリアルポートを介して出力されたものをしばらくの間効果的にログに記録し、これらの一見ランダムなロックアップでパニック/おっとが発生したものをキャッチできるようにする方法はありますか?.

3

システムのIMLログに何かが表示されていますか?ハードウェア用に管理エージェントをインストールしていますか?

どの特定のOSとProLiantサーバーのモデルを使用していますか?エージェントがインストールされている場合は、ロックアップに関連する情報を取得するか、ASRウォッチドッグタイマーを作動させる可能性があります。

VSPの場合。コンソールに出力するために カーネルコマンドラインとGrub に必要な変更を加えましたか?

ILOの場合、モデルとファームウェアのリビジョンが違いを生みます。現在のILO2およびILO3ファームウェアでは、Access OptionsInfiniteアイドルタイムアウトが許可されています。

enter image description here

3
ewwhite

PuTTYを使用できれば、タイムアウトの発生を防ぐことができるかもしれません...

PuTTY Configuration

2
jftuga

IloのSSH実装がそれをサポートしているかどうかはわかりませんが、opensshクライアントを使用してServerAliveIntervalを設定すると役立つ場合があります。デフォルトは0です。NATテーブルタイマーのタイムアウトを防ぐために、ssh接続をアクティブに保つために使用します。 ~/.ssh/configプット:

ServerAliveInterval 60
1
Mark Wagner