だから私は最近2回ロックアップしたサーバーを持っています。
私がやりたいのは、シリアルコンソールに書き込まれたカーネルパニック/おっとをキャッチすることです。 sshでVSPを起動でき、スクリプトを使用してbashでSSHセッションを実行しているため、コンソールに書き込まれたものはすべてスクリプトでログに記録する必要があります。
問題はiLOのタイムアウトであり、SSHセッションを閉じます。
Webインターフェイスをざっと見ると、iLOアイドルタイムアウトがあることがわかりますが、これは最大120分に設定することしかできず、無効にすることはできません。
SSHセッションを閉じるiLOを無効にして、仮想シリアルポートを介して出力されたものをしばらくの間効果的にログに記録し、これらの一見ランダムなロックアップでパニック/おっとが発生したものをキャッチできるようにする方法はありますか?.
システムのIMLログに何かが表示されていますか?ハードウェア用に管理エージェントをインストールしていますか?
どの特定のOSとProLiantサーバーのモデルを使用していますか?エージェントがインストールされている場合は、ロックアップに関連する情報を取得するか、ASRウォッチドッグタイマーを作動させる可能性があります。
VSPの場合。コンソールに出力するために カーネルコマンドラインとGrub に必要な変更を加えましたか?
ILOの場合、モデルとファームウェアのリビジョンが違いを生みます。現在のILO2およびILO3ファームウェアでは、Access Options
でInfiniteアイドルタイムアウトが許可されています。
PuTTYを使用できれば、タイムアウトの発生を防ぐことができるかもしれません...
IloのSSH実装がそれをサポートしているかどうかはわかりませんが、opensshクライアントを使用してServerAliveInterval
を設定すると役立つ場合があります。デフォルトは0です。NATテーブルタイマーのタイムアウトを防ぐために、ssh接続をアクティブに保つために使用します。 ~/.ssh/config
プット:
ServerAliveInterval 60