web-dev-qa-db-ja.com

Oracle VM 2.2ノードが明白な理由なしに再起動する

単純な4ノードのOracle VM環境。vmwareで実行されている管理サーバー、共有ストレージ用のnfsサーバー、および実際のハイパーバイザーを実行している2つのOracle VMサーバー)があります。 。

何らかの理由で、プールマスターサービスを実行しているノードが、明白な理由もなく突然再起動します。これはソフトウェアの問題であり、おそらく何らかのクラスターウォッチドッグであると確信しています。明確にするために、再起動するのはvmサーバー/ハイパーバイザーであり、ゲストマシンではありません。

誰かが同様の問題を見たことがありますか、または根本原因を探し始めるべき場所について何か提案がありますか?

/ var/log/ovs * /ログに疑わしいものは何も表示されません。

Oracleからのドキュメントには、少し不満があります。

2
Roy

/ etc/hostsのループバックアドレスにノードのホスト名がリストされているため、ノードが正しく通信していなかったことが判明しました。クラスタサービスは、共有ストレージを保護するためにサイレントに再起動を強制します。

1
Roy

VM Management)に付属している素敵なグラフがあるかどうかはわかりません。ある場合は、メモリ、CPU、ディスクが何であるかについてかなりの洞察が得られます。おそらく何らかの相関関係があるのではないでしょうか?そこから、topとpsを調べて、サーバーがバウンスしたときに正確に何が実行され、使用されているかを確認できます。

また、サーバーをデバッグモードに設定できますか?彼らはそれをサポートしていますか?

これが少なくともあなたが始めるのに役立つことを願っています。

1
lilott8

Ocfs2を使用していますか?その場合は、/ etc/sysconfig /o2cb.confのocfs2タイムアウトを増やします。

0
Ronald