web-dev-qa-db-ja.com

SQL Server2008クラスターのフリーズ

SQL Server2008の単一ノードクラスターがハングするという奇妙な状況に遭遇しました。背景として、Windows2008とSQLServer2008を使用してWindowsServer 2003/SQL Server 20052ノードクラスターを再構築しています。タイムラインは次のとおりです。

  • Windows 2003/SQL 2005クラスターからパッシブノード(サーバーB)を削除しました。これで、アクティブノードは問題なく単一ノードクラスターとして機能します。
  • サーバーBのディスクをワイプし、Windows2008とSQLServer2008をシングルノードクラスターとしてインストールしました。 2つのクラスターがまだ通信することを望まないため、クラスターのプライベートネットワークの「ハートビート」アダプターを未構成のままにしました。クラスターが起動し、正常に機能します。
  • すべてのデータベースを新しいクラスターに移動しました。クラスターは引き続き正常に機能します。
  • 新しいクラスターの2番目のノードとして再構築する準備として、サーバーA(古いクラスター)をオフにしました。
  • サーバーB(新しいクラスター)上のSQL Serverインスタンスがロックアップサーバーに関する知識やサーバーとの相互作用がない場合でもA。
  • サーバーAを再起動しました。サーバーB(新しいクラスター)上のSQLServerインスタンスはすぐに再び機能し始めます。

私たちが試したこと:

  • 新しいクラスターの名前は、SQL Serverがハングしている場合でも、pingおよびNETBIOS要求に応答します。
  • 古いハートビートアダプタにIPアドレスが割り当てられておらず、DHCPからIPアドレスを取得していないことを確認しました。
  • ハートビートのネットワークカードを無効にしても同じ効果があります。
  • WindowsまたはSQLのログにはエラーは生成されませんでした。
  • エラーが最初に発生したとき、誰もが何が起こっているのか理解する前に、かなりの時間(10分以上)ハング状態のままでした。これにより、(1つが構成されていたとしても)他のノードを検索していた通常のクラスタータイムアウトがなくなるように見えます。

サーバーBは、完全にパッチが適用されたWindows 2008 SP2、およびSQL Server 2008 SP1 CU7(10.0.2775)を実行しています。

1
1
EmilF