web-dev-qa-db-ja.com

NFS共有ファイルシステムがロックアップしています

NFS共有ファイルシステムがロックされています。

関連性があると思われる質問があれば、遠慮なく質問してください。 :)

当時、「ディスクスリープ」状態のプロセスはたくさんあり、マシンの平均負荷は急上昇しています。マシンはSSHで応答しますが、電子メールシステム(exim + dovecot)と同様に、ほとんどのWebサイト(Apache + mod_php)がハングします。ファイルシステムへの書き込みアクセスを必要としないWebサイトは引き続き動作します。

負荷の平均は、ある種のタイムアウトに達するまで上昇し続けますが、少なくとも10〜15分間です。負荷の平均は800を超えていますが、マシンは共有ファイルシステムへの書き込みを必要としないアクションに応答します。

私はさまざまなオプションを調査してきましたが、それらはすべて赤ニシンであることが判明しました:nagios、proftpd、bind、cronタスク。

ファイルサーバーのシステムログに次のメッセージが表示されます。

 7月30日09:37:17fs0カーネル:[1810036.560046] statd:サーバーローカルホストが応答せず、タイムアウトしました
 7月30日09:37:17fs0カーネル:[1810036.560053] nsm_mon_unmon:rpcが失敗しました、 status = -5 
 7月30日09:37:17fs0カーネル:[1810036.560064]ロック:node2を監視できません
 7月30日09:38:22fs0カーネル:[1810101.384027] statd:サーバーローカルホストではありません応答、タイムアウト
 7月30日09:38:22fs0カーネル:[1810101.384033] nsm_mon_unmon:rpcが失敗、ステータス= -5 
 7月30日09:38:22fs0カーネル:[1810101.384044]ロック:node0 
を監視できません

関連するソフトウェア:

VMWare、Debian lenny(64ビット)、古代のRed Hat(32ビット)(バージョン7だと思います)、Debianetch(32ビット)

NFS、Apache2 + mod_php、exim、dovecot、bind、amanda、proftpd、nagios、cacti、drbd、heartbeat、keepalived、LVS、cron、ssmtp、NIS、svn、puppet、memcache、mysql、postgres

Joomla!、Magento、Typo3、Midgard、Symfony、カスタムphpアプリ

2
fredden

その場合は、nfsパーティションを再マウントしてみてください。同期の有無にかかわらずエクスポートされますか?

1