NFSexportfsスパムログ。これは壊れた設定ですか？

Question

Ubuntu 10.04を実行し、OCFS2ファイルシステムにサービスを提供するNFSサーバーがあります。サーバーにはHeartbeatとPacemakerがインストールされており、別のサーバーとクラスターを作成するため、セットアップはやや複雑です。

とにかく、奇妙なこと：

# tail -12 /var/log/messages Jul 17 17:15:45 ctserv01 exportfs[14870]: INFO: Directory /export/homes is exported to 172.16.54.0/24 (started). Jul 17 17:15:45 ctserv01 exportfs[14869]: INFO: Directory /export/proyectos is exported to 172.16.54.0/24 (started). Jul 17 17:15:45 ctserv01 exportfs[14871]: INFO: Directory /export is exported to 172.16.54.0/24 (started). Jul 17 17:16:15 ctserv01 exportfs[15960]: INFO: Directory /export/proyectos is exported to 172.16.54.0/24 (started). Jul 17 17:16:15 ctserv01 exportfs[15961]: INFO: Directory /export is exported to 172.16.54.0/24 (started). Jul 17 17:16:15 ctserv01 exportfs[15962]: INFO: Directory /export/homes is exported to 172.16.54.0/24 (started). Jul 17 17:16:45 ctserv01 exportfs[17054]: INFO: Directory /export/proyectos is exported to 172.16.54.0/24 (started). Jul 17 17:16:45 ctserv01 exportfs[17055]: INFO: Directory /export/homes is exported to 172.16.54.0/24 (started). Jul 17 17:16:45 ctserv01 exportfs[17056]: INFO: Directory /export is exported to 172.16.54.0/24 (started). Jul 17 17:17:15 ctserv01 exportfs[18168]: INFO: Directory /export is exported to 172.16.54.0/24 (started). Jul 17 17:17:15 ctserv01 exportfs[18169]: INFO: Directory /export/proyectos is exported to 172.16.54.0/24 (started). Jul 17 17:17:15 ctserv01 exportfs[18170]: INFO: Directory /export/homes is exported to 172.16.54.0/24 (started).

ログには、exportfsが30秒ごとに再生成されていることが示されています。 NFSサーバーはほとんどの場合正常に動作しますが、数日後、13〜15分ごとに最大20秒間ハングし始め、人々はこれを怒鳴ります。

おそらくペースメーカー、またはハートビート、または他の何かがこれを引き起こしています。それとも、それは予想される動作であり、問題は他の場所にあるはずですか？

ペースメーカーの構成（/ export/proyectosが現在停止していることに注意してください）：

# crm configure show node $id="06334af6-e766-457c-8c30-457080276507" ctserv01 node $id="bf53e028-9f27-4ef3-bb45-4fcef981e441" ctserv02 primitive ClusterIP ocf:heartbeat:IPaddr2 \ params ip="172.16.54.56" cidr_netmask="24" nic="eth0" primitive exports_nfs_home ocf:heartbeat:exportfs \ params rmtab_backup="none" directory="/export/homes" clientspec="172.16.54.0/24" options="rw,async,no_subtree_check,insecure,root_squash" fsid="1" \ op monitor interval="30s" \ op start interval="0" timeout="240s" \ meta target-role="Started" primitive exports_nfs_proys ocf:heartbeat:exportfs \ params rmtab_backup="none" directory="/export/proyectos" clientspec="172.16.54.0/24" options="rw,async,no_subtree_check,insecure,root_squash" fsid="2" \ op monitor interval="30s" \ op start interval="0" timeout="240s" \ meta target-role="Stopped" primitive exports_nfs_root ocf:heartbeat:exportfs \ params rmtab_backup="none" directory="/export" clientspec="172.16.54.0/24" options="rw,async,no_subtree_check,insecure" fsid="0" \ op monitor interval="30s" \ op start interval="0" timeout="240s" group grupo_nfs ClusterIP exports_nfs_root exports_nfs_home exports_nfs_proys location nodo_preferido grupo_nfs 100: 06334af6-e766-457c-8c30-457080276507 order orden_de_recursos inf: ClusterIP exports_nfs_root exports_nfs_home exports_nfs_proys property $id="cib-bootstrap-options" \ dc-version="1.1.6-9971ebba4494012a93c03b40a2c58ec0eb60f50c" \ cluster-infrastructure="Heartbeat" \ stonith-enabled="false" \ no-quorum-policy="ignore" \ expected-quorum-votes="2" \ cluster-recheck-interval="60min"

daff · Accepted Answer

表示されるスパムログメッセージはocf:heartbeat:exportfsリソースエージェント。これらは30秒ごとに表示されます。これは、exportfsプリミティブ定義で指定した監視間隔に対応します。リソースエージェントは少し冗長すぎます、私見ですが、これは問題ではないはずです。ログがディスクをいっぱいにしないように、十分な頻度でログローテーションを行うようにしてください。または、リソースエージェントを編集して冗長性を減らします。

問題は、おそらくクラスター設定のどこか深いところにあります。投稿したPacemakerの構成は完了していますか？クラスターは、NFSサーバー自体、idmapd、バインドマウントなど、必要なすべてのリソースを管理していないようです。

NFS（Linuxの場合）は、HA環境で正しく実行するのが難しいことで有名です。 LinbitのHA NFSに関するこのテクニカルガイド、DRBDとLinuxHAスタックの多くを作成した人を読むことをお勧めします。無料登録が必要ですが、これは、機能し、安定したNFSHAクラスターをセットアップするための非常に優れた詳細なガイドです。このようないくつかのクラスターを本番環境で運用しています。