設定:2つの最新のCentOS 6.5サーバーと最新の更新。どちらもGluster 3.5.2の新規インストールがあります。
私がしたこと(サーバー2の観点から、shared1とshared2は論理ボリュームです):
wget -P /etc/yum.repos.d http://download.gluster.org/pub/gluster/glusterfs/LATEST/CentOS/glusterfs-epel.repo
yum -y install glusterfs glusterfs-Fuse glusterfs-server -y
/etc/init.d/glusterd start
chkconfig --level 345 glusterd on
echo "1.2.3.4 server1" >> /etc/hosts
echo "4.3.2.1 server2" >> /etc/hosts
gluster peer probe server1
gluster volume create shared replica 2 transport tcp server2:/shared2 server1:/shared1 force
gluster volume start shared
mount.glusterfs server2:/shared /mnt/shared
gluster peer status
これは完全に機能し、両方のサーバーの/ mnt/sharedに素敵な共有ファイルシステムがあります。コマンドセットは各サーバーでそれぞれ実行され、そのサーバーの観点に一致するように変更されました。
テスト:
Server1のリセットボタンを押すと、/ mnt/shared上のファイルの使用またはアクセスに約45秒の恐ろしい遅延が発生します
私はgoogle、glusterfs管理ガイド、およびserverfaultで解決策を探しましたが、誰もこの問題を抱えているようには見えません。
タイムアウトを下げる方法、または一時的にダウンしているピアを無視する方法に関するアドバイスはありますか?フェイルオーバー中の読み取り専用状態は、遅延がない限り問題ありません。または、私が間違ったこと、またはしなかったことを教えてください。
おかげで、
デフォルトは42秒なので、クライアントのpingタイムアウト設定に問題がある可能性があります。以下を実行して確認します。
gluster volume info shared
探しているパラメータは「network.ping-timeout」です。これを実行して変更できます
gluster volume set shared network.ping-timeout "new timeout value"
それが回復期間を短縮するかどうかを確認します。