web-dev-qa-db-ja.com

DRBDスタックリソース:障害からの回復

次のようなスタック4ノードDRBDセットアップを実行しています。

A  -->  B
|       |
v       v
C       D

これは、これら4つのサーバーで実行されている3つのDRBDリソースを意味します。サーバーAとBはVMを実行しているXenホストであり、サーバーCとDはバックアップ用です。 AはCと同じデータセンターにあります。

  1. プロトコルBを使用して、最初のデータセンターでサーバーAからサーバーCに
  2. サーバーBからサーバーDへ、2番目のデータセンターでプロトコルBを使用
  3. サーバーAからサーバーB、異なるデータセンター、プロトコルAを使用したスタックリソース

最初の質問:スタックされたリソースの起動

このセットアップで実行されている重要なデータはまだありません。最初に機能することを確認しています。これは、停電やネットワークの停止などをシミュレートし、回復する必要のある手順を確認することを意味します。

サーバーAの電源を切ると、両方のリソースがダウンします。次回の起動時にそれらを元に戻そうとします。ただし、下位レベルのリソースA-> Cの起動にのみ成功します。スタックされたリソースA-> Bは、接続を試みません。おそらく、下位レベルで接続されたプライマリになるまでデバイスを見つけることができないためです。

したがって、問題が発生した場合は、手動でログインしてそのリソースを起動し、その上で仮想マシンを起動する必要があります。

2番目の質問:スタックリソースのプライマリの設定

下位レベルのリソースは、適切なリソースがプライマリと見なされるように構成されています。

resource test-AC {
    on A { ... }

    on C { ... }

    startup {
        become-primary-on   A;
    }
}

しかし、以下は有効な構成ではないため、スタックされたリソースで同じことを行う方法がわかりません。

resource test-AB {
    stacked-on-top-of test-AC { ... }

    stacked-on-top-of test-BD { ... }

    startup {
        become-primary-on   test-AC;
    }
}

これも、障害からの回復には手動による介入が必要であることを意味します。スタックリソースの自動プライマリを設定する方法はありませんか?

2
Marcus Downing

ここでも他の場所でも答えがないので、スタックされたリソースのDRBDランスクリプトのコピーを作成することで最初の質問を回避しました。オリジナルと同じですが、すべてのdrbdadmコマンドがスタック用にdrbdadm -Sに変換されています。私はそれをdrbd-stackedと呼び、オリジナルの後に実行するように設定しました。

2番目の問題を回避するために、runscriptのプライマリセクションに追加して、ファイル/etc/drbd.d/primaryからリソースのリストを読み取り、それぞれでdrbdadm -S primaryを呼び出すようにしました。

成功している間、私はこれらの両方が適切な解決策ではなく回避策であると考えています。もっと良い答えが欲しいです。ランスクリプト/etc/init.d/drbd-stackedは次のとおりです。

#!/sbin/runscript
# Copyright 1999-2007 Gentoo Foundation
# Distributed under the terms of the GNU General Public License, v2 or later
# $Header: /var/cvsroot/gentoo-x86/sys-cluster/drbd/files/drbd-8.0.rc,v 1.6 2010/08/02 04:42:36 xarthisius Exp $

opts="${opts} reload"

depend() {
        use logger
        need net drbd
        before heartbeat xendomains
        after sshd drbd
}

DEFAULTFILE="/etc/conf.d/drbd"
PRIMARYFILE="/etc/drbd.d/primary"
DRBDADM="/sbin/drbdadm"
PROC_DRBD="/proc/drbd"
MODPROBE="/sbin/modprobe"
RMMOD="/sbin/rmmod"
UDEV_TIMEOUT=10
ADD_MOD_PARAM=""

if [ -f $DEFAULTFILE ]; then
  . $DEFAULTFILE
fi

# Just in case drbdadm want to display any errors in the configuration
# file, or we need to ask the user about registering this installation
# at http://usage.drbd.org, we call drbdadm here without any IO
# redirection.
$DRBDADM sh-nop

function assure_module_is_loaded() {
        [ -e "$PROC_DRBD" ] && return
        ebegin "Loading drbd module"
        ret=0

        $MODPROBE -s drbd `$DRBDADM sh-mod-parms` $ADD_MOD_PARAM || ret=20
        eend $ret
        return $ret
}

function adjust_with_progress() {
        IFS_O=$IFS
        NEWLINE='
'
        IFS=$NEWLINE
        local D=0
        local S=0
        local N=0

        einfon "Setting drbd parameters "
        COMMANDS=`$DRBDADM -d -S adjust all` || { 
                eend 20 "Error executing drbdadm"
                return 20 
        }
        echo -n "[ "

        for CMD in $COMMANDS; do
                if echo $CMD | grep -q disk; then echo -n "d$D "; D=$(( D+1 ));
                Elif echo $CMD | grep -q syncer; then echo -n "s$S "; S=$(( S+1 ));
                Elif echo $CMD | grep -q net; then echo -n "n$N "; N=$(( N+1 ));
                else echo echo -n ".. ";
                fi
                IFS=$IFS_O
                $CMD || {
                        echo 
                        eend 20 "cmd $CMD failed!"
                        return 20
                }
                IFS=$NEWLINE
        done
        echo "]"
        eend 0

        IFS=$IFS_O
}

function primary_from_config_file() {
        while read line; do
                if [[ $line != \#* ]]; then
                        drbdadm -S primary $line
                fi
        done < $PRIMARYFILE
}

start() {
        einfo "Starting DRBD stacked resources:"
        eindent
        assure_module_is_loaded || return $?
        adjust_with_progress || return $?

        # make sure udev has time to create the device files
        ebegin "Waiting for udev device creation ..."
        for RESOURCE in `$DRBDADM sh-resources`; do
                for DEVICE in `$DRBDADM sh-dev $RESOURCE`; do
                        UDEV_TIMEOUT_LOCAL=$UDEV_TIMEOUT
                        while [ ! -e $DEVICE ] && [ $UDEV_TIMEOUT_LOCAL -gt 0 ] ; do
                                sleep 1
                                UDEV_TIMEOUT_LOCAL=$(( $UDEV_TIMEOUT_LOCAL-1 ))
                        done
                done
        done
        eend 0

        einfon "Waiting for connection "
        $DRBDADM -S wait-con-int
        ret=$?
        echo

        sleep 5

        einfon "Become primary if configured "
        $DRBDADM -S sh-b-pri all
        primary_from_config_file
        echo

        eend $ret
        return $ret
}

stop() {
        ebegin "Stopping all DRBD stacked resources"

        # Check for mounted drbd devices
        if ! grep -q '^/dev/drbd' /proc/mounts &>/dev/null; then
                if [ -e ${PROC_DRBD} ]; then
                        ${DRBDADM} -S down all
                        sleep 3
                #       if grep -q '^drbd' /proc/modules ; then
                #               ${RMMOD} drbd
                #       fi
                fi
                ret=$?
                eend $ret
                return $ret
        else
                einfo "drbd devices mounted, please umount them before trying to stop drbd!"
                eend 1
                return 1
        fi
}

status() {
        # NEEDS to be heartbeat friendly...
        # so: put some "OK" in the output.

        if [ -e $PROC_DRBD ]; then
                ret=0
                ebegin "drbd driver loaded OK; device status:"
                eend $ret
                cat $PROC_DRBD
        else
                ebegin "drbd not loaded"
                ret=3
                eend $ret
        fi
        return $ret
}

reload() {
        ebegin "Reloading DRBD stacked resources"
        ${DRBDADM} -S adjust all
        ret=$?
        eend $ret
        return $ret
}

そして、これが設定ファイル/etc/drbd.d/primaryです:

# A list of DRBD resources that should be made primary on boot.
# Each line is the name of one resource. Be cafeful of the difference
# between low-level and stacked resources; this file should typically
# contain the stacked resource.
# You should include a resource if this server is running its virtual machine

my-resource-name
1
Marcus Downing

@Downing:あなたの答えは、クラスタリングを使用したくない場合に私があなたに与えるものです。

ただし、セットアップをクラスター(ハートビートなど)と組み合わせることをお勧めします。その設定では、どちらの側をプライマリにするか(通常はプライマリクラスタノード)をクラスタに決定させる必要があります。

これにより、スタックリソースの起動の問題が残ります。これらを使用したことはありませんが、drbd.confのgroupステートメントもデバイスの起動をシリアル化する可​​能性があります。しかし、おそらく、スタックされたdrbd-resourcesをファイルの最後に置くだけで十分です(そして、クラスターが元のプライマリーを開始した後、クラスター手段でそれらをプライマリーにします)。

そしてもう1つ:Bの代わりにプロトコルCを使用します。Cの方が速いはずです。

1
Nils