web-dev-qa-db-ja.com

ZFSレポート(ZoLを介したFreeBSDおよびLinux上)

長年のmdadmユーザーがディスクエラーを経験していて、ディスクエラーに関するmdadmの自動メールレポートを構成したことを思い出しました。

したがって、メールアドレスを/ etc/mdadm/mdadm.conf内に挿入する必要がありました。

MAILADDR [email protected]

しかし、私はFreeBSDでそれを本当に見逃しました。そして、私のZFS RAID6が半年以上実行されているので、ディスクに障害が発生した場合はどうなるかを考えました。

外部メールアドレスを設定したことはありません。これを達成およびテストする簡単な方法はありますか?

Mdadmのように:

Sudo mdadm –monitor –scan –test

そして、LinuxでZoL(Linux上のZFS)を使用してそれをどのように行うのですか?

編集:申し訳ありませんが、自動レポートを意味しました。予定されていません。

スクリプトを作成して、zpool status-Xを毎分解析することができたはずです。しかし、これは報告の問題を達成するための非常に洗練されたアプローチではないと思います。ディスク障害(mdadmなど)が発生するとすぐに通知される方がよいでしょう。

EDIT [2]:アドバイスをありがとうございますが、スクリプトの問題に悩まされることはありません。誰かが/ binのforループの問題を手伝ってくれませんか。/sh here-> ペーストビン

EDIT [3]:forループの問題が発生しました。 :)( ペーストビン で更新)

スクリプトに関するアドバイスはありますか?

5
Daywalker

zpool status -x出力をチェックする通常のスクリプト(cron)を実行します。長期的には、Linux上のZFSプロジェクトは これに向けて取り組んでいます イベントデーモンの形式です。 Solarisから派生したシステムは、障害管理アーキテクチャにアクセスできました。

自動化されたレポートに関しては、 NexentaStor のような商用ソリューションでさえスケジュールされたチェックを使用します。それは何も悪いことではありません。

enter image description here


このようなもの:

[root@mdmarra ~]# zpool status -x
all pools are healthy

対次のようなひどいもの:

[root@mdmarra ~]# zpool status -x
  pool: vol1
 state: UNAVAIL
status: One or more devices are faulted in response to IO failures.
action: Make sure the affected devices are connected, then run 'zpool clear'.
   see: http://www.Sun.com/msg/ZFS-8000-JQ
 scan: scrub repaired 0 in 1h15m with 0 errors on Sun Jul 28 21:15:10 2013
config:

        NAME          STATE     READ WRITE CKSUM
        vol1          UNAVAIL      0     0     0  insufficient replicas
          mirror-0    DEGRADED     0     0     0
            c1t0d0    UNAVAIL      0     0     0  cannot open
            c2t0d0    ONLINE       0     0     0
          mirror-1    DEGRADED     0     0     0
            c1t1d0    UNAVAIL      0     0     0  cannot open
            c2t1d0    ONLINE       0     0     0
          mirror-2    DEGRADED     0     0     0
            spare-0   UNAVAIL      0     0     0  insufficient replicas
              c1t2d0  UNAVAIL      0     0     0  cannot open
              c2t8d0  UNAVAIL      0     0     0  cannot open
            c2t2d0    ONLINE       0     0     0
          mirror-3    DEGRADED     0     0     0
            c1t3d0    UNAVAIL      0     0     0  cannot open
            c2t3d0    ONLINE       0     0     0
          mirror-4    DEGRADED     0     0     0
            c1t4d0    UNAVAIL      0     0     0  cannot open
            c2t4d0    ONLINE       0     0     0
          mirror-5    UNAVAIL      0     0     0  insufficient replicas
            c1t5d0    UNAVAIL      0     0     0  cannot open
            c2t5d0    FAULTED      0     0     0  too many errors
        cache
          c3t5d0      ONLINE       0     0     0
        spares
          c2t8d0      UNAVAIL   cannot open

errors: No known data errors
3
ewwhite

zfswatcher を試してください、それは私にとって本当にうまくいきます。

3
ptman