CentOSでHDDエラーと障害の初期兆候をチェックする最良の方法は何ですか?
Smartmon( http://sourceforge.net/apps/trac/smartmontools/wiki )をマシンにインストールすることをお勧めします。これは、ディスクの状態をチェックできるソフトウェアです。/var/log/messagesまたは/ var/log/syslog(scsiエラーについての言及がある場合)
dmesg
カーネルはI/Oデバイスに関する診断メッセージをログに記録するため、dmesgコマンドを使用してこれらのメッセージをチェックアウトできます。
デバイスでfsckを実行して、エラーを確認できます。
Paulが言うように、SMARTログはチェックするのに適した場所です。
BadBlocks を実行することもお勧めします。 RAIDカードを持っている場合は、その監視を使用する必要があるかもしれません。
SMARTモニタリングは良い方法です。ルートとして、smartctl -a /dev/hda
、ここでhdaは必要なドライブです... hdb、sdaなどです。ルートのメールを取得する必要がある人として、/ etc/aliasesにメールアドレスを設定することもお勧めします。
それは非常にあいまいな答えです。大手メーカー(Dell、HPなど)製のサーバーを使用している場合、より優れた監視機能が利用できる可能性があります。
パーティション/ dev/sda1(例えば)のフルチェックを試すことができます
fsck -f /dev/sda1
または、指定されたパーティションの完全な書き込み読み取り非破壊的テストを試します
badblocks -vn /dev/sda1