私は異なるwebappsを持つ約20台のサーバーを持っています。 4時間ごとにrsnapshot
タスクを実行し、それらすべてをバックアップサーバーにバックアップします。
偶然にも今日、ファイルシステムの入出力障害が原因でバックアップが過去4日間失敗したことを発見しました。 fsck
は問題を修正しましたが、4日間のバックアップが失われました。
バックアップに問題がないかどうかを確認する方法はありますか?
現在、私はmunin
監視システムを使用していますが、ソフトウェアチェックなしでサーバーの状態(メモリ、CPU、HDDなど)のみをチェックします。 rsnapshotログのFATAL ERROR
sエントリをチェックするスクリプトを統合できますが、それで十分かどうかわかりません。
バックアップから環境をブートストラップしてその整合性をチェックするシステムがあるかもしれません。残念ながら、私はそれについて十分な情報を見つけられませんでした。
ファイルシステムの空き領域も監視していることを確認し、システムログで重大/重大なメッセージを監視します。SMARTディスク、ネットワーク、およびバックアップサービス(ssh/rsync)の出力。
バックアップの検証に関しては、Webアプリケーション環境を並行してセットアップし、バックアップを定期的に回復することをお勧めします。バックアップはリカバリと同じくらい優れています。