web-dev-qa-db-ja.com

「災害」に対処するための戦略を盛り込んだ文書を作成する

起こりうる災害シナリオに対処するための文書を作成するためのガイドラインを知っている人はいますか?災害とは、仕事、時間、または最終的にはクライアントの損失につながる可能性のあるすべてのものを意味します。

これらの行に沿って記事を読んだことを覚えているようですが、残念ながら、私はもうそれを見つけることができません。ですから、この方向でのフィードバックをいただければ幸いです。

このようなアプローチは、予防的な考え方で回避できたかもしれない恐怖が時折あったので、私が今いる会社では役立つと思います。

3
James P.

ディザスタリカバリ計画を正しい方法で実行したい場合は、想像以上に注意が必要です。

工数とリソースコストの両方で、その計画の作成に予算をかけます。計画の作成に8人時間、または500人時間を費やす予定です。 「500人時間!、まさか!」と言うかもしれません。 10人の従業員を起用して、会議で災害について話し合うと、工数が速くなります。あなたが中規模または大企業の場合、マネージャーがあなたが要求した計画のためにあなたのために情報を準備するのに時間がかかるとき、それは時間予算からも食べます。災害復旧計画を作成するためだけに。

災害のためにやるべきことがいくつかあります。クライアントを満足させるために必要なすべての資産の在庫とコストの交換を行います。保証、保証、サポート契約、ライセンスのあるアイテムについては、すべての製造業者、販売業者、ベンダーの連絡先情報、およびそれらのアカウントの現在のステータスがあることを確認してください。サーバーが溺死した場合、その10,000ドルの10年前のサーバーを1日で交換できると思いますか?ベンダーは、すぐに交換品が欲しいと聞いて喜んでいますか(またはアカウントが未処理です)。あなたは言うかもしれません、ああ、私は既製の新しいマシンでやります!ああ?古いソフトウェアはそのマシンで動作しますか。ハードウェアキーを必要とするカスタムソフトウェアアプリは、新しいマシンでカスタムアプリを実行できるようにしますか?

通常、トランシーバーを担当者とそのバックアップ担当者に割り当てて、避難計画を立てます。

特定の会社タイプでは、適切な災害復旧のために、緊急資金調達について銀行と話し合ったことを確認してください。

医療プランのサポートを確認してください。つまり、スタッフの50%は、カビや危険な煙など、建物の問題によって引き起こされた病気から抜け出しています。スタッフの11%が、DUCK POO(厄介なウイルスに感染していた)で非常に病気になったことがありました。

スタッフ用のバックアップサイトを用意し、スタッフがバックアップサイトに行くように旅費を計算して予算を立てます。ある会社がバックアップサイトをメインサイトの南1時間強に計画したことがあります。従業員のこれらのマイレージコスト(および一部のスタッフの移動時間(時給)コスト)は、1週間で合計される可能性があります。組合の人々は、オフサイトに移動する時間の契約を結んでいる可能性があります。オフサイトに移動できない人のために計画を立て、メインサイトがバックアップされるまでそれらを交換するための一時的なコストを考慮します。あなたは「誰がそれをするだろうか」と尋ねるかもしれません。妊娠中の従業員は、医師や病院の近くにいる必要があるかもしれません。

奇妙な災害復旧の1つは、合法的なものです。理事会が違法なもので起訴された場合のように(違法にインストールされたオペレーティングシステムを搭載したコンピューターがたくさんあるなど)。一部の会社の従業員が何らかの理由で利用できない場合、特定の機関(必要に応じて署名として読み取る)にアクセスできなくなる可能性があります。

「それを望んでいる人」に災害復旧計画を販売する方法は次のとおりです。

何よりもまず;避難手順、コールチェーン/ツリー(つまり、誰が誰に電話をかけ、誰が誰に何を伝える権限を与えられているか)、人々の健康問題など、スタッフとクライアントの健康保護(災害から)

第二に、金融および現金資産の保護(つまり、著作権、特許、契約(情報)、クライアントアカウントの残高、金融業者との信用枠へのアクセスなどの情報)がなければ、キャッシュフローの不足から災害からの回復が実際に妨げられます。

特定の「情報」資産は、財務カテゴリと資産カテゴリに分類されます。

建物、電子機器、これらすべてのファイリングキャビネットのような紙の資産の資産回収に関する詳細。 (多くの企業が災害復旧計画を開始するときにペーパーレス化することを決定しているに違いありません)

もっとあります。しかし、この投稿は十分に長いです。

4
DevPlayer

私が最もよく知っている方法は 故障モードと影響分析 です。それはどんなシステムにも一般化することができます。

それのポイントは、失敗する可能性のあるすべての特定の部分、それらがどのように失敗する可能性があるか、そしてそれぞれの場合に結果がどうなるかを列挙することです。次に、可能性、重大度、コストなどに基づいて各項目を分類します。次に、緩和戦略を作成します。

2
Scott Whitlock

データセンターの新しい建物に引っ越したときに行ったことの1つは、ディザスタリカバリ計画を立てることでした。それは、全員を集めて「何が問題になるか」という単純なものでした。各イベント。

「ラリーが出勤する車にぶつかった場合」、「ローカルコールアウトのプライマリDBサーバーとスレーブDBサーバーが同時に停止した場合」など。

あるいは、「Qwestの男が入って来て、呼び出しサイクルの途中で乱雑に見えると思ったために9つのパンチダウンブロックを再配線した場合はどうなるでしょうか?」 (それは今までに起こったことではありません...)

1
JohnP

あなたが探しているのは リスク管理 に関する資料です。リスク管理の一般的な考え方は、最初にリスクを特定し、プロジェクトのどの側面が具体化した場合に影響を受けるかを判断し、リスクが具体化する可能性とプロジェクトのさまざまな側面にどのような影響を与えるかを評価し、リスクが顕在化し始めた時期と、リスクに対抗するために取るべき行動を検出します。

リスクに対処する方法は、一般的に リスク管理計画 に含まれています。 リスクマトリックス および リスクレジスタ リスク管理に関連する情報を取得します。

リスクの管理は、一般的にプロジェクト管理のトピックと見なされます。うまくいけば、それらの特定のウィキペディアの記事へのリンクが、高レベルの概要と追加のリソースへのいくつかのリンクを提供するのに役立つかもしれません。 Project Management Stack Exchange 、特に risk management および risk とタグ付けされた質問にも興味があるかもしれません。

1
Thomas Owens