web-dev-qa-db-ja.com

生産システムがダウンしたとき、どのように冷静さを保ちますか?

これはほとんどの人に起こっています...

あなたはいつか仕事にきます。すべてが正常に見えます。太陽は輝いており、鳥はさえずっていますが、作業中に、マトリックス内のデジャヴ猫を思い出させるいくつかの奇妙なことがわかります。

オフィスに入ると、たくさんの電話が鳴っていますが、彼らが新しい販売促進を行っているだけかもしれません。暗い雲があなたの上に浮かんでいるのに気づくと、落ち着きます。

少し時間がかかりますが、クラウドがあなたのボスであることがわかります。通常、彼は「Soooo Peeeeter、それらのTCP/IPレポートはどうですか?」で毎朝チェックします。ルーチン、しかし今日彼は一般的なマナーについてのすべてを忘れて、失礼にあなたの個人的なスペースに侵入しました。 「おはよう」ではなく、よだれ、うなり声、のろいだけ。彼は、サイバー歯の虎から離れようとしているネアンデルタール人を少し思い出させます。あなたは彼が昨日から作成した新しい言語を解読しようとし、何か悪いことが一晩で起こったことを理解し始めます-生産システムがダウンしました。

現在、お客様のシステムは通常9時から5時までの通常の勤務時間中にクライアントによって使用されますが、何らかの理由でブザーでアラートを受信しませんでした(30歳未満の場合、ブザーは鳴るだけの携帯電話のようなもので、ビープした人を教えてください)。次回は必ず充電する必要があります。

したがって、現在は午前8時45分であり、システムは午前9時に起動している必要があります。上司は10秒ごとに、別の顧客がシステムへのアクセスに問題があることを伝える別の呪いを発します。また、いくつかのアカウントマネージャーが上司にカーソルを合わせて、クライアントが実際にどのように苦しんでいるかを彼に理解させようとしています。

誰もができるだけ早くシステムを立ち上げることをあなたに依存していると同時に、常にあなたの注意をそらすことによってあなたの進歩を妨げています。

このような状況で、どうやって冷静さを保つのですか?

26
Mag20

この状況では、他のすべての人々をあなたから遠ざけることによって上司に助けを求めてください(これにより、彼はどこか他の場所で何かをすることができます)。

起動して再度実行したら、上司に会議を依頼して、この問題が再発しないようにするための手順を評価して確立します。

43
user1249

最初にすべきことは、気を散らすものをできるだけ丁寧に取り除くことです。それがあなたの顧客にとってどれほど悪いかについて、あなたの耳の中で悪口を言う誰かと一緒に働くことはできません。もちろん、上司がマニアである場合は、言うより簡単ですが、その場合は、とにかく別の仕事を探すことを検討してください。

次に、エラーが引き起こしている実際の損失と、(もしあれば)どのようにしてそれを迅速に軽減できるかをすばやく評価します。少し練習すれば、ログファイルを簡単にチェックすることもできます。これは、アクションの計画を立てるために必要です。

問題が複雑な場合は、最も深刻な部分に集中してください。行動に移す前に、2、3ステップ先を考えてください。また、行動する前に、計画を取り消す方法を知っていることを確認してください。

そして最も重要なこと:パニックに陥らないでください!

9
biziclop

このような状況は、産業用制御システムでは一般的です。真夜中に生産ラインがダウンし、会社は通常数百ドル、または数千ドルも失う1分あたりであり、彼らは問題を修正するためにあなたを見ています。このように処理します。

  1. あなたが知っていることを彼らに説明してください
  2. わからないことを説明する(ただし、問題を解決するために知る必要がある)
  3. あなたが知らないことをどのようにして見つけるのかを説明してください
  4. 所要時間の見積もりを提供します(範囲を使用)
  5. 計画の実行に集中する間、周りのすべてを無視する
7
Scott Whitlock

最初に、災害復旧を繰り返し(人が肩越しに立たずに)練習することで、SOに関する質問に頼らずに問題を診断および修正するために実行する必要がある手順を正確に把握できます。回復スキルに自信が持てば、プレッシャーとストレスははるかに低くなります。

次はあなたが働いている間あなたの髪から人々を取り除くことです。あなたの上司は彼が上司に行くことができる何かを望んでいます。何をするつもりか、どのくらいの時間がかかるかについての情報を伝え、定期的に進捗レポートを送ってください。特に、あなたが伝えたよりもかなり時間がかかることを意味するものを見つけたら。はい、進行状況レポートの修正には時間がかかりますが、ホバリングボスとユーザーはさらに時間がかかります。私、毎回進捗報告に行きます。彼らがあなたが彼らを最新の状態に保つと確信したら、彼らはあなたがあなたの仕事をもっとしてあなたを一人にしておくことをあなたに信頼するでしょう。

ユーザーがしばらくブロックされる場合は、これがオプションであるかどうかをメールで送信するか、サイトがメンテナンスのためダウンしていること、およびユーザーがいつ再試行できるかを通知して、Webサイトに通知します。 (これは、上司にあなたの髪の毛から遠ざけるためにやるべきことを見つけるためにあなたに与えることができる1つのタスクです。)誰かが誰かが問題に取り組んでいることを知っているときにログインできないことに不機嫌です。問題が修正されたときにメールを送信した場合は、同じグループにメールを送信して修正されたことを伝えます。人々がこれを忘れたことを何度も目にしたことはわかりませんが、ユーザーはまだログインできないときにログインできないと思っています。目標は、物事を改善することだけではなく、システムを再び利用できるようにすることです。

深く呼吸し(深呼吸は落ち着きます)、問題に突入します。緊急時に脳のシナプスが情報を正常な速度で取得できないことがあるので、必要なことをどこかに書き留めておくことは良いことです。あなたは馬鹿なつぶやきのようになりたくない:「私たちはログがどこにあるのか知っている?」

あなたが生産システムをサポートする仕事にいるなら、一般的に緊急時によく反応するような人であることが最善です。あなたがこれを本当に学ぶことができるかどうかはわかりません。あなたの前で馬に乗っている人が脱落し(私の人生から取られたそれほどランダムではない例)、地面に出血して横たわっていた場合、あなたは彼の口を開いたまま立っている人ですか、それともその人ですか?誰が救急車を呼んで出血に包帯を巻いて誰かに馬を捕まえるように指示しますか?もしあなたが最初のタイプの人なら、おそらくこれはあなたにとって正しい仕事ではありません。

6
HLGEM

これがバックアップサーバーを必要とする正当な理由であることを伝えてください。つまり、最初のサーバーがダウンした場合にすぐに切り替えることができる、プライマリサーバーと同じように実行される2番目のサーバーを意味します。

2
CashCow

あなたが作成した問題に対してあなたが怒っている人に四方から囲まれている場合は十分に悪いですが、あなたが作成していない問題の場合は2倍悪いです。クライアントがそれをひどく設定したのは、私が2回以上発生したことです。つまり、障害はクライアントとの通信にあります(障害がリッスンしていないクライアントであるか、マーケティング担当者が説明が不十分であるかはわかりません)。

彼らが失敗したことをどうやって説明しますか?特に上司が首をかしげているときは、顧客が常に正しいと思い込むよりも上手ではないので、決して簡単な作業ではありません。

では、このような状況でどうやって冷静さを保つのですか?上司に丁寧に、早く仕事に就くほど、この問題は早く修正されることを思い出させます。

2
Neil

このイベントを、本番システムをできるだけ早く稼働させることで(ビジネスにとって)私が(ビジネスにとって)どれだけ価値があるかを示す機会と見なします(午前9時前ではない場合;-))。

明らかに、私が最初にそれを壊さなかったことを願っています;-)

1
user18041
  • sh_tが発生する
  • 問題の解決策があるはずです
  • 世界の誰かが解決策を知っていれば、私もその一人になることができます
  • 解決策がない場合、パニックは役に立ちません
  • 再び、sh_tが発生します
1
ohho

そのような状況は、すべての完全なドキュメントと、あらゆる種類の状況に対処するための完全な計画を持つように私を動機づけます。

考えられるすべての問題を予測できるわけではありませんが、準備を整え、組織化し、文書化することで、私たちの背後に立ち向かうことができます。

0
crosenblum

私は、B52G爆撃機の保守に8年間を費やし、第3次世界大戦の5分間の警報を出しました。それは私にとってすべてに視点を置きます。

ダウンプロダクションシステムは重要ですが、数百万または数十億の人々を殺すことにはなりません。

何が悪いのかを見つけ、原因を見つけて修正します。重要な人々との明確なコミュニケーションを確立し、情報を提供し続けます。上司にあなたが何をしているのかを伝え、いつ更新できるようになると、Steamが「まだ修正されていますか」というメッセージや会話が続くのを防ぐことができます。

事後分析を行い、そのような事件の影響を将来的に防止および制限する方法を理解します。

通話中の場合、携帯電話またはブザーのバッテリー切れは非常に専門的ではありません。これは一般的なシナリオですが、これが私のために働いている人に起こった場合、深刻な議論があり、それが繰り返された場合、彼らはもはや私のために働いていません。はい私は堅物です。

0
Jim C

問題を解決したら上司に連絡するようにしてください。ただし、この種の状況では、経営陣は通常、他の人にできるだけ早く解決してもらい、その後、「懸念のある」人物と一緒に解決させます...これは、業界に関係なく、どの企業でも標準です。ビジネスに関しては、顧客は通常王様です!!

0
Gaurav Sehgal