したがって、私がシステム管理者として働いている組織は、時間を24時間年中無休に延長することを検討しています-長時間のショップで働いている、または働いたことがある人は、組織の規模、サポート時間、電話/に関する基本的な情報を提供できますか?インシデントボリュームなので、少し比較できますか?
私の同僚の多くは、私たちのサイズが比較的小さいため、長時間のカバレッジは不要だと考えているようです。 20以上の国際オフィスがありますが、技術支援を求めるという点ではほとんど静かです。これが私の雇用主に関するいくつかの統計です:
2000人の従業員
世界中に250台の本番サーバー
毎日最大20件のインシデント(sysadmin)
7-8システム/ネットワーク管理者
また、24時間のスケジュールを8人程度でカバーするのが難しいかどうかもわかりません(休暇と病欠を考慮して)。したがって、グループの人数を共有したい場合は、それも役立ちます。
これが機能するかどうかは、自動アラート、スタッフのいるオペレーションセンター、または人々がサポートを求めるのを待っているかどうかに大きく依存します。当店は24時間年中無休のショップですが、デスクトップサポートやクライアントサポートではなく、本番システムで働いています。ユーザーから直接電話を受けることはないので、とても助かります。また、自社開発のアプリもサポートしており、開発チームはシステムのエラーをなくすために投資しています(コードの観点からは、サーバーは私たち次第です)。特定のチームがサポートするシステムに応じて、営業時間外の電話は月に2〜5回から週に2〜5回の範囲になります。これは、新しいコードリリースが問題を引き起こしたかどうかによっても異なります。
報酬については、ここで働き始めた当初から制度が整っていたので、それを念頭に置いて報酬を設定しました。営業時間外にサポートを提供することが期待される場合は、追加の補償を受ける権利があります。少なくとも、誰かが電話に出て、時間外の問題に対処しなければならない場合、彼らは翌日遅くに来るか、可能であれば自宅で仕事をすることができるはずです。
私が働いていた場所の1つには、24時間年中無休の監視センターがありました。すべてのスロットを埋め、「スペア」を用意し、マネージャーを担当させるには、基本的に10人のスタッフが必要でした。最大の問題は墓地のシフト(2400-0800)でした。なぜなら、基本的に1人の男がシフトから外れ(建物全体で)、1人の男がシフトに来ていたからです。遅延があると、シフト中の男は自動的に残業し、真夜中の男がノーショーだった場合は、16時間の素敵なシフトになります。
また、これらの仕事の離職率はひどく、夜/夜のシフトの採用は非常に困難でした...もちろん、ピーク時以外のシフトには、技術的なバックアップが必要な「オペレーター」レベルの従業員しかいませんでした。基本的に、経営陣は、特に家族がいる場合、夜勤を行うための高度な技術リソースを得るのに十分な金額を支払うことを望んでいませんでした。
あなたが尋ねていないことの1つ-あなたが事件を起こしたとき、誰かが実際にそれを見るまでどれくらいの期間が許容されますか?そして、これはあなたの定期的なメンテナンスウィンドウに影響を与えますか?
スタッフを追加せずに、段階的なプロセス(数年)で、ショップが8/5から50%12/5および50%24/6に独占的に移行するのを見ました。これによって作成された新しい問題は、より冗長なハードウェア、より優れた監視(特にアラート配信)を取得することでいくらか軽減されました。
本当の問題は、誰もが1日の都合の良い時間帯に大きなメンテナンスウィンドウを期待するようになったということです。これは、午前8時から午後8時まで働く人を増やし、土曜日と日曜日に働く予定の人を増やし、週末の3日間は、以前は通常の営業時間外に行われていたメンテナンスの機会と見なされることで対処されました。
もう1つの問題は、異常な問題、非常に深刻な問題、または特定の少数のシステムの問題だけが深夜または週末に処理される必要があると誰もが予想するようになったということです。これは、これらの要件を決して定義しないことによって処理されたため、深刻な睡眠不足の個人は、影響を恐れることなく、その時点で特定の問題を無視することを選択できました。 (それは会社にかなりの費用がかかる可能性がありますが)。
人々はますます燃え尽きて不満を抱くようになりました。しかし、IT管理者はこれらの問題を管理から隠すことができ、より少ないスタッフでより多くの仕事をすることができるヒーローのように見えました。 IT管理者はこれが問題の原因であることを認めないため、上級管理職はハードウェア保守の保守期間の短縮が深刻な問題であることを理解していませんでした。
環境はますます病的になり、IT管理者が要件や問題について嘘をつく習慣があったために、私は立ち去ることになりました。私が最後に聞いたのは、残りのスタッフはもっと燃え尽きて、もっと虐待されていると感じているということです。週末の3日間は余計な仕事をする時間と考えられており、家に帰ると家族が眠るほど長時間働くことが予想されるため、人々は家族を失っています。 (とにかくより多くの仕事をするためだけに)。
ただし、あるグループは秘密の「コンプ日」の提供を開始しました。つまり、土曜日が18時間の勤務にスケジュールされている場合、月曜日は週末の日としてスケジュールされる可能性があります。これは、余分な作業には余分な人員が必要であることが経営陣にわかることを恐れて、秘密裏に行わなければなりませんでした。
会社の利益は増加しており、IT管理者の給与も増加しています。
慎重なスケジュールと多くの宗教上の休日を共有しなかった多様なスタッフのために、休暇は驚くほど問題ではありませんでした。
それは私には全体的な成功のように思えます。
私は物事を扱う複数の方法で複数の店で働いてきました。最初のものははるかに恐ろしいものでしたが、うまくいったようでした...
私たちは4人の管理者からなる小さなお店で、アプライアンスとの24時間年中無休の延長サポート契約を購入したお客様を募集していました。 4人の管理者が毎晩M-THのオンコールでローテーションし、F、Sat、Sunは4人の管理者をローテーションした1人の男でした。通常、月曜日に電話をかけていた場合、F、S、Sシフトがありましたが、翌週の水曜日、次の週の火曜日などまで再び電話をかけていませんでした。8以降の電話PMは、トラブルチケットに記入した後、電話をかけ、オンコール担当者にページングするページングエージェンシーに直接行きました。最初は、複雑なシステムになると思われ、何も得られませんでした。睡眠。しかし、ほとんどの場合、ページ数は非常に少なかった。コードの安定性やフレアアップによっては、問題は1泊あたり1〜2の範囲になる可能性がある。ただし、通常は1週間に4〜5であった。補償厳密に休みでした。一晩中働いていたら、翌日になるとは思っていませんでしたが、こんなに小さなお店なので、完全に仕事から離れることはありませんでした。
24時間年中無休のオンコール状況での私の2回目の経験は、はるかに優れています。 24時間年中無休のコールセンター/ NOCスタッフが、すべてのカスタマーコールとサーバーページを担当しています。問題に基づいて、適切なグループのオンコール担当者に電話します。私のグループは1週間のローテーションを行っています。週のスケジュールと私のチームの規模(6人)で、私は毎月かそこらに電話をかけています。今年は通話中に2回ページングされたので、かなり良い平均です。報酬は前回と同じです。夜遅くまで働き、眠り、時間をかけて仕事に取り掛かるのであれば。
8人のシフトレイアウトがあります。
私は24時間年中無休の環境で75〜100台のサーバー(物理および仮想)を管理しています。世界中にクライアントを持つ金融サービス会社であるため、サービス自体にダウンタイムが発生することはありません。小規模なユーザーベース(非常に技術的なものから非常に非技術的なものまで、合計約20人のユーザー)を持つ4つの物理サイト(2つのデータセンター、2つのオフィス)があります。約40TBのSANストレージと5つのWANリンク)があります。
働き過ぎだと感じます。
あなたがそれを提供すると、人々はそれを使い始めるでしょう。
24時間年中無休のカバレッジは困難です。毎週168時間。私は他の仕事でそれをしましたが、ITではしませんでした。理論的には5人か6人でそれを行うことができますが、8人の方が現実的です。また、シフトと週末を分割するという課題もあります。慎重に計画してください。