私はビジネスを始めています。財務モデリングの理由から、サーバーに対する管理者の最適な数は何だと思いますか。または、使用するより良いメトリックがある場合はどうなりますか?私は組み込みプログラミングのバックグラウンドを持っているので、これは私が知識に関してかなりスクイーズしている分野です。 :\
追加情報:
たくさんのサーバーがあります。
主にLinuxボックスで、約10%がWindowsボックスです。
前もって感謝します!
コメントからの更新
私が求めているのは、球場のフィギュアだけです。非常に高可用性である必要がありますが、幸いなことに、システムはスペア/レプリカに適しています。
それぞれ約100万行の3つのデータベースクラスター(2つのcassandra、1つのsql)。カスタムプロトコルを実行する約200のLinuxボックス(ただし、最終的にはデータベースのプロキシにすぎません)、1個あたり約ペタバイトの2つのSAN、基本的にビデオエンコーディングアプライアンスとしての約200のLinuxボックス、同じカスタムプロキシソフトウェアを実行する約50のWindowsボックス。
そして競争力のある支払い。私は多くの悪い管理者よりも少数の良い管理者が欲しいです。これ以上の情報が必要ですか?
私は同様の方法でプラットフォームを構築し、サポートチームを形成します。さらに、「非常に高い可用性(HA)」が必要であると述べています。それは私もそうしているので、どうやってやっていくのか見てみましょう:)
スキルセットをグループに分割する必要があります。また、ここでは多くの基盤をカバーしており、HAには、適切または中級のスキルではなく、優れたスキルまたは優れたスキルが必要です。
あなたが私たちに提供した情報から、私はあなたが必要だと信じています。
4/5第一線の人々-これらは電話に出て、運用ステータスダッシュボードを監視し、スケジュールされたルーチンタスクを実行し、すべての技術分野で頻繁に発生するマイナーな問題を修正します。あなたは休暇のカバーで24/365をカバーするためにとても多くを必要とします。
2人のネットワーキング担当者-よりジュニアのCCNAレベルの人とシニアのCCNP(または予算がある場合はCCIE)レベルの人が必要です-彼らはオンコールローターを必要とし、このコストをカバーするために取っておかれる追加の支払いが必要になります時間ボーナス。
1本当に良いSAN人(資格の経験を積んでください)、再び彼らは24/365に電話しますが、彼らがいるときに彼らをカバーするために徐々にジュニアを訓練する必要もあります離れて-上記のより若いネットワーク担当者を検討してください。スキルの一部はネットワーク構成作業に漠然と似ており、より上級のネットワーク担当者から何をすべきかを言われることに飽きたら、熱心になります。この先輩SAN人はあなたのDBデザイナーでもあります。彼らがそれを実行できない、または多くの貢献をしないというわけではありませんが、2つの機能の間に明確な境界線が必要です。
2人の優れたまたは優れたLinuxおよびDB管理者に加えて、豊富な経験を持つ1人の本当に優れたDB管理者が、再びコールアウトロータに配置します。
ああ、あなたの「サービスマネージャー」が構造化され、コミュニケーションが明確で、彼のチームの話を聞いて喜んで、「いいえ」という言葉を使用できることを確認してください-彼らがあなたのプラットフォームへの新しい追加を直接プロジェクト管理することを期待しないでください(マイナーな変更はい、ただし大規模な機能の追加ではありません)、他の誰かにプロジェクトを実行してもらい、SMを操作してこれらを管理しますwith。
今では明らかにこれは非常に多くのスタッフですが、あなたは私たちがこれをどのように行うかを私たちに尋ねています、そしてこれはまさに私がそれを行う方法です-私は私のビジネスに奉仕し、人員不足/スキルを落とすことに完全に集中していますHAを必要とするプラットフォームはこの目標を達成できません。
「サーバーごとの管理者」のようなものはありません。ここでは「ガロンあたりのマイル数」メトリックを適用できません。
4,000台のサーバーからなる適切に設計されたファームを管理する5人の賢い人がいる可能性があります。履歴書に正しい頭字語がすべて含まれていても、5つのダンバスが単一のWindowsサーバーの管理方法を知らない可能性もあります。
PDATE:この回答を少し拡張します。
この仕事には一貫性がありません。何もせずに2週間座って親指をいじることができます。次に知っているのは、午前3時に起きて、3週間連続で12時間作業するという大きなプロジェクトになります。日。
しかし、何かが壊れていつも忙しい場合は、正しく仕事をしていません。企業はそれを知っています、それが管理者のほとんどが給料である理由です。 24時間年中無休で何かを修理しなければならないときに時間外労働を支払うよりも、彼らがあなたに給料を支払い、すべてが機能しているときにあなたをお尻に座らせるほうがはるかに簡単です。
私が言っているのは、給与計算の工数以外に、この仕事を測定することはできないということです。履歴書に頭字語が付いている人だけでなく、堅実な人を1人見つけるようにしてください。彼に何を尋ねるべきかわからない場合は、面接を手伝ってくれる人を見つけてください。有料市場。特にこのビジネスでは、あなたはあなたが支払うものを手に入れます。善人は安くはない。 1人は高価ですが、経験のない3人の安価な管理者よりも堅実な管理者の方が優れています。
1人の男から始めますが、それ以上の余地を残します。
最適な式はCompetence - (Workload^(Stupid Management)) + Red Bull
です。
少なくともおおよその質問に対する答えがどれだけ必要な場合でも、インフラストラクチャ、ユーザー、および使用法について多くのことを知らずに答えを出すことはできません。例を挙げましょう。
以前の職務では、多国籍企業のオーストラリアのネットワークを担当していました。サーバーの数は、サーバーの数ではなく、サーバーの動作に影響されるため、ワークロードにはまったく影響しませんでした。そこから始めたときは4つ、去ったときは15つでした。適切なセットアップと管理により、これらの15は元の4よりも問題が少なかった。
その同じ会社では、ユーザー数は約60〜80人のアクティブユーザーでかなり安定しており、それに加えて、全国に散らばっているユーザーもいます。ユーザーは専門知識に幅がありましたが、平均して彼らはかなりよく教育され、振る舞っていたので、彼らは私のためにほとんど仕事をしませんでした。ほとんどの組織では、何よりもユーザーが管理者の作業負荷を決定します。もちろん、彼らがヘルプデスクに彼らを掌握することができない限り。
私の仕事はすべて包括的でした。電話、プリンター、コピー機、ファックス機、PC、サーバー、マネージャーの従兄弟のラップトップなど、どこかに何かが差し込まれている場合、それは一般的に私の責任であると考えられていました。
私はもともと一人ですべての仕事をしていましたが、追加のプロジェクトを引き受けた結果、後で後輩に手伝ってもらいました。正直なところ、実際には1人半の仕事だったので、経営陣に知らせたことはありませんでしたが、とても簡単でした。
私は、3人か4人の管理者が非常に一生懸命働いている、同様の種類の役割をしている他の人を知っています。彼らはただ異なる種類のユーザーや使用法を持っています。
24時間年中無休で誰かと100%の稼働時間が必要な場合は、ネットワークのサイズに関係なく、少なくとも2人のフルタイムのシステム管理者、交代制勤務、少なくとも1人のパートタイマーが必要です。
24時間年中無休で電話をかけているシステム管理者が1人だけの場合は、次のようにします。
2人のシステム管理者がいる場合、これは軽減されます。ただし、全員が休暇をとる必要があります。そのため、そのサイズのシステムの3番目のパートタイマーは、不必要なプレッシャーの最後のビットを軽減するのに役立ちます。
24時間年中無休の稼働時間がビジネスにとって重要でない場合(たとえば、99%のみを目標としている場合)、24時間年中無休のオンコール技術を持つことはおそらくそれほど大きな問題ではありません(午前6時から午前6時までのオンコールのみを提供します)午後10時、これはすべてのクライアントにとって問題ありません)。
事例情報に満足している場合、現在の比率はおおよそ次のとおりです。
実際にはこれよりはるかに多くの人とシステムがありますが、これは人とシステムをいくらかきれいに分割できる1つの領域の正確なスライスです。
これらのシステムを最初にベアメタルから調達するには、より多くの人員が必要になります。システムが文字通りフィットアンドフォーゲットであり、PXEブートから構築する場合、比率は、すべてのサーバーが一意であり、DVDから構築している環境とは大きく異なります。
数だけが必要な場合は、20台のサーバーあたり1人の管理者がおそらく安全な平均です。
しかし、本当に意味のある数値が必要な場合は、次のような変数の山を考慮する必要があります。
それをかなり一般的にしようとすると、考慮する必要がある種類の要因は次のとおりです。
サポートする必要のあるさまざまなイメージの数-デプロイと構成をどのように自動化できるか
サーバーごとのカスタマイズの量(たとえば、同じイメージから1000のWebサーバーをデプロイできますが、それぞれが異なるドメインをホストしている場合、いくつかの点で、許可するドメインごとのカスタマイズの量に応じて、最大10,000を効果的に維持できます。ホスト)
変化の頻度
変化の量
アプリケーションが自動監視と回復にどれほど親しみやすいか
アプリケーション管理者またはOS管理者のみをカウントに含める場合
周辺機器の義務-SAN/NASのようなテクノロジーを使用している場合(それらを管理する人が必要です-同じ人でもかまいませんが、シナリオに応じてNAS/SANを管理すると、サーバーの管理に利用できる時間が短縮されます-DNS、DHCP、メールなどの他のインフラストラクチャアプリについても同じことが言えます。
基本的に、必要な管理者の数を増やすのは変更率と変動です。
そのため、一部のシステム、たとえばユーザーが多い部門の共有サーバーでは、サーバーごとに1人の管理者が必要になる場合がありますが、他のアプリの場合は、グーグルの検索ファーム、あなたはおそらく何百ものサーバーのために1人の管理者でやっていくことができます。
何もしないで座っている人がいるという考えには同意しません。あなたがそうするならば、あなたは間違った人を持っています。順調に進んでいるときでも、いつでも改善したり、監査などを行ったりすることができます。
250のゲストを実行する最大50のWindows仮想ホストと、非仮想負荷を実行する別の40のWindows物理サーバーがあります。その環境は2人の非常に賢く勤勉な管理者/エンジニアによって運営されていますが、これらの1人は文字通り他の2人の仕事をしています。環境は非常に信頼できます。
10台のSolarisサーバーを実行しているSrUNIX管理者がいます。
このオプションを検討してください-6人の管理者/エンジニアの予算(昼間4回、夜2回)。冗長性は一晩で処理されます-まだ誰も永久に雇うことはありません。 -コンサルティング/採用会社と協力して、さまざまなスキル(Linux、Windows、SAN /ストレージ、データベース)を組み合わせた6人の優れた管理者を見つけ、6か月間コンサルティングで採用します-その時間の終わりに、作業負荷を測定します、上位x人の管理者を雇います。
\\グレッグ
「財務モデル」が最もよく見える番号を選択するだけです。それをバックアップするための大量の情報がなければ、現実を反映するためにそこに立ち寄ることができる本当の数はありません。すべてはsolefaldが言うように状況に依存します。
ご存知のとおり、solefaldが述べたように、本当の答えはありません。おそらく、私たちはあなたに大胆な答えを与えることができますが、あなたが持っているサーバーの数、それらが何をするのか、あなたの稼働時間の要件は何であるか、そしてあなたがシステム管理者に支払うことをいとわない価格についての詳細を私たちに教えてください対ローカル市場の残りの部分。
必要な信頼性に応じて、5〜7人に行きます。これはサーバーの数ではなく、人的資源の計算に基づいています。
最善の方法は、1人を現場に、もう1人を電話に出すことです。何か物理的なことが起こった場合、一人が過負荷になる可能性があります。
....あなたは5から6人の間で終わる。高可用性には、次のことが要求されます。そうしないと、常に誰かが現場にいることを保証できず、4時間の緊急事態では、作業が行われなかったため、高可用性が大幅に低下します。そして、緊急事態は誰もいないときに起こります;)自然のルール。