私はデータセンターの品質を判断するための簡単なチェックリストを作成しようとしています...どこで何を探すべきか、また所有者の発言を確認するにはどうすればよいかを判断できます(たとえば、「当社のUPSは、力」)は本当かどうか?典型的な兆候、または良いまたは悪いデータセンターは何ですか?
これは、前回データセンターで買い物をしたときに私が自分のために作成した質問のリストです。
あなたがいくつかを訪問し、価格、あなたの訪問の印象、そしてそれらの答えの間にこれらの質問をするならば、どれがあなたが望むかはっきりしているでしょう。あなたが常にそれらを訪問し、それらのかなりの量を訪問することを確認してください。
カイルはそれをかなりうまくカバーしました、しかしここにいくつかのポイントがあります:
物理的なセキュリティは巨大です。議会に入るには、議会の行為(議会、動きの遅い官僚制度をここに挿入する)に近いはずです。
スプリンクラーではなく、ハロンの消火装置が必要です。サーバーを湿らせてはいけません。 (地域の消火規制が優先される場合があります...)
彼らの優先サーバーベンダーは何であるかをご覧ください。非常に具体的な理由(Googleのようなデータセンターを実行しているなど)でない限り、それはネームブランドサーバーである必要があります。 (Dell、HP、IBM、Sun、Appleなど)「ホワイトボックス」またはあなたが知らないブランドを言う場合は、実行してください。信頼できるいくつかの信頼できる下位層サーバーベンダー(System76など)があることに注意してください。ただし、「カスタムビルド」とは、それらが独自に物事を組み立てることを意味します。ご家庭には最適ですが、データセンターには適していません。 (これには、HP Proliant DL580の購入や、メモリオプションキットやドライブケージなどの取り付けは含まれません。)
どのような所有権オプションを利用できますか?それらを介して購入しますか?そこで直接購入して直送を購入しますか?リース? VM?
いつものように素晴らしいカイル、私が経験から学んだいくつかのこと:
UPSをバックアップする発電機があるかどうかを尋ねます。もしあれば、発電機はどのくらいの頻度でテストされていますか?
電気技師が電力を殺すのを防ぐために、物理的なロックとチェックはどこにありますか?
彼らはどのような責任/保険範囲を持っていますか?
SLAを満たしていない場合、どのように対処しますか?
どのくらいの頻度でSLAに適合していませんか?
それらは各ラック/ケージ/その他にどのくらいの電力を供給しますか? (電力に制約があり、追加の電力のためだけに別のラック/ケージが必要ですか?)
あなたの業界では参考になるでしょう。
当時面白くなかった面白い話:
バンクーバーの地下の電気コンパートメントに火事があり、私のDCから4ブロック、火が10ブロックの半径の電力を奪いました。 UPSは、Gen-setがオンラインになるまでライトを点灯し続けました。 Gen-setは、過熱する前に約1時間オンラインのままでした。 UPSは、発電機が安全シャットダウンした後、さらに30分間ライトをオンに保つことができました。 Gen-setは建物に属し、IIRCはDC=を非難し、手を洗うことができました。
DC)パネルでいくつかのラック列の電気技師が電源を切断しました。パネルが落下し、すべてのブレーカーがノックされたためです。別の電気技師についても聞いたことがありますDCはUPSで動作し、バイパスモードにしないでDC全体を停止します。
データセンターの3分の1はおそらく技術的なラインアイテムだと思います({VESDA、給油契約、UPSの対象となる冷却装置、複数の電力網、多様なファイバーの入り口)はありますか?.
もう1つは、物事がうまくいかない場合の対処方法です。彼らは自分のプライドを飲み込み、失敗を調べ、それが再び起こらないことを確認するために何をすべきかを理解していますか?それとも、以前はうまくいかなかったことをそのまま続けますか?
残りの3分の1は要員です。彼らは賢く、扱いやすく、毎月引き渡さないのですか?
しかし、さらに重要なのは、必要なスペースがあるかどうかです。 2年間のうちに、私たちがほとんど入ってきた場所の1つで、利用可能なスペースよりも多くのスペースを使用していました。
私はシリコンバレーの小さなデータセンターで働いています。私はビジネスの管理対象サーバー側のシステム管理者です。
悪い兆候:
良い兆候:-自動フェイルオーバーを備えたオンサイトディーゼル発電機-自動フェイルオーバーを備えたバックアップチラーと空調機-主要なキャリアバックボーン(AT&T、XO Comm)に十分な帯域幅-冗長ネットワークプロバイダー-冗長コアルーター、ファイアウォール、ロードバランサー、スイッチ-実行中サーバーを展開する前のメモリチェックとハードウェア診断
有名ブランドのサーバーは問題ありませんが、古くて何度もブロックされている場合は、使用する前にハードウェア診断に合格していることを確認することをお勧めします。
優れたデータセンターは、帯域幅の消費と稼働時間を監視できるWebサイトを顧客に提供する必要があります。彼らはまたどんな質問にも答えるべきです。 UPSのメーカーとモデルを尋ねます。 UPSの現在の負荷を確認してもらいます。この情報を使用して、電力がなくなるまでの時間を確認できます。
しかし正直なところ、UPSはあなたの心配事ではありません。 UPSは短い稼働時間(30分程度)しか提供しません。 DCにバックアップジェネレーターがあるかどうかは、はるかに重要です。DCがオンになっているグリッドを確認することも価値があります。ブラウンアウトとブラックアウトに関しては、グリッドごとに異なる優先順位が割り当てられています。たとえば、病院や消防署の優先順位が高い(電源が切られない)データセンターが同じグリッド上にある場合は、信頼できる電力が保証されます。
ラックごとにどれだけの電力が利用可能かを尋ねます。私が作業している場所では、各ラックに3x 25アンペア回路を提供しています。典型的な1uサーバーは1〜3アンペアを消費します。