最近、レプリケートするSAN 2x Dell R720XDからアレイを構築しました。私たちは、CacheCade 2.0、BBU、ライトバックキャッシュを有効にしたLSI 9270-8i MegaRAIDカードを使用しています。
私たちのカードは、非常に大きなチップ温度を示しています(97 * C +、ディスクアクティビティなし!)。
私たちのR720は自動温度管理モードなので、最大排気温度は50 * Cです。
MegaRAIDカードは受動的に冷却され、それらを冷却するために良好な気流に依存しています-しかし、97 * Cは正常ですか? -最大周囲温度60 * Cへの参照を見たことがありますが、チップ温度については何もありません。
これは、異なるチップではありますが、温度範囲についていくつかの考えを与えるようです。 〜100°Cは高く、危険なほど限界に近づいていますが、仕様内です。 9201-16iカードでも同様の問題があります。これらのチップは2000000時間MTBF=ですが、そのような高いアイドル温度では、それらが持続できるとは思えません:(
ヒートシンクを引退したビデオカードのヒートシンクと交換することを検討しました。チップから安全にそれを取り除くことに成功した人がいたら、手順について数行書いておくといいでしょう。熱コンパウンドだけではなく、エポキシで接着されているように見えます。これにより、BGA自体またはボードへのはんだ付けが破損するリスクが高くなります...
私はこれが非常に古い投稿であることを知っていますが、Google検索での一番の結果なので、他の誰かの利益のためにチャイムを入れようと思いました。 LSI 9270シリーズRAIDカードは、比較的高速で吹き飛ばされる高濃度のサーバースタイルのエアストリームを持つように設計されています。たとえば、タワー型サーバーのアイドル状態で、フロント、バック、トップのファンが89Cで9270-8iをアイドル状態にします。 Noctua 60mmファンをヒートシンクに直角に吹き付けるように取り付けたとき(ファンを近くのビデオカードのヒートシンクにねじ込むことにより)、アイドル状態で59Cに急激に下がり、負荷がかかっている状態で70Cになり、乾燥したヒートシンクグリースをICと交換したダイヤモンドのアイドル温度が54Cに下がり、負荷温度が59Cに下がりました。
なぜアイドリングがそんなに高いのか説明できませんが、これは私たちのサーバーで何年にもわたって対処してきた問題です。最近引退したサーバーで、MegaRAID 9280コントローラーが約87度アイドル状態でした。本当に痛かったのは、バッテリーバックアップユニットが約1年で絶えず過熱し、その熱のためにフライアウトしてしまうことでした。交換用ユニットはほぼ$ 300だったので、TCOに不必要な量のリスクと費用が追加されました。
私たちは安価なAntecサイクロンブロワーを購入することで問題を最終的に解決したようです。基本的には、RAIDカードのヒートシンクに面して配置され、ボックスの背面から常に熱風を吹き出す単一のスロットファン。カードのアイドル温度がなんと26度も下がることがわかりました。市場には類似の製品が数多くあり、一般的に10ドル未満で購入できます。
さて、LSIの応答はほとんど解決策ではなく、有用でさえありません。
コントローラカードの過熱を示す可能性があるログには何も表示されません。摂氏97度はまだROCの温度しきい値の範囲内であり、115になります。監視する主な温度は、サーバー内の周囲温度であり、必要な状態を維持するには、ファンから少なくとも200 LFPMの気流が必要です。しきい値。以下の必要条件をご覧ください。
MegaRAID SAS 9270-8i RAIDコントローラーの場合、動作(熱および大気)条件は次のとおりです。
相対湿度範囲は20%から80%結露なしです。
最大周囲温度を超えてLSISAS2208プロセッサを動作させないようにするには、エアフローを少なくとも200リニアフィート/分(LFPM)にする必要があります。
温度範囲:— +10°C〜+45°C(BBUあり)— +10°C〜+55°C(LSIiBBU09モード1〜5)
これらのコントローラーの非稼働(ストレージやトランジットなど)環境のパラメーターは次のとおりです。
相対湿度範囲は5%から90%結露なしです。
温度範囲:– 40°C〜+70°C(BBUなし)— 0°C〜+45°C(BBUあり)
ありがとうございました
私たちのユニットは、低ファン速度設定で240LFPMのエアフローを提供し、周囲温度は18 * Cで、シャーシの温度はほぼ同じです-これは製造上の欠陥であることを認めないようです-この温度でシリコンが稼働することはありませんアイドル。
それは本当に普通のことではありません。奇妙なのは、両方がそれをしているということです-私は推測するファームウェア/ドライバーであるに違いありません-あなたはそれについてLSIまたはDellに話しましたか?
LSI 9361で同じ問題が発生しました。63は、シンクの上に2x2 cmのクーラーがある温度です。 12GBエキスパンダーも同様です。これは冬の仕様を超えています。ここでの問題は、これらのカードが2スロット大きいことです。それは行きません。
シングルスロットのグラフィックカード、ファン付きのカード全体のアルミシンクサイズがありますが、これは少なくとも10年前のものなので、Broadcomが現代のデザインを受け入れるかどうかは疑問です。
RadianHeatSinks 必要な場所にファン付きのカスタムサイズのシンクを提供できます。彼らはそれを正確に測定してドリルするためにカードを必要とするので、そこに私のカードを送ったことはありませんが、それがこの問題への唯一の深刻なアプローチです。
私は3つのHBA、2つのRAID、3つのサーバーに2つのエクスパンダーを使用しており、2〜3枚のカードに200 LFPMを効率的に分散させることは困難です。