複数のVMをホストするlibvirtを備えたLinuxを実行するデュアルOpteronサーバーがあります。 VMは正常に動作し、サーバーは正常に処理されますが、1つのCPUは常に約69C(70Cでスロットル)で実行され、もう1つのCPUは約15Cで実行されます。
これは私には普通ではないようですか?どちらも少し温度が近くないのでは?
これ以上dianoseする方法がわかりません。たぶん、CPUの1つに十分なサーマルペーストがないのでしょうか?
編集:マザーボードは ASUS KGPE-D16 で、デュアル Noctua NH-U9DOファン で冷却されます。
温度は絶対値ではなく、周囲温度より下になる可能性があることに注意してください。サーバーがアイドル状態のとき、CPU温度は2Cおよび13Cに低下します。 here のlmsensors設定を使用しています
問題は、ヒートシンクの適合性が低いことになりました。たぶん貧弱な適合は正しい説明ではありません。結局のところ、ヒートシンクを覆うプラスチックカバーではなく、ヒートシンクにサーマルペーストを貼る必要があります。
プラスチック製のカバーを取り外した後、CPUは素敵でクールです。
私の経験では、ケース内のペアになっているコンポーネントが異なる温度で動作するのは正常です。これは、空気の流れがどこでも同じではないためです。これが私のコロボックスからのHDD温度のグラフです。ドライブはミラーリングされているため、それらのワークロードはほぼ同じです。
ご覧のとおり、これらは互いに追跡していますが、同じではありません。また、平均して6Cしか離れていません。センサーが絶対温度または過熱を報告するかどうかにかかわらず、負荷時の55Cの差は非常にひどく間違っているようです。データが正しいと確信できる場合は、静止時の差が10Cに低下することを考えると、これは気流による違いであり、ヒートシンクの取り付けが不十分であると考えられます。
そうではない。気流に深刻な問題がない限り。または、クーラーの1つが不良です。温度は変動しますが、それほどではありません(摂氏70対15度)。
15度がどれほど低いかを考えると、(a)センサーがオフになっていると想定します(サーバーを本当に涼しい部屋に保管していますか?)。
また、何らかの理由で、CPUの1つがまったく機能しないと想定します。
小さな違いは正常です。少し大きいものもあるかもしれません(気流が頭に浮かびます)。しかし、ここではコールドであることについて話します。
これは、冷却または不均一な負荷のいずれかである可能性があります(状況に温度差がある場合、おそらく不均一な負荷です)。すべてのコアを均等にロードし、温度がまだ変化するかどうかを確認するには、prime95などを使用する必要があります。そうでない場合は、VMのバランスをとる必要があります。アプリがマルチスレッドでビジーであることを確認してください。それを行う方法は、ソフトウェアと個々のワークロードに依存するため、実際には質問の範囲を超えています。単一のCPU /コアを使い切るのに十分な負荷がない場合、これを行うことには実際の利点はないことに注意してください。実際には、VMマルチCPUシステムで省電力モードに入ることができます。
冷却に絞った場合。 10Cまでのわずかな違いでも、サーマルペーストが少なすぎる(または多すぎる)場合があります。大きな差は、CPUクーラー間の重大な問題または違いを示します。空気の流れが妨げられている、ヒートシンクが緩んでいるなどの可能性があります。
私は同意しなければなりません、不完全な臨時雇用者。センサー、15Cはわずか59Fです!!!コンピューターが非常に極寒のデータセンターにない限り、周囲の気温は59Fより高くなると思います。 VMを低温コアに割り当てて、変更がないか確認します。そうでなければ、センサーに欠陥があると私は強く疑います。
また、dmesg
(ブートメッセージ)の出力を調べて、異常なことがあるかどうかを確認することもできます。