SNMPを使用してSunハードウェアを監視し、LOMカードから情報を収集しています。私が監視しているデータポイントの1つは、内部電圧のいずれかが高すぎたり低すぎたりした場合に警告する電圧ステータスMIBです。しきい値は、おそらく製造時にSunによって設定されています。これらは驚くべき頻度でトリガーされます-これは心配することですか?
システム内には複数のしきい値があるため、どのしきい値を超えているかを調査する価値がある場合があります。 X4200からのステータスダンプを見ると、upper/lower_noncritical_threshold、upper/lower_critical_threshold、upper/lower_nonrecov_thresholdが表示されます。 LOMがエラーをログに記録していないことを考えると、重要ではない制限に達していることを示しているクエリを見ているのではないかと思います。その範囲へのトランジェントについては、おそらく心配する必要はありません。
また、ファームウェアの更新に関する他の回答も2番目にします。 X4x00がリリースされて以来、ILOMとBIOSが大幅に更新されており、X2x00にも更新があると思われます。
私たちは同じことを経験しました。どうやらそれは心配することは何もありません。電圧は、オンボードバッテリーバックアップの充電と放電に応じて変化します。
Sun LOMについて一言、一部のモデルのファームウェアは、何年にもわたって毎月更新されています。明らかに、彼らは理由のためにそれらを更新します。まだダウンロードしていない場合は、最新かつ最高のダウンロードを購入することをお勧めします。
多数のSunXFireサーバーを管理する必要があり、同様の問題が発生しました。購入時に、これらのサーバーにはLights out Manager(eLOM)が組み込まれており、統合されたLights out Manager(iLOM)にアップグレードした後、これらの問題の多くが解決され、多くの機能が追加されました。名前の違いは紛らわしいですが、ダウンタイムに余裕があれば、LOMとBIOS用の最新かつ最高のファームウェアにアップグレードすることを強くお勧めします。