老朽化したデルサーバー群を、iDRAC8エンタープライズを搭載した新しい第13世代デルにアップグレードしています。
次のOIDを使用してSNMP経由でサーバーの電源ステータスをポーリングしています。
_.1.3.6.1.4.1.674.10892.5.2.4.0 (systemPowerState)
_
これは4 (on)
の値を返すことを意味し、多くの場合それを返します。ただし、多くの場合、_0
_の状態が返されるため、誤ったアラートがトリガーされます。
他の誰かがiDRAC8でこれを見たことがありますか?デルのケースを開いて、既知の問題があるかどうかを確認します(デルのファームウェアにバグが見つかったのはこれが初めてではありません)が、他の誰かがこれを最初に見たかどうかを確認したかったのです。 、および回避策があった場合。
これを数週間調べた後、まだ解決策はありませんが、1.5vレールがオフラインになっているという、電圧センサーからの「不明な」データも時折取得しています。単一のサーバーだけでも発生しているわけではありません。現在、複数のR630がSNMPを介してこのデータを返し、誤ったアラートであると想定するものを発生させています。
デルでテクニカルサポートを行いましたが、解決策がありません。
4xR730でも同じ「電源ステータス」の問題が発生します。ファームウェアを利用可能な最新バージョン(2.15.10.10_A00)に更新しても、問題は解決しませんでした。
DellPowerStateに対して返されるSNMP値は、次のいずれかである必要があります。
1⇒その他2⇒不明3⇒オフ4⇒オン
0は文書化されていません。私たちが使用する回避策は、「4」のように「0」を考慮することです。そのため、idracがランダムに「0」を返してもアラートは表示されません。
デルのidracファームウェアの将来のバージョンが修正されるまで待つ必要があると思います。