ファン/電源などのサーバーハードウェアを監視する方法を探しています。問題は、負荷に応じて1日に数回でもサーバーの電源が自動的にオン/オフになる非常に動的な環境があることです。 。
私は、ファンの速度チェック(0はファンが停止していることを意味します)を含むスーパーマイクロサーバー(3〜4種類しかないため、非常に具体的です)用のテトランプを作成しました。ただし、サーバーのファン速度をオフにするたびに、速度も0になります。
そのため、サーバーが実行されている場合にのみzabbixアラートを送信するために、ipmiを介して電源ステータス(またはサーバーが実行されていることを示すその他のインジケーター)を取得する方法を探しています。
残念ながら、アクセスできない一部のサーバーをこの方法で監視しているため、ipmiを超える必要があります。
Ipmitool powerstatusのようなものを実行するスクリプトを書かないようにしたいと思います。 Zabbixにはすばらしいipmi統合があるので、可能な限り使用したいと思います。
ipmitoolセンサーは以下を返します:
root@virt1:~# ipmitool sensor
System Temp | 28.000 | degrees C | ok | -9.000 | -7.000 | -5.000 | 75.000 | 77.000 | 79.000
CPU Temp | 0x0 | discrete | 0x0000| na | na | na | na | na | na
FAN 1 | 8355.000 | RPM | ok | 400.000 | 585.000 | 770.000 | 29260.000 | 29815.000 | 30370.000
FAN 2 | 8355.000 | RPM | ok | 400.000 | 585.000 | 770.000 | 29260.000 | 29815.000 | 30370.000
FAN 3 | 8725.000 | RPM | ok | 400.000 | 585.000 | 770.000 | 29260.000 | 29815.000 | 30370.000
FAN 4 | na | RPM | na | na | na | na | na | na | na
CPU Vcore | 1.144 | Volts | ok | 0.640 | 0.664 | 0.688 | 1.344 | 1.408 | 1.472
+3.3VCC | 3.280 | Volts | ok | 2.816 | 2.880 | 2.944 | 3.584 | 3.648 | 3.712
+12 V | 12.031 | Volts | ok | 10.494 | 10.600 | 10.706 | 13.091 | 13.197 | 13.303
DIMM | 1.544 | Volts | ok | 1.152 | 1.216 | 1.280 | 1.760 | 1.776 | 1.792
+5 V | 5.216 | Volts | ok | 4.096 | 4.320 | 4.576 | 5.344 | 5.600 | 5.632
+5VSB | 5.056 | Volts | ok | 4.096 | 4.320 | 4.576 | 5.344 | 5.600 | 5.632
VBAT | 3.232 | Volts | ok | 2.816 | 2.880 | 2.944 | 3.584 | 3.648 | 3.712
+3.3VSB | 3.280 | Volts | ok | 2.816 | 2.880 | 2.944 | 3.584 | 3.648 | 3.712
AVCC | 3.280 | Volts | ok | 2.816 | 2.880 | 2.944 | 3.584 | 3.648 | 3.712
Chassis Intru | 0x0 | discrete | 0x0000| na | na | na | na | na | na
PS Status | 0x1 | discrete | 0x01ff| na | na | na | na | na | na
root@virt1:~#
1つのアイデアは、電源のオン/オフセンサーを照会することです。これはディスクリートセンサーです。 https://www.zabbix.com/documentation/2.2/manual/config/items/itemtypes/ipmi ディスクリートセンサーの状態を分析する方法の例があります。
電源のオン/オフセンサーを監視できない場合は、「+ 5V」(またはさらにいくつかの電圧センサー)などのアナログ電圧センサーを読み取ることができます。電圧がゼロに近い場合は、サーバーの電源がオフになっている可能性があります(または電源装置に障害が発生しています)。
Zabbix 2.2のデフォルトのインストールでは、「テンプレートIPMIIntelSR1530」と「テンプレートIPMIIntelSR1630」の2つのテンプレートがあります。どちらにも「パワー」センサーの値を照会する「パワー」アイテムが含まれており、それが必要なようです。そうでない場合は、そのセンサーで直面している問題について説明してください。