最近、枯渇したエントロピープールに初めて遭遇しましたが、通常のシステムログが問題の発見に役立たなかったことを知ってがっかりしました。
新しいCentOS6仮想マシンにCUPSをインストールした後、HTTPS経由で管理ページに接続しようとしました。リクエストは無期限にハングしているように見えました。後で、CUPSが新しい自己署名SSL証明書をその場で生成しようとしていて、/ dev/randomから読み取ろうとしているときにブロックされていることを知りました。インターネットでさらに読むと、仮想マシンには通常のエントロピーのソースがないため、これが一般的な問題であることがわかります。
私の特定のケースでは回避するのは簡単でしたが、ESXiクラスター内の他の仮想マシンで同様の枯渇イベントが発生する可能性があることを今では妄想しています。しかし、このイベントは通常のログファイルのいずれにも書き込まれないため、問題がどれほど蔓延しているかを知る方法は実際にはありません。
大規模なクラスター内のすべての仮想マシンでエントロピーの可用性を簡単に監視する方法はありますか?特に、エントロピーの枯渇が、一部のマシンで見られる断続的なパフォーマンスの問題の原因であるかどうかを知りたいと思います。
/proc
ファイルシステムを介して簡単に確認できます...
cat /proc/sys/kernel/random/entropy_avail
また、一部の監視ユーティリティと、利用可能なエントロピーに関するグラフとアラート。 ムニンは簡単な例です 。