システムの正常性に関するレポートが必要なため、すべてのハードウェアコンポーネント(CPU、メモリ、ディスクなど)が期待どおりに機能していることがわかります。レポートに見つかった問題のみがリストされている場合(ある場合)は、最も読みやすくなります。これを行うシステムツールはありますか?
関連するメモ:
電子機器は通常、100%または0%で動作します。ハードドライブなどの機械装置には、すでに知っているSMARTレポートに従って、差し迫った障害のインジケータがあります。
ファンには差し迫った故障インジケータがありますが、これは振動速度、キーリングベアリングなどのインジケータの聴覚と聴取に基づいています。
ファンの劣化の別の潜在的な指標は、CPUの熱レベルです。ラップトップでは、ファンの排気口が詰まっているか、RPMが低すぎます。また、CPU /マザーボードは圧縮空気でのダストクリーニングが必要であることを意味する場合があります(水分を含む呼吸は使用しないでください)。また、CPUヒートシンクを新しいサーマルペーストで再装着する必要があることも意味します。
マシンがロックして不良メモリエラーが表示される場合は、次の指示に従ってRAMをテストできます。 RAMのエラーをLinux経由で確認する方法 。
RAMチェッカーが不良メモリブロックを検出した場合、次の手順を使用してブラックリストに登録できます。 メモリの75%のみを使用するようカーネルのメモリマネージャを制限する方法はありますか?
SSDを使用している場合、寿命は1兆回の書き込みで測定されます。 SMARTユーティリティはすでにSSD寿命を測定していますが、NVMe SSDについては測定していません。そのためにはnvme-cli
が必要です。以下を使用してインストールします。
Sudo apt install nvme-cli
次に、SSDから利用可能な情報を収集します。
$ Sudo nvme smart-log /dev/nvme0
Smart Log for NVME device:nvme0 namespace-id:ffffffff
critical_warning : 0
temperature : 40 C
available_spare : 100%
available_spare_threshold : 10%
percentage_used : 0%
data_units_read : 12,539,332
data_units_written : 10,623,582
Host_read_commands : 281,194,884
Host_write_commands : 96,528,713
controller_busy_time : 672
power_cycles : 1,677
power_on_hours : 687
unsafe_shutdowns : 105
media_errors : 0
num_err_log_entries : 279
Warning Temperature Time : 0
Critical Composite Temperature Time : 0
Temperature Sensor 1 : 40 C
Temperature Sensor 2 : 51 C
Temperature Sensor 3 : 0 C
Temperature Sensor 4 : 0 C
Temperature Sensor 5 : 0 C
Temperature Sensor 6 : 0 C
Temperature Sensor 7 : 0 C
Temperature Sensor 8 : 0 C
最も重要なフィールドはPercentage used
で、0%と表示されます。これはディスク使用率ではなく、使用寿命パーセントです。 Percentage used
が1%に達するとすぐに、所有していた月数に100を掛けて、いつ死ぬかを調べます。現在の速度では、ドライブは100年以上続くと言えます。もちろん、それはとにかく10年で廃止されます。
conky
を使用したデスクトップのシステムモニター多くの人は、デスクトップの一部にシステムステータス(およびヘルス)を表示することを好みます。 Conkyをプライマリモニターの右側20%で実行したい:
注:シングルCPUでの97%のCPU使用率は、スクリーンレコーダー自体が原因です。
conky
およびCPU使用率の詳細については、以下を参照してください: CPUとRAMにストレステストを同時に行うにはどうすればよいですか?