web-dev-qa-db-ja.com

Ubuntuラップトップのハードロックアップをデバッグするにはどうすればよいですか

私はしばらくの間、ThinkpadT450でUbuntuを実行しています。

時々、システムは私をハードロックします。例えば。マウスが動かない、ctrl-alt-f#でプレーンターミナルに移動しない、など。

マジックsysreqキーはまだ試していません。次回は試しますが、楽観的ではありません。

その頃のjournalctlからの抜粋を次に示します(この問題のトラブルシューティングを行えるように、永続ログを有効にしました)。

Jul 07 16:53:27 gothputer systemd[1]: Starting Cleanup of Temporary Directories...
Jul 07 16:53:27 gothputer systemd-tmpfiles[5215]: [/usr/lib/tmpfiles.d/var.conf:14] Duplicate line for path "/var/log", ignoring.
Jul 07 16:53:27 gothputer systemd[1]: Started Cleanup of Temporary Directories.
Jul 07 16:55:13 gothputer kernel: perf interrupt took too long (5045 > 5000), lowering kernel.perf_event_max_sample_rate to 25000
Jul 07 16:57:59 gothputer systemd-timesyncd[786]: Timed out waiting for reply from 91.189.94.4:123 (ntp.ubuntu.com).
Jul 07 16:57:59 gothputer systemd-timesyncd[786]: Synchronized to time server 91.189.89.199:123 (ntp.ubuntu.com).
Jul 07 17:12:40 gothputer kernel: thinkpad_acpi: EC reports that Thermal Table has changed
Jul 07 17:17:01 gothputer CRON[6044]: pam_unix(cron:session): session opened for user root by (uid=0)
Jul 07 17:17:01 gothputer CRON[6045]: (root) CMD (   cd / && run-parts --report /etc/cron.hourly)
Jul 07 17:17:01 gothputer CRON[6044]: pam_unix(cron:session): session closed for user root
Jul 07 17:25:13 gothputer wpa_supplicant[1206]: wlp3s0: WPA: Group rekeying completed with e0:3f:49:e2:3f:c4 [GTK=CCMP]
Jul 07 17:41:35 gothputer Sudo[7819]: pam_ecryptfs: pam_sm_authenticate: /home/zee is already mounted
Jul 07 17:41:35 gothputer Sudo[7819]:      zee : TTY=pts/1 ; PWD=/home/zee/Downloads ; USER=root ; COMMAND=/usr/bin/gdebi N1.deb
Jul 07 17:41:35 gothputer Sudo[7819]: pam_unix(Sudo:session): session opened for user root by zee(uid=0)
Jul 07 17:41:43 gothputer Sudo[7819]: pam_unix(Sudo:session): session closed for user root
-- Reboot --
Jul 07 17:48:21 gothputer systemd-journald[313]: Runtime journal (/run/log/journal/) is 8.0M, max 118.9M, 110.9M free.
Jul 07 17:48:21 gothputer kernel: Initializing cgroup subsys cpuset
Jul 07 17:48:21 gothputer kernel: Initializing cgroup subsys cpu
Jul 07 17:48:21 gothputer kernel: Initializing cgroup subsys cpuacct
Jul 07 17:48:21 gothputer kernel: Linux version 4.4.0-28-generic (buildd@lcy01-13) (gcc version 5.3.1 20160413 (Ubuntu 5.3.1-14ubuntu2.1) ) #47-Ubuntu SMP Fri Jun 24 10:09:13 UTC 2016 (Ubuntu
Jul 07 17:48:21 gothputer kernel: Command line: BOOT_IMAGE=/boot/vmlinuz-4.4.0-28-generic.efi.signed root=UUID=3862c22d-6f33-42a1-8bde-d05dc9f1af16 ro quiet splash vt.handoff=7
Jul 07 17:48:21 gothputer kernel: KERNEL supported cpus:
Jul 07 17:48:21 gothputer kernel:   Intel GenuineIntel
Jul 07 17:48:21 gothputer kernel:   AMD AuthenticAMD
Jul 07 17:48:21 gothputer kernel:   Centaur CentaurHauls
Jul 07 17:48:21 gothputer kernel: x86/fpu: xstate_offset[2]:  576, xstate_sizes[2]:  256
Jul 07 17:48:21 gothputer kernel: x86/fpu: Supporting XSAVE feature 0x01: 'x87 floating point registers'
Jul 07 17:48:21 gothputer kernel: x86/fpu: Supporting XSAVE feature 0x02: 'SSE registers'
Jul 07 17:48:21 gothputer kernel: x86/fpu: Supporting XSAVE feature 0x04: 'AVX registers'
Jul 07 17:48:21 gothputer kernel: x86/fpu: Enabled xstate features 0x7, context size is 832 bytes, using 'standard' format.

この特定のロックアップ中に、参考のために、デスクトップの時計が17:47:40にフリーズしました。

ここでの次のステップは何ですか? 「何」が失敗しているのかがはっきりしないので、見つけたすべてのログを読む以外にどこから始めればよいのかよくわかりません。

1
Zee Alexander

ロックアップを引き起こす明らかなものが何もないときに試すことができること

  • CPUの最大動作温度をメーカーから把握してください
  • 何か問題が検出された場合は、BIOSまたはオンボード診断をチェックインしてください(電圧、ファン速度、温度、スマートエラー)
  • X(Sudo service lightdm stopなど)をシャットダウンして、グラフィックスなどを方程式から外し、コンソールのエラーメッセージを表示できるようにします。
  • lm-sensorsパッケージをインストールして構成します。そこからもすべてがOKであることを確認してください
  • センサーを次のように実行し続けます:watch -n1 sensors
  • dmesgの出力に注意してください。カーネルに関するすべての情報が表示されます。
  • 画面を切り替えるためのALT-F1(F2、F3)
  • stressなどのアプリでCPUバーンを実行して、CPUとsensors出力を加熱します。 CPU上のすべてのコアを使用していることを確認してください。
  • smartmontoolsをインストールし、smartctlを実行してハードドライブにクエリを実行し、セルフテストを実行します
  • memtest86または他の起動可能なアプリケーションを試して、RAMを確認してください。または、Linux内からmemtesterを試す必要がある場合
  • bonnie++ddなどを試して、ハードドライブにストレスをかけます

これらすべてがうまくいくようであれば、X、特にグラフィックハードウェアまたはドライバー(過去の経験から)が疑われます。 Nvidiaドライバーを使用している場合は、提供されているGUIユーティリティから温度とファン速度を確認できます。

2
Ryan Babchishin