web-dev-qa-db-ja.com

ランダムな時間に奇妙に自分を修正するNVidiaドライバーでログインした後、黒い画面をデバッグする方法は?

ここで、ここ数日のNvidiaの問題について説明します。Nvidiaドライバーの問題の診断を誰かが手伝ってくれることを願っています。

背景

TL; DR

一部のaptパッケージ(壊れた依存関係の問題)をシャッフルした後、Ubuntu 17でこの問題が発生し始めましたが、しばらくの間nouveauドライバーでこの問題を回避し、18.04バイオニックにアップグレードしました。残念ながら、何が原因なのか正確にはわかりません。

ロングバージョン:

  1. 私は何年もGeForce 210カードで何の問題もなくnvidia-340パッケージを使用していました。
  2. ある時点で、なぜなのかわからないが、デスクトップマネージャーにログインした後、マウスカーソルだけが表示された黒い画面が表示されました。どのデスクトップマネージャーまたはウィンドウマネージャーを使用しても違いはないようです。それでも仮想コンソールに切り替えてマネージャーサービスを再起動することができ、場合によっては(予想外に)再度ログインすることができ、次の再起動まですべてが正常に見えるようになりました。
  3. 次に、debianパッケージ、Nvidia Webサイトからの実行バイナリダウンロード、およびppa:graphics-drivers/ppaリポジトリからドライバーを再インストールしてみました。結果は常に同じでした。
  4. その後、すべてのウィンドウマネージャーへのログインを許可するnouveauドライバーを少し試しましたが、これらのドライバーは遅く、ビデオを再生するときに予期せずハングすることがあるので、これは受け入れられませんでした。この種の問題については、ネット上に複数のバグレポートがあります。
  5. その後、18.04 bionicにアップグレードし、aptを使用して通常のnvidia-340パッケージを再インストールしました。 (私は最初にnouveauドライバーをmodprobe構成でブラックリストに登録してアンインストールしました。)

今、これを行うシステムが残っています:

Ubuntuのスプラッシュ画面の直後に最初にNvidiaのロゴが表示され、次にgdm3が起動します。Unityまたはgnomeにログインすると、黒い画面が表示されます。マウスポインターがまったく表示されません。 Alt-F3でテキストコンソールにアクセスすると、ログインしてgdm3サービスまたはgdmサービスを再起動できます。これを十分に行うと、ある時点でシステムが突然正常に動作し始め、Unityまたはgnomeにログインできるようになります。時々、ログイン画面でコンピューターをそのままにしておくと、次のリブートまで修正されますこれは、何年も使用していなかったドライバーが問題、まだ私のシステムと互換性があります。 BIOS設定を変更していません。作業中の/etc/X11/xorg.confファイルを/usr/share/X11/xorg.conf.d/20-nvidia.confにコピーしましたが、何も変更されませんでした。 nvidia-xconfigを使用してファイルを再作成してみましたが、動作しますが、再起動後も問題は同じです。グラフィックスが統合されたCPUを持っていないので、これは問題ではありません。

関連がある場合に備えて、ここに私のシステムに関するいくつかの情報があります:

$ uname -a
Linux turbox 4.15.0-70-generic #79-Ubuntu SMP Tue Nov 12 10:36:11 UTC 2019 x86_64 x86_64 x86_64 GNU/Linux

$ lsb_release -a
LSB Version:    core-9.20170808ubuntu1-noarch:security-9.20170808ubuntu1-noarch
Distributor ID: Ubuntu
Description:    Ubuntu 18.04.3 LTS
Release:    18.04
Codename:   bionic

$ ubuntu-drivers devices
== /sys/devices/pci0000:00/0000:00:02.0/0000:01:00.0 ==
modalias : pci:v000010DEd00000A65sv00000000sd00000000bc03sc00i00
vendor   : NVIDIA Corporation
model    : GT218 [GeForce 210]
manual_install: True
driver   : nvidia-340 - distro non-free recommended

$ prime-select query
nvidia

$ Sudo lshw -c video
  *-display                 
       description: VGA compatible controller
       product: GT218 [GeForce 210]
       vendor: NVIDIA Corporation
       physical id: 0
       bus info: pci@0000:01:00.0
       version: a2
       width: 64 bits
       clock: 33MHz
       capabilities: pm msi pciexpress vga_controller bus_master cap_list rom
       configuration: driver=nvidia latency=0
       resources: irq:26 memory:fb000000-fbffffff memory:c0000000-cfffffff memory:de000000-dfffffff ioport:ef00(size=128) memory:c0000-dffff

$ nvidia-smi 
Wed Nov 20 12:01:15 2019       
+------------------------------------------------------+                       
| NVIDIA-SMI 340.107    Driver Version: 340.107        |                       
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce 210         Off  | 0000:01:00.0     N/A |                  N/A |
| N/A   50C    P0    N/A /  N/A |    630MiB /  1023MiB |     N/A      Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Compute processes:                                               GPU Memory |
|  GPU       PID  Process name                                     Usage      |
|=============================================================================|
|    0            Not Supported                                               |
+-----------------------------------------------------------------------------+

$ lsmod  | grep nvidia
nvidia              10559488  198
drm                   401408  10 nvidia

$ echo $XDG_SESSION_TYPE 
x11

$ gnome-Shell --version
GNOME Shell 3.28.4

私の質問:

コンソールアクセス(および通常はグラフィカルアクセス)があるので、これの原因を特定するために何かできることはありますか?したくない私のシステムとそのすべてのソフトウェアを再インストールします。グラフィック環境が明らかに時々正常に機能するため、起動後に予測できないほどです。

journalctl -kを確認し、疑わしいと思われるエラーをグーグルで検索しましたが、解決策や有用なヒントはまだ見つかりません。

どんなアイデアでも大歓迎です。ありがとう!

編集:ここにいくつかの詳細があります:再起動するたびに、仮想コンソールにログインしてこれを修正しようとしましたが、一見ランダムな時間に、起動後約5分で、画面が点滅して表示されますテキストコンソールから離れてログイン画面(デスクトップマネージャー)に移動します。何かがクラッシュして再起動したように見えますが、それが何であるかはわかりません。これは私がすることとは何の相関もないようです。この後、問題なくログインできます。現時点では、それは私にとって実際の問題というよりは厄介なものですが、それでもややイライラします。これらをデバッグする方法があるはずだと思います。

EDIT2: Xorgログに次のエントリが表示されます。

[   926.271] (II) systemd-logind: got pause for 13:68
[   926.272] (II) systemd-logind: got pause for 226:0
[   926.272] (II) systemd-logind: got pause for 13:65
[   926.272] (II) systemd-logind: got pause for 13:69
[   926.272] (II) systemd-logind: got pause for 13:67
[   926.272] (II) systemd-logind: got pause for 13:64
[   926.272] (II) systemd-logind: got pause for 13:66

これらのエラーをウェブで見ると、多くの人がログイン画面で非決定的な問題を経験していることがわかります。 systemd-logindやおそらくdbusと関係があるようですが、残念ながら私には何がわかりません。うまくいけば、Linuxの知識が豊富な人が手伝ってくれるでしょうか?

2
alexg

数か月後ですが、理由はわかりませんが、問題は解決しました。おそらく最新のシステムアップデートのいずれかが原因です。

その間、シャットダウンではなくサスペンドを使用してきました。再起動する必要があるときはいつでも、ログイン画面が表示され、ログイン後は、マウスカーソルとTeamViewerウィンドウが他の黒い画面に表示され、別のメッセージが表示されます。タスクバーにアイコンを配置できないこと(タスクバーが存在しなかったため)。私が待っていた場合、ランダムな時間(通常は約10〜30分)が経過した後、マシンに突然ログイン画面が表示されます。これが発生すると、再度ログインできます。

しかし、最初にログインした後、黒い画面に(以前と同様に)TeamViewerが表示され、タスクバーについてのメッセージも表示されますが、約1分後にデスクトップが表示されます。マシンを再起動する必要はほとんどないので、1分ほど待ってもかまわないので、これははるかに優れています。

最近のアップデートの1つで問題が解決したか、少なくともそれほど深刻ではなくなったと思います。システムは現在次の場所にあります。

$ uname -a
Linux turbox 4.15.0-92-generic #93-Ubuntu SMP Mon Mar 16 19:44:23 UTC 2020     x86_64 x86_64 x86_64 GNU/Linux

$ lsb_release -a
LSB Version:    core-9.20170808ubuntu1-noarch:security-9.20170808ubuntu1-noarch
Distributor ID: Ubuntu
Description:    Ubuntu 18.04.4 LTS
Release:    18.04
Codename:   bionic

ログによると、これはおそらくNvidiaドライバーの問題ではなく、おそらくdbusに関係しているとは思いません。

根本的な原因は残念ながら見つかりませんでした。

助けを申し出てくれたすべての人に感謝します。

0
alexg

これも17日に食べました。 2枚のnvidiaカードがあったので、私の設定は少し奇妙でした。それらは異なる世代であり、競合する異なるバージョンのドライバーが必要であることがわかりました。

その効果は、両方の画面が明らかに正常に動作しているため、少し動作するように見えたということです。その後、あまりにも多くのウィンドウを開くと、画面が真っ黒になります。

私は両方のカードを空のビットバケットに辞任し、それらを1つのデュアルDVIカードに置き換えることで解決しました。

2

Nvidiaで問題が発生しました。解決方法は次のとおりです。

  1. NvidiaのWebサイト でグラフィックカードの互換性のあるドライバを確認しています
  2. Ctrl + Alt + F3
  3. ログインする
  4. apt-cache search nvidia-
  5. 次に、キーは1つ古いであるドライバーバージョンを選択することでした。 Sudo apt install nvidia-331
  6. 最後に、更新を実行して最新のドライバーを取得します。 Sudo apt update && Sudo apt upgrade -y

それがなぜ多くの問題を解決したのか、私には完全にはわかりません。

1
IT Gremlin