ここで、ここ数日のNvidiaの問題について説明します。Nvidiaドライバーの問題の診断を誰かが手伝ってくれることを願っています。
背景
TL; DR
一部のaptパッケージ(壊れた依存関係の問題)をシャッフルした後、Ubuntu 17でこの問題が発生し始めましたが、しばらくの間nouveauドライバーでこの問題を回避し、18.04バイオニックにアップグレードしました。残念ながら、何が原因なのか正確にはわかりません。
ロングバージョン:
nvidia-340
パッケージを使用していました。ppa:graphics-drivers/ppa
リポジトリからドライバーを再インストールしてみました。結果は常に同じでした。nvidia-340
パッケージを再インストールしました。 (私は最初にnouveauドライバーをmodprobe構成でブラックリストに登録してアンインストールしました。)今、これを行うシステムが残っています:
Ubuntuのスプラッシュ画面の直後に最初にNvidiaのロゴが表示され、次にgdm3
が起動します。Unityまたはgnomeにログインすると、黒い画面が表示されます。マウスポインターがまったく表示されません。 Alt-F3でテキストコンソールにアクセスすると、ログインしてgdm3
サービスまたはgdm
サービスを再起動できます。これを十分に行うと、ある時点でシステムが突然正常に動作し始め、Unityまたはgnomeにログインできるようになります。時々、ログイン画面でコンピューターをそのままにしておくと、次のリブートまで修正されますこれは、何年も使用していなかったドライバーが問題、まだ私のシステムと互換性があります。 BIOS設定を変更していません。作業中の/etc/X11/xorg.conf
ファイルを/usr/share/X11/xorg.conf.d/20-nvidia.conf
にコピーしましたが、何も変更されませんでした。 nvidia-xconfig
を使用してファイルを再作成してみましたが、動作しますが、再起動後も問題は同じです。グラフィックスが統合されたCPUを持っていないので、これは問題ではありません。
関連がある場合に備えて、ここに私のシステムに関するいくつかの情報があります:
$ uname -a
Linux turbox 4.15.0-70-generic #79-Ubuntu SMP Tue Nov 12 10:36:11 UTC 2019 x86_64 x86_64 x86_64 GNU/Linux
$ lsb_release -a
LSB Version: core-9.20170808ubuntu1-noarch:security-9.20170808ubuntu1-noarch
Distributor ID: Ubuntu
Description: Ubuntu 18.04.3 LTS
Release: 18.04
Codename: bionic
$ ubuntu-drivers devices
== /sys/devices/pci0000:00/0000:00:02.0/0000:01:00.0 ==
modalias : pci:v000010DEd00000A65sv00000000sd00000000bc03sc00i00
vendor : NVIDIA Corporation
model : GT218 [GeForce 210]
manual_install: True
driver : nvidia-340 - distro non-free recommended
$ prime-select query
nvidia
$ Sudo lshw -c video
*-display
description: VGA compatible controller
product: GT218 [GeForce 210]
vendor: NVIDIA Corporation
physical id: 0
bus info: pci@0000:01:00.0
version: a2
width: 64 bits
clock: 33MHz
capabilities: pm msi pciexpress vga_controller bus_master cap_list rom
configuration: driver=nvidia latency=0
resources: irq:26 memory:fb000000-fbffffff memory:c0000000-cfffffff memory:de000000-dfffffff ioport:ef00(size=128) memory:c0000-dffff
$ nvidia-smi
Wed Nov 20 12:01:15 2019
+------------------------------------------------------+
| NVIDIA-SMI 340.107 Driver Version: 340.107 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 GeForce 210 Off | 0000:01:00.0 N/A | N/A |
| N/A 50C P0 N/A / N/A | 630MiB / 1023MiB | N/A Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Compute processes: GPU Memory |
| GPU PID Process name Usage |
|=============================================================================|
| 0 Not Supported |
+-----------------------------------------------------------------------------+
$ lsmod | grep nvidia
nvidia 10559488 198
drm 401408 10 nvidia
$ echo $XDG_SESSION_TYPE
x11
$ gnome-Shell --version
GNOME Shell 3.28.4
私の質問:
コンソールアクセス(および通常はグラフィカルアクセス)があるので、これの原因を特定するために何かできることはありますか?したくない私のシステムとそのすべてのソフトウェアを再インストールします。グラフィック環境が明らかに時々正常に機能するため、起動後に予測できないほどです。
journalctl -k
を確認し、疑わしいと思われるエラーをグーグルで検索しましたが、解決策や有用なヒントはまだ見つかりません。
どんなアイデアでも大歓迎です。ありがとう!
編集:ここにいくつかの詳細があります:再起動するたびに、仮想コンソールにログインしてこれを修正しようとしましたが、一見ランダムな時間に、起動後約5分で、画面が点滅して表示されますテキストコンソールから離れてログイン画面(デスクトップマネージャー)に移動します。何かがクラッシュして再起動したように見えますが、それが何であるかはわかりません。これは私がすることとは何の相関もないようです。この後、問題なくログインできます。現時点では、それは私にとって実際の問題というよりは厄介なものですが、それでもややイライラします。これらをデバッグする方法があるはずだと思います。
EDIT2: Xorgログに次のエントリが表示されます。
[ 926.271] (II) systemd-logind: got pause for 13:68
[ 926.272] (II) systemd-logind: got pause for 226:0
[ 926.272] (II) systemd-logind: got pause for 13:65
[ 926.272] (II) systemd-logind: got pause for 13:69
[ 926.272] (II) systemd-logind: got pause for 13:67
[ 926.272] (II) systemd-logind: got pause for 13:64
[ 926.272] (II) systemd-logind: got pause for 13:66
これらのエラーをウェブで見ると、多くの人がログイン画面で非決定的な問題を経験していることがわかります。 systemd-logind
やおそらくdbus
と関係があるようですが、残念ながら私には何がわかりません。うまくいけば、Linuxの知識が豊富な人が手伝ってくれるでしょうか?
数か月後ですが、理由はわかりませんが、問題は解決しました。おそらく最新のシステムアップデートのいずれかが原因です。
その間、シャットダウンではなくサスペンドを使用してきました。再起動する必要があるときはいつでも、ログイン画面が表示され、ログイン後は、マウスカーソルとTeamViewerウィンドウが他の黒い画面に表示され、別のメッセージが表示されます。タスクバーにアイコンを配置できないこと(タスクバーが存在しなかったため)。私が待っていた場合、ランダムな時間(通常は約10〜30分)が経過した後、マシンに突然ログイン画面が表示されます。これが発生すると、再度ログインできます。
しかし、最初にログインした後、黒い画面に(以前と同様に)TeamViewerが表示され、タスクバーについてのメッセージも表示されますが、約1分後にデスクトップが表示されます。マシンを再起動する必要はほとんどないので、1分ほど待ってもかまわないので、これははるかに優れています。
最近のアップデートの1つで問題が解決したか、少なくともそれほど深刻ではなくなったと思います。システムは現在次の場所にあります。
$ uname -a
Linux turbox 4.15.0-92-generic #93-Ubuntu SMP Mon Mar 16 19:44:23 UTC 2020 x86_64 x86_64 x86_64 GNU/Linux
$ lsb_release -a
LSB Version: core-9.20170808ubuntu1-noarch:security-9.20170808ubuntu1-noarch
Distributor ID: Ubuntu
Description: Ubuntu 18.04.4 LTS
Release: 18.04
Codename: bionic
ログによると、これはおそらくNvidiaドライバーの問題ではなく、おそらくdbusに関係しているとは思いません。
根本的な原因は残念ながら見つかりませんでした。
助けを申し出てくれたすべての人に感謝します。
これも17日に食べました。 2枚のnvidiaカードがあったので、私の設定は少し奇妙でした。それらは異なる世代であり、競合する異なるバージョンのドライバーが必要であることがわかりました。
その効果は、両方の画面が明らかに正常に動作しているため、少し動作するように見えたということです。その後、あまりにも多くのウィンドウを開くと、画面が真っ黒になります。
私は両方のカードを空のビットバケットに辞任し、それらを1つのデュアルDVIカードに置き換えることで解決しました。
Nvidiaで問題が発生しました。解決方法は次のとおりです。
apt-cache search nvidia-
Sudo apt install nvidia-331
Sudo apt update && Sudo apt upgrade -y
それがなぜ多くの問題を解決したのか、私には完全にはわかりません。