web-dev-qa-db-ja.com

CUDAがインストールされたNVIDIAドライバーが原因の可能性があるログインループ

数日前、Ubuntu 16.04でSudo apt update + upgradeを実行しました。私は約2ヶ月間そうしていませんでした。その間に、グラフィックカードをGTX 1060からGTX 1070に変更しました。

今日、ログインしようとしたときに、迷惑な無限ログインループに入ったことがわかりました。これは私のxsessions-errorsログの内容です:

X Error of failed request:  BadWindow (invalid Window parameter)
  Major opcode of failed request:  155 (NV-GLX)
  Minor opcode of failed request:  4 ()
  Resource id in failed request:  0x3d0
  Serial number of failed request:  46
  Current serial number in output stream:  46
openConnection: connect: No such file or directory
cannot connect to brltty at :0
[...]

これに対する有望な答えを見て question 、私は次のことを試しました:

  1. rootではなく、.Xauthorityの所有権を確認します(私に属します)
  2. lightdmを再構成する
  3. lightdmを再インストールします
  4. /home/がいっぱいかどうかを確認します(使用率は44%です)

すべて失敗しました。それから、私は自分の問題がNVIDIAドライバーの更新にあると信じ始めました。さまざまなWebサイトで複数のソースを読み、それが一般的な問題であると説明しました。 ./profileなどに最近変更を加えたわけではなく、私の人生でstartxコマンドを実行したことはありません。

NVIDIAドライバーを中心にした私の問題に対するこれらの潜在的な解決策を見つけました。

  • 提案されたnvidia-currentドライバ(NVIDIAがサポートする最新のものより古い)をインストール here ;
  • 提案どおりnvidia-installer.shを実行してNVIDIAドライバーを再インストールします here ;

私の問題は、コンピューター上でNVIDIAドライバーとさまざまなパッケージとの微妙なバランスで、CUDAの構成に数十時間を費やしたことです。 CUDAをインストールするには、特定のUbuntuカーネルバージョン(4.4)もインストールする必要がありました。

ドライバーに触れると、CUDA環境が壊れる可能性はありますか?実際に問題を修正しようとすることができる他のものはありますか?

1
raggot

私と同じ問題に直面している他の人には、次のことを試してみることをお勧めします。

mv .Xauthority .Xauthority-backup

.Xauthorityの名前を変更し、次回のログイン試行で新しいものを強制的に作成します。問題が発生した場合、ログインは機能します。

しかし、私の場合、実際に機能していたのは、NVIDIAドライバーを再インストールすることでした。 CUDAのユーザーの場合、インストールする必要のあるドライバーバージョンは documentation で定義されます。私の場合、CUDA 9.1があったので、少なくともドライバーバージョン390.46です(もちろん、この答えを書いた瞬間によると)。

このWebサイト にある指示に従って、必要なドライバーを(再)インストールしました。実際、モデレーターが書いた CUDAフォーラム からもこの投稿を見つけました。NVIDIAによって公式にリリースされていないため、ドライバーにこのソースを使用した経験が常に機能しない場合があることを説明しています。私の場合、それはまだ機能していたので、共有します。

まず、インストールされているNVIDIAドライバーを削除します。

Sudo apt-get purge nvidia*

グラフィックスドライバーのリポジトリを追加します。

Sudo add-apt-repository ppa:graphics-drivers/ppa
Sudo apt update

次に、正しいバージョンのドライバーをインストールします(私の場合、xxx = 390)

Sudo apt install nvidia-xxx

そして最後に

reboot

これでログインの問題は解決するはずです。私の場合、CUDA環境は影響を受けず、プロジェクトはすべて正常に実行されました。

0
raggot

解決策は、ドライバーを再インストールし、lightdmも再構成することです。最悪の場合、CUDAを再度インストールする必要がありますが、最初にnvidia(シェルスクリプト)からインストーラーをダウンロードしてドライバーを再インストールしてください。

ドライバーに触れると、CUDA環境が壊れる可能性はありますか?実際に問題を修正しようとすることができる他のものはありますか?

必ずしも。ドライバーが配置されている限り。 nvccは適切に機能するはずです。

0
Pradeep Kumar