web-dev-qa-db-ja.com

エラー:NVIDIAドライバと通信できなかったため、NVIDIA-SMIが失敗しました

NVIDIA-SMIはこのエラーを投げています:

NVIDIA-SMIは、NVIDIAドライバーと通信できなかったため失敗しました。最新のNVIDIAドライバーがインストールされ、実行されていることを確認してください

NVIDIAを削除し、前述の手順に従って再度インストールしました here

私のデバイスの仕様は次のとおりです。

  • Tesla M40を搭載したサーバー
  • Ubuntu 16.04で実行する
  • カーネルバージョンLinux 4.4.0-116-generic x86_64
  • ドライバー:nvidia-384

誰かがエラーの解決を手伝ってくれますか?

7

試して

  1. here からドライバーをダウンロードします
  2. Sudo apt-get purge nvidia*-現在のインストールを削除するには
  3. dpkg -i nvidia-diag-driver-local-repo-ubuntu1604_375.66-1_AMD64.deb-以前にダウンロードしたものをインストールする
  4. Sudo apt-get update
  5. Sudo apt-get install cuda-drivers

この後、続けてコンピューターを再起動します。再び起動すると、nvidia-smiコマンドはスムーズに実行されるはずです

4
bluesummers

この問題は、4.4.0-116パッチで確認された「バグ」が原因である可能性があります。私はnvidia-390で同じ問題に遭遇しました。それでも新しいバージョンのNvidia-driverを使用したい場合は、指示 here に従って問題を解決しました。一般に、次の手順を使用します。

  1. デスクトップにログインできず、フェイルループに陥る場合は、 ctrl + alt + F1 コマンドラインモードにログインします。
  2. Gccのバージョンが古いかどうかを確認し、古い場合は更新します:gcc --version
  3. Gccバージョンが5以降の場合、最初にnvidiaドライバーをアンインストールします:Sudo apt-get remove nvidia-390
  4. 4.4.0-116カーネルを削除します:Sudo apt-get purge linux-headers-4.4.0-116 linux-headers-4.4.0-116-generic linux-image-4.4.0-116-generic linux-image-extra-4.4.0-116-generic linux-signed-image-4.4.0-116-generic
  5. カーネルを再インストールします:Sudo apt-get install linux-generic linux-signed-generic
  6. Nvidia-390を再インストールします:Sudo apt-get install nvidia-390
  7. 問題がmodinfo nvidia-390 -k 4.4.0-116-generic | grep vermagicによって解決されたかどうかを確認し、retpolineが今回表示されることを確認します
  8. 再起動:Sudo reboot

これがあなたと同じ問題に出くわす他の人々に役立つことを願っています。フォーラムの投稿は私の週末を救った。

6
Rex Wang