web-dev-qa-db-ja.com

RAPIDS / Docker:機能付きのデバイスドライバを選択できませんでした:[[gpu]]

私は急流に慣れていて、めったにcondaで良い経験を持っていました。だから私はコンテナ化されたバージョンで働きかけようとしています。私はDockerの新たなものであり、未知の組み合わせは私に物事を並べ替えることができません。

私はUbuntu 18.04サーバーを持っています、

_# uname -v
#30~18.04.1-Ubuntu SMP Fri Jan 17 06:14:09 UTC 2020
_

私はドッカーの新鮮なバージョンをインストールしました

_# apt-get install docker docker-ce docker-ce-cli containerd.io
# docker --version
Docker version 19.03.8, build afacb8b7f0
_

このマシンにはCUDA V10.2が設置されています

_# nvcc --version
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2019 NVIDIA Corporation
Built on Wed_Oct_23_19:24:38_PDT_2019
Cuda compilation tools, release 10.2, V10.2.89
_

Python v3.6.9

_# python3 --version
Python 3.6.9
_

NVIDIAコンテナツールキットQuickStart セクションに示すように、nvidia-dockerリストを/etc/apt/sources.list.d/にインストールします。

_# curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | Sudo apt-key add -
# curl -s -L https://nvidia.github.io/nvidia-docker/ubuntu18.04/nvidia-docker.list | Sudo tee /etc/apt/sources.list.d/nvidia-docker.list
_

それ以来、$(somecode)_ubuntu18.04_ UbuntuはLinux Mint 19.3 で同じです。

Rapids - Open GPUデータサイエンス の開始( - === - )、0.13-CUDA10.2-runtime-ubuntu18.04-py3を引いた.6実行時。

_# docker pull rapidsai/rapidsai:0.13-cuda10.2-runtime-ubuntu18.04-py3.6
_

長い時間、そして後で数GBはすべて問題ないようでした。 (警告やエラーメッセージはありません。)さらに、画像がDockerに登録されているように見えます。

_# docker images -a
REPOSITORY          TAG                                       IMAGE ID            CREATED             SIZE
rapidsai/rapidsai   0.13-cuda10.2-runtime-ubuntu18.04-py3.6   c7440af853b5        4 days ago          9.26GB
rapidsai/rapidsai   cuda10.2-runtime-ubuntu18.04-py3.6        c7440af853b5        4 days ago          9.26GB
_

ただし、次にノートブックサーバーの起動を試みました。

_# docker run --gpus all --rm -it -p 8888:8888 -p 8787:8787 -p 8786:8786 \
       rapidsai/rapidsai:cuda10.0-runtime-ubuntu18.04-py3.6
docker: Error response from daemon: could not select device driver "" with capabilities: [[gpu]].
_

GTX 1080 Ti GPUが検出されたため、これは驚くべきようなようです

_# nvidia-smi
Fri May  8 16:41:57 2020       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 440.33.01    Driver Version: 440.33.01    CUDA Version: 10.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce GTX 108...  On   | 00000000:08:00.0 Off |                  N/A |
| 21%   38C    P8    10W / 250W |      1MiB / 11178MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+
|   1  GeForce GTX 108...  On   | 00000000:42:00.0 Off |                  N/A |
| 23%   42C    P8    10W / 250W |      1MiB / 11177MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|  No running processes found                                                 |
+-----------------------------------------------------------------------------+
_

物事を清掃した後

_# docker system Prune -a
# apt-get purge docker docker-engine docker.io containerd runc    
_

私はDockerを再インストールしてRapidSaiイメージを再び引きました。結果は変わりませんでした。

NVIDIAドライバのバージョンとの衝突はありますか?440.33.01?

助言がありますか?

4
user3897315

から NVIDIA CUDA/WSL 2マニュアル

Dockerインストールスクリプトを使用して、WSL 2 Linuxディストリビューションの選択用のDockerをインストールします。 NVIDIAコンテナツールキットはまだサポートされていません Docker Desktop WSL 2 バックエンド。

1
strarsis

私はちょうどこのステップの手順に従った pdf ;そしてそれはうまく機能します:

以前のNVIDIA-Dockerパッケージをアンインストールするには、次のコマンドを発行します。

[user@gpu1 ~]# docker volume ls -q -f driver=nvidia-docker | xargs -r -I{} -n1 docker ps -q -a -f volume={} | xargs -r docker rm –f
[user@gpu1 ~]# Sudo apt-get remove nvidia-docker
 _

NVIDIA-GPU Dockerコンテナツールキットをインストールするには、まずパッケージリポジトリを追加する必要があります。

user@ubuntu-gpu1:~# distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
user@ubuntu-gpu1:~# curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | Sudo apt-key add -
user@ubuntu-gpu1:~# curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | Sudo tee /etc/apt/sources.list.d/nvidia-docker.list
user@ubuntu-gpu1:~# Sudo apt-get update && Sudo apt-get install -y nvidia-container-toolkit
user@ubuntu-gpu1:~# Sudo systemctl restart docker
 _

その後、最新の公式CUDAイメージでNVIDIA-SMIインストールを確認します。

user@ubuntu-gpu1:~# Sudo docker run -it --rm --gpus all nvidia/cuda:9.0-base nvidia-smi
 _
0
Walid Bousseta