UbuntuでCUDAの削除から再インストールまでのメモ

エンジニア

CUDAのインストールに失敗した場合、またバージョンを変更したい場合は多々あります。

UbuntuでCUDAの削除から再インストールまで実施しました。

自身への忘備録・覚書含めて、ブログ記事として紹介します。

 

スポンサーリンク

UbuntuでCUDAの削除から再インストールまでのメモ

UbuntuでCUDAのバージョン変更をしたく、削除から再インストールまで実施しました。

実施した環境としては下記です。

  • Ubuntu18.04
  • CUDA Toolkit 11.0→11.3

 

CUDAはapt-getやdockerにも絡んでいたりして、綺麗に削除するのが難しいです。

色々なサイトを参考にさせていただいて、再インストールまで対応しました。

忘備録含めてブログ記事として紹介します。あくまで一例なので参考までにお願いします。

 

グラフィックボードはGTX1650

使用しているグラフィックボードに関してはGTX1650となります。

補助電源無しで取り付けやすく、そこそこの性能を出してくれるGPUです。

下記記事でGTX1650を搭載した内容を紹介しています。(リンク先はこちら)

グラボの補助電源なしのメリット!玄人志向のGTX1650編

グラボの補助電源なしのメリット!玄人志向のGTX1650編
玄人志向のGTX1650を購入して、市販のデスクトップPCに取り付けてみました。 補助電源無しのタイプですので、グラフィックボードを挿し込むだけで動作可能です。 購入から取り付け、ドライバのインストールまでの流れを紹介します。

 

CUDAを削除・アンインストール

CUDAを一度は入れてしまった場合は、削除・アンインストールします。

 

参考にさせていただいた記事は下記です。

 https://qiita.com/harmegiddo/items/86b295ccf96eff489e02

 

apt-listを確認して不必要なものは外しておく

上記の削除対応しても、apt-listには古いCUDAの環境が残っているケースがあります。

リストを確認して、不必要なパッケージは/etc/apt/sources.list から外す・削除した方が良いです。

 

後で「apt-get update」する際に不要なものもアップデートしてしまうためです。

(筆者の場合、リストの中に古い環境の11-0が残っていました)

 

dockerの不要なイメージも削除しておく

dockerにもcudaのruntimeなど使っている人は古いイメージを消しておきます。

筆者の場合、11.0.3が古い環境でした。

 

イメージ削除する場合は docker rmi [IMAGE ID]で削除できます

それでも削除できなかったものは、docker rmi -f [REPOSITORY ]:[TAG]で対応出来ました。

 

参考にさせていただいた記事は下記です。

 https://scribble.washo3.com/docker-cannot-image.html

 

新しいCUDA Toolkit をインストール

今回はCUDA Toolkit 11.3をインストールします

CUDA Toolkit 11.3 Downloads
Resources CUDA Documentation/Release NotesMacOS Tools Training Sample Code Forums Archive of Previous CUDA Releases FAQ Open Source PackagesSubmit a Bug

 

下記のコマンドに関しては、あくまでUbuntu18.04 + CUDA Toolkit 11.3の場合です。

上記のダウンロードのページに記載している内容です。

インストールする環境によって異なります。必ずCUDAのダウンロードページをご確認下さい。

 

インストール後にはホームディレクトリで環境変数を追加しておきます。

sudo vim ~/.bashrc

 

再起動して nvidia-smi や nvcc -V で正常にインストールされているか分かります。

 

 

新しいcuDNNをインストールする

NVIDIAのダウンロードサイトから新しいcuDNNもダウンロード・インストールしておきます。

https://developer.nvidia.com/rdp/cudnn-download

 

参考にさせていただいた記事は下記です。

 https://www.kkaneko.jp/tools/ubuntu/ubuntu_cudnn.html

 

もしcuDNNの動作テストをする場合はMNISTを動かしてみます。

 

参考にさせていただいた記事は下記です。

 https://qiita.com/tatsuya11bbs/items/3af03e704812b6c89965

 

NVIDIA-Container-Toolkitをインストールする

docker上でNVIDIAを使う場合は、コンテナへのToolkitもインストールします。

恐らくインストールしないと、dockerで動かすとき下記のようなエラーが出ます

docker: Error response from daemon: could not select device driver "" with capabilities: [[gpu]].

 

nvidia-container-cli info で正常にインストールされたか確認できます

 

まとめ

Ubuntu上でのCUDAの削除・再インストールが出来ました。

インストールに失敗した場合、またバージョンを変更したい場合は多々あります。

是非皆さまも試してみて下さい。

 

コメント