I am Charmie

メモとログ

Nvidiaのドライバを間違えてupgradeしちゃった時の対処

3行で

  • nvidiaのドライバを削除
  • cuda関係のファイルを削除
  • 再インストール

経緯

ubuntuのパッケージマネージャでupgradeをした時に,nvidiaのドライバをupgradeしてしまったっぽく,pytorchでcudaを使った処理ができなくて困った.
(実は未だに)状況を完全に把握していないんだけど,cuDNNとDriverの整合性の問題なのかな?

対処

ここに書いてある方法でいける.

インストール済みドライバ・ファイルの削除

  • conda uninstall pytorch torchvision
  • sudo apt purge nvidia-*
  • sudo apt purge cuda-*
  • sudo apt autoremove

ドライバ・ファイルの再インストール

pytorchの再インストール

  • conda install pytorch torchvision cudatoolkit=10.0 -c pytorch

PyTorchのインストール中にcuDNN7.5.1でコンパイルしてあるバイナリがインストールされていて一瞬焦ったけど,cuDNN7.6.1でも問題なく動いている.