抱歉,您的浏览器无法访问本站
本页面需要浏览器支持(启用)JavaScript
了解详情 >

安装CUDA

安装

首先去英伟达官网下载cuda安装包:https://developer.nvidia.com/cuda-toolkit-archive

https://i.loli.net/2021/05/19/bx9B3RXCzMOQy8G.png

https://i.loli.net/2021/05/19/d2BcPO7DxnWltaN.png

踩坑:这里最好不要使用deb的安装,推荐使用runfile

我最初在使用deb的安装时,在最后一步

1
sudo apt-get -y install cuda

中,得到了depends: cuda-11-3 (>= 11.3.0) but it is not going to be installed site:forums.developer.nvidia.com的错误,而这个错误并没有得到良好的解决方案。

我在搜索资料后推测是由于本身已经安装了nvidia-driver所导致的结果,而英伟达的cuda本身已经自带了驱动(这是一件很奇怪的事情)。

因此我推荐runfile的安装,我在此安装成功。

1
2
wget <https://developer.download.nvidia.com/compute/cuda/11.3.0/local_installers/cuda_11.3.0_465.19.01_linux.run>
sudo sh cuda_11.3.0_465.19.01_linux.run

需要注意的是,在执行sudo sh cuda_11.3.0_465.19.01_linux.run时,最好使用sudo sh cuda_11.3.0_465.19.01_linux.run -no-opengl-libs

cuda主要有以下参数:

  • -no-opengl-libs:表示只安装驱动文件,不安装OpenGL文件。必需参数,原因同上。注意:不是no-opengl-files
  • -uninstall (deprecated):用于卸载CUDA Driver(已废弃)。
  • -toolkit:表示只安装CUDA Toolkit,不安装DriverSamples
  • -help:查看更多高级选项。

安装过程中的坑

首先会有一个阅读声明,一直滑到底部输入accept即可。我遇到了无法滑到底部的情况,也就是不能输入accpet。

解决:

使用init 3关闭图形界面即可。

选项

选项install nvidia accelerated Graphics Driver,输入n,因为我们已经安装了nvidia的驱动。

选项install the OpenGL libraries,如果双显卡(集显+独显)选择n,如果只有独显可以选择y,如果双显卡选择y的话,会出现黑屏或者循环登录的问题,如果加了上面的参数就不会出现这个选项了。

后面的可以都选择yes,最后一个选项我们可以选择n,也就是不复制Samples,因为安装目录下有samples

之后install等待安装结束即可

此时使用startx重新进入图形界面。

配置环境

终端编辑/etc/profile或者.bashrc

1
2
3
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-11.3/lib64
export PATH=$PATH:/usr/local/cuda-11.3/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-11.3

运行source /etc/profile或者source .bashrc

安装cuDNN

Installing from a Tar File

1.Navigate to your directory containing the cuDNN Tar file.

2.Unzip the cuDNN package.

1
tar -xzvf cudnn-9.0-linux-x64-v7.tgz

3.Copy the following files into the CUDA Toolkit directory, and change the filepermissions.

1
2
3
sudo cp cuda/include/cudnn*.h /usr/local/cuda/include #此处我和官方文档不同
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

使用cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2可以查看版本

网上的cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2这个操作显然在官方文档的操作下是不行的。

安装pytorch

conda使用一个正确的环境,不然会默认安装在base上

https://pytorch.org/get-started/locally/ 选择正确的方案即可,如:

1
conda install pytorch torchvision torchaudio cudatoolkit=11.1 -c pytorch -c nvidia

评论