材料准备
安装Anaconda环境包含了python 安装NVIDA显卡驱动 安装CUDA 安装CUDNN 安装TensorFlow 安装pytorch
(资料图片仅供参考)
其他的以后补充
首先确定想要安装的版本,CUDA与显卡驱动对应的版本,TensorFlow-GPU与CUDA cudnn Python版本
先看显卡参数:
1.win+r输入cmd打开命令行,输入nvidia-smi,查看显卡驱动版本,在Linux系统中相同
2.打开显卡控制面板点左下角的系统信息,在信息栏可以看到驱动版本,在组件里可以看到支持的cuda版本
如果需要更新驱动就到官网下载适合自己系统的驱动,在下面这个地址查看自己显卡驱动对应的cuda版本
https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
找到对应的cuda版本和cuDNN版本,然后去下载
cuda版本:https://developer.nvidia.com/cuda-toolkit-archive
cuDNN版本:https://developer.nvidia.com/rdp/cudnn-archive
cuDNN的下载,最新版本需要注册登录,部分archive版本,右键复制链接,粘贴至迅雷即可下载。
下载anaconda
https://www.anaconda.com/download
pytorch需要使用命令安装
https://pytorch.org/get-started/locally/
选择稳定版,我的环境是:cuda=11.4,cudnn=8.2,python=3.10
安装anaconda
1、找到Anaconda*.sh安装包,用 sh 命令执行 .sh 文件,开始安装
2、按回车观看更多许可信息,按 Q 键跳过,是否接受许可条款, 输入yes回车,按提示安装。安装完毕后需要重新打开终端terminal,就会看到base环境在启动时自动激活。
若不想在启动时自动激活base,使用指令 conda config --set auto_activate_base false
重新打开命令窗口就看不到base了,若想恢复,使用 把上面的 false 改为 true
输入 conda -V 和 conda list 分别能看到版本和安装的包
输入python,可以看到python版本和进入python编辑环境
anaconda会自动将环境变量添加到PATH里面,如果后面你发现输出 conda ,提示没有该命令,那么需要添加环境变量
使用 sudo vi ~/.bashrc 在最下面添加 export PATH=/home/用户名/anaconda3/bin:$PATH
更新配置 source ~/.bashrc,若有就不必添加了
创建虚拟环境指令: conda create -n new_env(环境名字) python=3.10(包版本名)创建名为new_env的python3.10的环境
激活虚拟环境:source activate new_env(虚拟环境名称)
查看创建的虚拟环境:conda env list
进入虚拟环境: conda activate new_env (环境名)
退出虚拟环境: conda deactivate
删除虚拟环境:conda remove -n new_env --all
安装显卡驱动
安装显卡驱动之前要禁用nouveau驱动:sudo vim /etc/modprobe.d/blacklist.conf
在文本最后添加: blacklist nouveau 和 options nouveau modeset=0
然后执行:sudo update-initramfs -u
然后重启后,执行以下指令 lsmod | grep nouveau
如果屏幕没有输出,说明禁用nouveau成
到官网下载适合自己的驱动安装。
安装cuda
首先区分cuda的两种API,运行时API(runtime API )和 驱动API(Driver API)
用于支持driver API的必要文件(如libcuda.so)是由GPU driver installer安装的。 nvidia-smi就属于这一类API。
用于支持runtime API的必要文件(如libcudart.so以及nvcc)时由CUDA Toolkit installer 安装的
安装指令:sudo sh cuda_*_linux.run
需要运行一会,配置好的会很快,
提示GCC版本不匹配,重新安装并忽略
点击Versioned Online Documentation链接
点击 Linux安装指南
查看系统的GCC版本,不忽略就升级到所需版本
输入accept同意
若有[X]Drive,将光标移到[X]Driver处,按enter键,取消勾选安装驱动,因为前面已经安装过驱动了。移动光标到 ”Install“ 按 Enter 进行安装。
安装完成后,配置环境变量,使用 sudo vi ~/.bashrc 在最后面加上如下信息
export CUDA_HOME=/usr/local/cuda-11.4
export LD_LIBRARY_PATH=${CUDA_HOME}/lib64export PATH=${CUDA_HOME}/bin:${PATH}
更新配置使其生效 source ~/.bashrc
卸载cuda
cd /usr/local/cuda-11.4/bin/
sudo ./cuda-uninstaller
sudo rm -rf /usr/local/cuda-11.4
cuDNN安装
下载与cuda对应的cuDNN: https://developer.nvidia.com/rdp/cudnn-archive
解压压缩包: tar -zxvf cudnn-11.4-linux-x64-v8.2.4.15.tgz
将cuDNN解压后得到的CUDA目录下的 lib64 和 include 两个文件夹里内容复制到cuda对应的文件夹下
sudo cp lib64/* /usr/local/cuda-11.4/lib64/
sudo cp include/* /usr/local/cuda-11.4/include/
安装完以后,使用:
cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
查看cuDNN版本信息
安装Pytorch GPU版
使用下载页给的链接下载,或者找到版本关系,去镜像网站下载到本地
conda install pytorch torchvision torchaudio pytorch-cuda=11.7 -c pytorch -c nvidia
查看python版本 例如:python=3.10.9
https://pypi.org/project/torchvision/
安装完成后检查是否安装成功:
安装 TensorFlow
https://tensorflow.google.cn/install/pip?hl=zh-cn#system-install
标签: