深度学习环境搭建

来源:哔哩哔哩时间:2023-06-07 09:40:23

搭建深度学习环境

材料准备

安装Anaconda环境包含了python  安装NVIDA显卡驱动  安装CUDA  安装CUDNN  安装TensorFlow  安装pytorch


(资料图片仅供参考)

其他的以后补充

首先确定想要安装的版本,CUDA与显卡驱动对应的版本,TensorFlow-GPU与CUDA cudnn Python版本

先看显卡参数:

1.win+r输入cmd打开命令行,输入nvidia-smi,查看显卡驱动版本,在Linux系统中相同

2.打开显卡控制面板点左下角的系统信息,在信息栏可以看到驱动版本,在组件里可以看到支持的cuda版本

如果需要更新驱动就到官网下载适合自己系统的驱动,在下面这个地址查看自己显卡驱动对应的cuda版本

https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html

找到对应的cuda版本和cuDNN版本,然后去下载

cuda版本:https://developer.nvidia.com/cuda-toolkit-archive

cuDNN版本:https://developer.nvidia.com/rdp/cudnn-archive

cuDNN的下载,最新版本需要注册登录,部分archive版本,右键复制链接,粘贴至迅雷即可下载。

下载anaconda

https://www.anaconda.com/download

pytorch需要使用命令安装

https://pytorch.org/get-started/locally/

选择稳定版,我的环境是:cuda=11.4,cudnn=8.2,python=3.10

安装anaconda

1、找到Anaconda*.sh安装包,用 sh 命令执行 .sh 文件,开始安装

2、按回车观看更多许可信息,按 Q 键跳过,是否接受许可条款, 输入yes回车,按提示安装。安装完毕后需要重新打开终端terminal,就会看到base环境在启动时自动激活。

若不想在启动时自动激活base,使用指令  conda  config  --set  auto_activate_base  false

重新打开命令窗口就看不到base了,若想恢复,使用 把上面的 false 改为 true

输入 conda -V 和 conda list 分别能看到版本和安装的包

输入python,可以看到python版本和进入python编辑环境

anaconda会自动将环境变量添加到PATH里面,如果后面你发现输出 conda ,提示没有该命令,那么需要添加环境变量

使用  sudo  vi ~/.bashrc  在最下面添加 export PATH=/home/用户名/anaconda3/bin:$PATH

更新配置  source ~/.bashrc,若有就不必添加了

创建虚拟环境指令:  conda  create  -n  new_env(环境名字)  python=3.10(包版本名)创建名为new_env的python3.10的环境

激活虚拟环境:source activate new_env(虚拟环境名称)

查看创建的虚拟环境:conda env list

进入虚拟环境: conda activate new_env (环境名)

退出虚拟环境: conda deactivate

删除虚拟环境:conda remove -n new_env --all

安装显卡驱动

安装显卡驱动之前要禁用nouveau驱动:sudo vim /etc/modprobe.d/blacklist.conf   

在文本最后添加: blacklist  nouveau  和 options  nouveau  modeset=0   

然后执行:sudo  update-initramfs -u   

然后重启后,执行以下指令 lsmod  |  grep  nouveau

如果屏幕没有输出,说明禁用nouveau成

到官网下载适合自己的驱动安装。

安装cuda

首先区分cuda的两种API,运行时API(runtime API )和 驱动API(Driver API)

用于支持driver API的必要文件(如libcuda.so)是由GPU driver installer安装的。   nvidia-smi就属于这一类API。

用于支持runtime API的必要文件(如libcudart.so以及nvcc)时由CUDA Toolkit installer 安装的

安装指令:sudo sh cuda_*_linux.run

需要运行一会,配置好的会很快,

提示GCC版本不匹配,重新安装并忽略

点击Versioned Online Documentation链接

点击  Linux安装指南

查看系统的GCC版本,不忽略就升级到所需版本

输入accept同意

若有[X]Drive,将光标移到[X]Driver处,按enter键,取消勾选安装驱动,因为前面已经安装过驱动了。移动光标到  ”Install“ 按 Enter 进行安装。

安装完成后,配置环境变量,使用 sudo vi ~/.bashrc 在最后面加上如下信息

export CUDA_HOME=/usr/local/cuda-11.4

export LD_LIBRARY_PATH=${CUDA_HOME}/lib64export PATH=${CUDA_HOME}/bin:${PATH}

更新配置使其生效  source  ~/.bashrc

卸载cuda

cd /usr/local/cuda-11.4/bin/

sudo ./cuda-uninstaller

sudo rm -rf /usr/local/cuda-11.4

cuDNN安装

下载与cuda对应的cuDNN: https://developer.nvidia.com/rdp/cudnn-archive

解压压缩包: tar -zxvf  cudnn-11.4-linux-x64-v8.2.4.15.tgz

将cuDNN解压后得到的CUDA目录下的 lib64 和 include 两个文件夹里内容复制到cuda对应的文件夹下

sudo  cp  lib64/*   /usr/local/cuda-11.4/lib64/

sudo cp include/* /usr/local/cuda-11.4/include/

安装完以后,使用:

cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2   

查看cuDNN版本信息

安装Pytorch  GPU版

使用下载页给的链接下载,或者找到版本关系,去镜像网站下载到本地

conda install pytorch torchvision torchaudio pytorch-cuda=11.7 -c pytorch -c nvidia

查看python版本 例如:python=3.10.9

https://pypi.org/project/torchvision/

安装完成后检查是否安装成功:

安装 TensorFlow

https://tensorflow.google.cn/install/pip?hl=zh-cn#system-install

标签:

责任编辑:FD31
上一篇:长信长金通货币D基金暂停大额申购
下一篇:环球新消息丨重生:第33章 走读申请还要考试

热点图集

最近更新

信用中国

  • 信用信息
  • 行政许可和行政处罚
  • 网站文章