深度学习
操作系统
目前只支持Windows10 专业版 64位 操作系统,版本号22H2
系统镜像选择
创建实例或者重装系统,选择深度学习,Windows
预装工具
显卡驱动,PyCharm,VS Code,百度网盘,Anaconda
远程连接
默认RDP连接
下载RDP文件,本地系统是windows直接双击这个rdp文件,mac在App Store下载windows app 然后双击文件,输入密码连接,详见
Windows连接方式
如果本机系统是windows也可以直接打开远程桌面连接,输入上图的信息主机/用户名/密码连接,如下图
向日葵或者Todesk 其他远程工具
系统的下载目录有 向日葵和Todesk的安装程序,可以自行安装设置
深度学习环境使用
本站默认通过Anaconda管理环境,conda安装环境更方便,隔离性更好
默认已经安装两个环境,cuda是装在conda的env里面的
torch2.4_cuda11.8 : PyTorch版本是2.4,python版本是3.10, cuda11.8
torch2.4_cuda12.1: PyTorch版本是2.4,python版本是3.10, cuda12.1
conda命令行
要打开Conda命令行,需要以管理员身份运行Window PowerShell
Anaconda Navigator图像界面
打开桌面上的应用程序 Anaconda Navigator,具体使用方法,就是打开环境,打开环境命令行,创建环境,删除环境等
选择环境
如果没有用过Anaconda , 建议先花几分钟去看一下官方的介绍和文档,助于理解虚拟环境的概念
选择python运行环境
查看显卡利用率
windows的任务管理
在windows系统的任务栏,点右键,打开列表如下图,点击任务管理器
打开任务管理器之后,依次点击,性能,GPU
可以初步检查GPU的使用情况,但是这个不是很准,而且如是用的A100计算卡,在这里看不到
建议需要更准确详细的信息,用Windows Power Shell执行nvidia-smi查看,下文会详细说明
下图的任务管理器,GPU运行情况主要关注利用率和专用GPU内存利用率
Windows Power Shell 查看GPU利用率
首先通过搜索,打开PowerShell, 需要以管理员身份运行,如下图
打开Power Shell之后,执行命令 nvidia-smi查看
可以输入以下命令执行2秒刷新监控结果
主页看显存占用Memor-Usage, GPU利用率GPU-Util ,还有当前使用GPU的进程数据Processes
常见问题
程序运行没用上GPU
1、先查看利用率和显存占用多少,如果利用率为0,显存有明显的占用,并且nvidia-smi看进程有,可能是程序在推理或者预处理阶段
2、如果利用率为0,显存也没占用,这个时候就要一步步分析问题了
第一步:conda环境选对了吗?pytorch可以执行简单的代码测试
项目内新建test.py文件,输入以下代码,点击运行查看,如果以下代码第二行输出为false,则可能conda环境没选择好
第二步:如果以上代码输出为true, 说明GPU环境是正常的,请测试debug你的业务代码,来定位原因