MorningAI

首页

目录

深度学习

操作系统

目前只支持Windows10 专业版 64位 操作系统,版本号22H2

系统镜像选择

创建实例或者重装系统,选择深度学习,Windows
image.png#784px #346px

预装工具

显卡驱动,PyCharm,VS Code,百度网盘,Anaconda

远程连接

默认RDP连接

下载RDP文件,本地系统是windows直接双击这个rdp文件,mac在App Store下载windows app 然后双击文件,输入密码连接,详见
Windows连接方式
如果本机系统是windows也可以直接打开远程桌面连接,输入上图的信息主机/用户名/密码连接,如下图
image.png#481px #326px

向日葵或者Todesk 其他远程工具

系统的下载目录有 向日葵和Todesk的安装程序,可以自行安装设置

深度学习环境使用

本站默认通过Anaconda管理环境,conda安装环境更方便,隔离性更好
默认已经安装两个环境,cuda是装在conda的env里面的
torch2.4_cuda11.8 : PyTorch版本是2.4,python版本是3.10, cuda11.8
torch2.4_cuda12.1: PyTorch版本是2.4,python版本是3.10, cuda12.1

conda命令行

要打开Conda命令行,需要以管理员身份运行Window PowerShell
image.png#766px #303px

Anaconda Navigator图像界面

打开桌面上的应用程序 Anaconda Navigator,具体使用方法,就是打开环境,打开环境命令行,创建环境,删除环境等
2138e881779f21525c3e4bce082f2abc.jpg#603px #358px

选择环境

如果没有用过Anaconda , 建议先花几分钟去看一下官方的介绍和文档,助于理解虚拟环境的概念
选择python运行环境

查看显卡利用率

windows的任务管理

在windows系统的任务栏,点右键,打开列表如下图,点击任务管理器
image.png#697px #438px
打开任务管理器之后,依次点击,性能,GPU
可以初步检查GPU的使用情况,但是这个不是很准,而且如是用的A100计算卡,在这里看不到
建议需要更准确详细的信息,用Windows Power Shell执行nvidia-smi查看,下文会详细说明
下图的任务管理器,GPU运行情况主要关注利用率和专用GPU内存利用率
image.png#552px #574px

Windows Power Shell 查看GPU利用率

首先通过搜索,打开PowerShell, 需要以管理员身份运行,如下图
image.png#656px #564px
打开Power Shell之后,执行命令 nvidia-smi查看
可以输入以下命令执行2秒刷新监控结果

while ($true) { nvidia-smi; Start-Sleep -Seconds 2; Clear-Host }

主页看显存占用Memor-Usage, GPU利用率GPU-Util ,还有当前使用GPU的进程数据Processes
image.png#562px #420px

常见问题

程序运行没用上GPU

1、先查看利用率和显存占用多少,如果利用率为0,显存有明显的占用,并且nvidia-smi看进程有,可能是程序在推理或者预处理阶段
2、如果利用率为0,显存也没占用,这个时候就要一步步分析问题了
第一步:conda环境选对了吗?pytorch可以执行简单的代码测试
项目内新建test.py文件,输入以下代码,点击运行查看,如果以下代码第二行输出为false,则可能conda环境没选择好

import torch
torch.cuda.is_available()
print(torch.__version__)

第二步:如果以上代码输出为true, 说明GPU环境是正常的,请测试debug你的业务代码,来定位原因