晨涧云文档

首页

目录

Wan2.2文生视频显卡性能测试

晨涧云AI算力租赁平台支持ComfyUI Wan2.2的云容器镜像。
Wan 2.2(通义万相2.2)是最近非常火的文生视频的大模型。
ComfyUI支持各种模型应用,提供了预置的一些工作流的模板,用户也可以自己创建工作流,或者导入已有的工作流。最新版ComfyUI的预置模板里面已经包含了多个Wan2.2模型的应用:
ComfyUI-Wan模板.png#850px #400px
这里基于ComfyUI的预置工作流模板来测试Wan2.2的模型在3090和4090两张显卡下文生视频的效率。

云容器 租用 Wan-ComfyUI 镜像分别创建 3090 和 4090 的显卡实例进行测试。

选择工作流

这里我们选择Wan2.2预置的第一个模板 Wan2.2 14B T2V 测试14B模型的文生视频应用。打开后工作流是长这样的:

ComfyUI-Wan工作流.png#1000px #480px

点击 「运行」,会生成一个5秒的视频,然后我们写一个Python脚本来调用ComfyUI的API,通过工作流自动生成视频,并通过多次调用取平均的方式来统计比较3090和4090执行性能的差异,以及对显卡资源的占用情况。

3090测试

3090-ComfyUI-Wan测试结果.png#800px #600px

4090测试

4090-ComfyUI-Wan测试结果.png#800px #600px

测试结果解释

3090和4090两张显卡的显存使用和GPU利用率都比较接近;3090生成5秒视频的平均耗时在142秒左右,4090的平均耗时在59秒左右,4090生成视频的速度是3090的2.4倍


上面是24G显存的两张显卡的性能对比,下面测试A100 40G4090 48G这两张显存较大的显卡在Wan文生视频场景的性能对比。

A100 40G测试

A100-40G-ComfyUI-Wan测试结果.png#800px #600px

4090 48G测试

4090_48G-ComfyUI-Wan测试结果.png#800px #600px

测试结果解释

A100 40G和4090 48G两张显卡的平均耗时都要明显优于4090 24G,得益于两张显卡都有比较充足的显存,显存占用比4090 24G有明显提升;

比较A100 40G和4090 48G的性能表现,显卡资源占用方面,4090 48G有更富足的显存空间,平均占用在38G显存,A100平均显存占用32G,GPU利用率4090 48G也高于A100 40G,这个场景下4090 48G的算力使用更为充沛。

生成5s视频,A100 40G平均耗时在53秒左右,4090 48G的平均耗时在50秒左右,4090 48G在文生视频场景的性能略好于是A100 40G


创建Wan-ComfyUI云容器实例