晨涧云文档

首页

目录

Wan2.2文生视频显卡性能测试

晨涧云AI算力租赁平台支持ComfyUI Wan2.2的云容器镜像。
Wan 2.2(通义万相2.2)是最近非常火的文生视频的大模型。
ComfyUI支持各种模型应用，提供了预置的一些工作流的模板，用户也可以自己创建工作流，或者导入已有的工作流。最新版ComfyUI的预置模板里面已经包含了多个Wan2.2模型的应用：
ComfyUI-Wan模板.png#850px #400px
这里基于ComfyUI的预置工作流模板来测试Wan2.2的模型在3090和4090两张显卡下文生视频的效率。

在云容器租用 Wan-ComfyUI 镜像分别创建 3090 和 4090 的显卡实例进行测试。

选择工作流

这里我们选择Wan2.2预置的第一个模板 Wan2.2 14B T2V 测试14B模型的文生视频应用。打开后工作流是长这样的：

ComfyUI-Wan工作流.png#1000px #480px

点击「运行」，会生成一个5秒的视频，然后我们写一个Python脚本来调用ComfyUI的API，通过工作流自动生成视频，并通过多次调用取平均的方式来统计比较3090和4090执行性能的差异，以及对显卡资源的占用情况。

3090测试

3090-ComfyUI-Wan测试结果.png#800px #600px

4090测试

4090-ComfyUI-Wan测试结果.png#800px #600px

测试结果解释

3090和4090两张显卡的显存使用和GPU利用率都比较接近；3090生成5秒视频的平均耗时在142秒左右，4090的平均耗时在59秒左右，4090生成视频的速度是3090的2.4倍。

上面是24G显存的两张显卡的性能对比，下面测试A100 40G和4090 48G这两张显存较大的显卡在Wan文生视频场景的性能对比。

A100 40G测试

A100-40G-ComfyUI-Wan测试结果.png#800px #600px

4090 48G测试

4090_48G-ComfyUI-Wan测试结果.png#800px #600px

测试结果解释

A100 40G和4090 48G两张显卡的平均耗时都要明显优于4090 24G，得益于两张显卡都有比较充足的显存，显存占用比4090 24G有明显提升；

比较A100 40G和4090 48G的性能表现，显卡资源占用方面，4090 48G有更富足的显存空间，平均占用在38G显存，A100平均显存占用32G，GPU利用率4090 48G也高于A100 40G，这个场景下4090 48G的算力使用更为充沛。

生成5s视频，A100 40G平均耗时在53秒左右，4090 48G的平均耗时在50秒左右，4090 48G在文生视频场景的性能略好于是A100 40G。

创建Wan-ComfyUI云容器实例