2026年5月:国内AI算力租用行情全景扫描
2026年5月,国内AI算力租赁市场全线涨价,H100月租突破5.5万元、高端GPU出租率超90%。本文拆解价格行情、供需结构、国产替代进程与垂直平台格局,附主流GPU价格对比表,帮助开发者与企业在算力紧缺周期做出理性选型决策。
一、市场还在涨,而且涨得很猛
先说结论:2026年5月,国内AI算力租用市场正处于历史性高景气周期,而且短期内看不到降温的迹象。
根据中国信通院数据,2026年一季度国内AI算力需求同比暴涨417%,而供给增速仅为128%——供需缺口不是在收窄,是在扩大。市场规模方面,赛迪研究院和中研普华产业研究院均预测全年算力租赁市场有望达到2600亿元。
驱动这轮行情的核心逻辑,不是单纯的"AI热",而是一个结构性转变:算力需求从"训练主导"切换到了"推理主导"。推理阶段的算力需求,大约是训练的10至15倍。豆包的日均Token消耗已达120万亿,较2024年同期增长1000倍。AI Agent的兴起让问题更复杂——单个Agent任务的Token消耗量据测算是传统Chat模式的15倍以上,所谓"越用越省"的效率红利,反而在快速消耗所有新增产能。
高端GPU出租率已超过90%,部分平台甚至"上架即秒光",新签合同交付普遍排至2027年上半年。
二、价格行情:全线涨,高端涨得更猛
价格端的变化是最直接的信号。
H100一年期租赁合同价格从2025年10月的1.70美元/卡时,急升至2026年3月的2.35美元,涨幅接近40%。国内市场的价格如下表所示:
| GPU 型号 | 时租(元/卡时) | 月租(万元/卡) | 近期环比涨幅 |
|---|---|---|---|
| H200 | 7.5 - 8.0 | 6.0 - 6.6 | 25% - 30% |
| H100 | — | 5.5 - 6.0 | 15% - 20% |
| H20 | 7 - 8 | 2.6 - 3.3 | 稳中有升 |
| A800 | — | 约 2.6 | 15% - 20% |
| RTX 4090 | 1.3 - 2.0 | — | 随大盘跟涨 |
部分海外云服务商已宣布6月再次提价约30%,国内市场大概率跟进。阿里云、腾讯云等大厂年内已多次调价,最高涨幅达34%。部分中小平台也从2026年3月起全线调价20%至30%。
这一轮不只是高端涨,中低端同样在跟。消费级RTX 4090凭借性价比成为中小团队和推理场景的主力选择,需求上来之后,时租也从此前的低位持续抬升。
三、为什么卡这么难抢?
供给紧张有几个叠加因素,拆开来看更清晰。
出口管制是第一道墙。 英伟达在中国AI芯片市场的份额已大幅萎缩。Bernstein Research的报告显示,英伟达2026年在华份额将降至约8%,华为预计将占据50%的市场份额。存量高端英伟达GPU已是稀缺资源,一旦损耗无法补充,价格自然居高不下。
资源配置存在结构性失衡。 大模型训练要求物理集中的万卡集群,市场上大量512卡以下的小型集群利用率极低;与此同时,即便是H20集群,正常运行也只能维持70%左右的实际系统利用率,有效供给比账面数字要少得多。
HBM内存成本暴涨加剧压力。 LPDDR5/DDR5内存合同价格在2026年一季度同比上涨4至5倍,高带宽内存产能被少数厂商垄断,AI服务器整机成本大幅上升,成本压力直接传导到租赁价格。
九大云厂商资本开支持续加码。 据估算,九大主要云厂商2026年合计资本支出约8300亿美元,同比增幅从61%提升至79%。字节跳动超2000亿元,阿里1800亿元,腾讯1319亿元。巨量资本涌入上游,但建设周期长,下游租赁市场依然供不应求。
四、国产替代:从"政策叙事"到真实订单
国产算力正在快速补位,这已经不只是政策说辞了。
DeepSeek-V4在技术报告里,把华为昇腾与英伟达GPU并列写进了硬件验证清单。这意味着中国头部AI公司在做旗舰模型训练时,已经不再"只有英伟达"这一个选项。昇腾910B与英伟达Blackwell的差距,已从"代际"缩小到"同代不同档"。
IDC数据显示,2025年上半年中国AI芯片市场中,国产芯片约占35%市场份额,且增速远超英伟达。天数智芯、沐曦、壁仞科技等厂商将于2026年下半年陆续推出新款AI芯片,矩阵正在加速成型。
到2028年,据Bernstein Research预测,中国本土AI芯片产量将超过国内需求,供应/需求比例达104%。本土AI芯片销售额未来三年复合增长率预计高达74%。
5月22日,国家发改委明确提出指导国产大模型加大力度适配国产算力芯片,政策红利从叙事层面真正开始向订单兑现转移。
五、政策面:两个值得关注的变化
算力"商品化"正在加速落地。 工信部4月印发通知,推行按"卡时"、"核时"及Token计费等灵活付费模式,探索"算力银行"和"算力超市"。中国电信5月17日正式推出全国性Token套餐,9.9元/月起。算力正在从科技基础设施,变成可以像流量一样购买的消费品。
算力期货有望年内上线。 CME集团与Silicon Data于5月12日宣布合作推出GPU算力租赁费率期货,计划2026年内上线。这件事的意义,有人把它类比为1983年原油期货的推出——算力从此可以被对冲、被投机、被定价,成为真正的金融资产。当然,这是否会引入新的风险,还需要观察。
六、垂直平台:市场里最活的那条"鲶鱼"
当前算力租用市场大致分四类玩家:公有云大厂、运营商、第三方IDC、专业垂直平台。大厂资源稳定但价格高、隐性收费多,运营商在政企场景有优势,而垂直算力租用平台则是供需紧张时期最重要的补充力量。
市场已经出现明显的"K型分化":
- 大平台(阿里云、腾讯云、华为云):规模大、生态全,适合大型政企客户,但对中小团队不友好。
- 专业垂直平台(AutoDL、晨涧云、矩池云、恒源云等):定位"普惠型AI基础设施",高性价比、开箱即用。2026年Q2受涨价潮影响,整体价格上涨约30%,但仍比大厂便宜20%至30%。
- 共享算力调度平台:轻资产模式,盘活社会闲置算力。
几个代表性平台的横向对比:
| 平台 | 典型价格 | 核心优势 | 适合场景 |
|---|---|---|---|
| 晨涧云 | A100 40G 约2.3元/时 | 无隐性费用,长租折扣30%+,支持桌面 | 中小团队,长期租赁 |
| AutoDL | RTX 3090 至 A100 多档 | 算法复现社区,一键复现,卡量超万张 | 学术研究,模型复现 |
| 恒源云 | RTX 4090 低至1.32元/时 | 新手友好,10-30分钟完成部署 | 入门开发者,短期任务 |
| 矩池云 | — | 信创场景先发优势,支持昇腾等国产芯片 | 政务金融等合规场景 |
这类平台的竞争焦点,不单是价格。物理独享(承诺不超售)、开箱即用(预装框架,环境配置从1-2天压缩到30分钟内)、价格透明度("一口价"含CPU/内存/带宽)、以及数据安全合规(等保三级、ISO 27001认证),正在成为政务金融场景的选型门槛。
七、接下来会怎样?
几个趋势比较明确:
价格短期不会大跌,但涨幅会收窄。 高端算力短缺预计持续至2027年,租金高位运行,但随着国产供给放量,涨幅有望逐步收窄至5%至10%。
行业洗牌在加速。 一季度营收高增,但部分企业毛利率同比下滑近10个百分点。成本控制和获客效率,将淘汰抗风险能力弱的中小平台。
生态化是必然方向。 垂直平台正从"卖算力"转向"全栈AI开发平台"——内置预训练模型、微调、数据标注、部署等全流程服务。AutoDL的算法复现社区、晨涧云的场景镜像,已经初步显现这一趋势。
资本还在加速涌入。 共绩科技完成近亿元Pre-A轮,乘方科技Pre-A,奇点科技千万元天使。如果CME算力期货成功上线,将为行业引入套期保值与价格发现功能,系统性提升盈利确定性。
小结
2026年5月的国内AI算力租用市场,是供需两旺、政策支持、模式革新同时共振的一个窗口期。对大企业来说,锁定长期合约、关注绿电液冷节点是稳妥策略;对中小团队来说,混合使用消费级卡与国产算力、优先性价比高的垂直平台,是当下最务实的路径;对投资者来说,算力运营商、液冷供电设备链以及国产芯片全链条,仍是值得持续关注的方向。
一句话总结这个市场:卡还是抢不到,价格还在涨,但选对平台,成本差异可以有好几倍。