最高降幅99%!小米MiMo-V2.5系列API永久降价,雷军押注AI未来三年投入600亿

2026年5月27日,小米MiMo-V2.5系列API永久降价,最高降幅99%,取消分级定价;雷军宣布未来三年AI投入600亿元,押注开源与生态布局。

小米MiMo-V2.5 API永久降价 最高降幅99%

2026年5月27日零时,小米技术发出一份公告,宣布MiMo-V2.5系列API永久降价,最高降幅99%,全球同步生效。雷军亲自转发微博,喊话开发者来接入。

这件事值得认真看一下——不只是因为"99%"这个数字,更是因为它背后的定价逻辑、产品实力和战略意图,都在发生一些值得关注的变化。


降了多少?先看数字

最直观的,是价格表的变化。

小米这次调整有个细节容易被忽视:取消了原有的上下文窗口分级定价。以前,≤256k 和 256k-1M 的上下文是两套不同价格,开发者要自己算成本,挺麻烦的。现在统一计费,省去了不少心智负担。

具体降了多少,看下面两张表。

MiMo-V2.5-Pro 定价变化

计费项 新价格(元/百万tokens) 原短窗口价格 降幅 原长窗口价格 降幅
输入(缓存命中) 0.025 1.40 98% 2.80 99%
输入(未命中缓存) 3.000 7.00 57% 14.00 79%
输出 6.000 21.00 71% 42.00 86%

MiMo-V2.5 标准版定价变化

计费项 新价格(元/百万tokens) 原短窗口价格 降幅 原长窗口价格 降幅
输入(缓存命中) 0.020 0.56 96% 1.12 98%
输入(未命中缓存) 1.000 2.80 64% 5.60 82%
输出 2.000 14.00 86% 28.00 93%

缓存命中的输入价格降幅最夸张,Pro版直接从最高2.80元砍到0.025元,降了99%。对于那些大量使用系统提示词(system prompt)、依赖缓存复用的应用场景,这个降幅几乎是颠覆性的。

Token Plan方面也同步调整:同等付费档位下,可用的Token量提升到原来的5至8倍,已订阅用户的额度全部重置。另外,MiMo-V2.5-TTS系列继续维持限时免费;MiMo-V2-Pro与MiMo-V2-Omni保持原价,Token Plan即将下线,官方明确引导开发者向V2.5系列迁移。


MiMo-V2.5是什么来头?

降价当然要有底气。产品本身说不清楚,价格再低也没人买账。

MiMo是小米2026年3月正式推出的自研大模型系列。带队的是罗福莉——前DeepSeek核心技术人员,2025年11月正式加盟小米,据报道雷军以千万年薪力邀。团队平均年龄25岁,清北毕业生占比超六成。

V2.5系列目前包含两款主力产品:

MiMo-V2.5-Pro,定位复杂任务,深度适配Agent与Coding场景。在GDPVal-AA和ClawEval两个榜单上,位列全球开源模型第一;综合智能指数、Agent指数也并列全球开源第一。这类榜单数据向来可以打折扣看,但能同时出现在多个榜单头部,产品实力大体上是站得住脚的。

MiMo-V2.5,原生全模态模型,支持文本、图像、视频、音频理解,具备Agent能力,最长支持100万tokens的上下文窗口。对于需要同时处理多种类型输入的应用来说,这个产品形态有明显的场景适配优势。

2026年4月28日,小米已正式开源MiMo-V2.5系列,采用MIT协议。MIT是最宽松的开源协议之一:商用、二次训练、修改分发,全部允许,无需额外授权。这对想在私有化部署或二次开发上做文章的团队来说,吸引力相当直接。

配套的生态计划叫做MiMoOrbit,包含两个方向:面向AI Builder的"百万亿Token创造者激励计划",以及面向Agent框架团队的"Agent生态共建计划"。降价首日就完成了阿里平头哥、AMD、百度昆仑芯等多家芯片厂商的接入适配,同时完成SGLang与vLLM推理框架的Day0适配——也就是新版本发布当天就能用。

卢伟冰在转发公告时说得很直接:"降价背后是模型推理系统上的持续优化,有技术精进才有更香价格。"这话听起来像PR稿,但推理效率提升→单次推理成本下降→可以给出更低价格,这个逻辑链本身是成立的。


雷军的600亿在赌什么?

看到"600亿"这个数字,可能要先看看小米目前的财务状况。

2026年一季度,小米总收入991.42亿元,同比下滑10.9%;经调整净利润60.72亿元,同比下滑43.1%。这是相当明显的业绩压力。在这个背景下,宣布今年AI投入至少160亿元、未来三年AI投入600亿元,同时全年研发投入预计超400亿元,当季研发投入已达90亿元(同比增长33.4%)——这种逆势加码,确实需要强烈的战略信念才能撑住。

雷军的逻辑大概是:现在是AI基础设施层的窗口期。谁能在这个阶段把开发者生态做大,谁就在未来的AI平台竞争中占据主动。

小米的硬件基本盘还算扎实。一季度手机×AIoT业务收入793亿元;智能电动汽车及AI等创新业务收入199亿元,新车交付超8万辆。AI能力贯穿硬件全线——手机、家居、汽车——而降价后的MiMo API,就是把这套AI能力向外部开发者开放的接口。

"低价入场、开源筑基、生态锁定",这套路不是小米首创,但小米有硬件终端做承接,逻辑上比纯云厂商更完整一些。


放在行业里看:这是一场什么竞赛?

小米这次降价有个明显的对照对象:DeepSeek。

DeepSeek-V4-Pro API在5月31日限时优惠结束后,调整为原定价的四分之一——输入缓存命中0.025元/百万tokens,未命中缓存3元,输出6元,整体降幅75%。

再看小米MiMo-V2.5-Pro的新定价:输入缓存命中0.025元,未命中缓存3元,输出6元

两者几乎完全一致。这不太可能是巧合,竞争意味非常明显。

目前国内大模型市场的定价格局,大体上呈现出一种K型分化:

  • 降价阵营:阿里云通义千问、字节跳动豆包、小米MiMo等通用型大模型相继降价,走量优先,争夺开发者增量市场
  • 维稳阵营:智谱GLM、腾讯混元等主打企业定制服务的模型维持原价甚至小幅上调,溢价保值,服务存量客户

这背后的逻辑也不复杂:通用模型同质化严重,差异化空间有限,只能靠价格吸引开发者;而深度定制的企业服务,客户黏性高,价格敏感度低,没必要跟着降。

降价能持续的前提,是推理效率的持续提升。从过去几年的趋势来看,同等计算资源下能处理的token量每年大约翻倍,这是支撑行业整体降价的技术根基。没有这个支撑,降价就是纯粹的亏本补贴,迟早撑不住。


对开发者来说,这意味着什么?

几个比较实在的变化:

成本核算简单了。 取消窗口分级定价,不用再为超出256k上下文要不要切换档位而纠结,报价和预算都更清晰。

缓存密集型应用降价最明显。 如果你的应用有固定的长系统提示词,或者频繁复用相同上下文,缓存命中率高,实际成本可能比账面降幅更大。

MIT协议开源是个加分项。 私有化部署、二次开发、模型微调,都不需要和小米另谈授权,省去了很多法务和商务摩擦。

Token Plan用量提升值得重新算一遍。 同等费用下Token量提升5到8倍,原来的预算可能可以支撑更多的调用量或者更高的请求频率。

当然,降价只是入场门槛,实际用起来的体验——延迟、稳定性、API文档质量、技术支持响应速度——这些才是决定开发者留不留下来的核心因素。


结语

99%的降幅是个很吸引眼球的数字。但把这次降价拆开来看,它更像是小米在AI平台化路径上的一次综合表态:极致降价打开开发者增量,MIT开源降低迁移成本,600亿投入承诺支撑长期预期,MiMoOrbit生态计划做留存。

大模型竞争的焦点,已经从"谁的参数最多"变成了"谁的生态最大"。价格战是手段,开发者规模才是目标。

这条路能不能走通,不只取决于小米能把价格压多低,也取决于MiMo在实际使用中能不能撑起开发者的期待。窗口期大家都知道有限,谁先把生态密度做上去,谁就更有机会在下一轮竞争中坐稳位置。


阅读更多