最高降幅99%!小米MiMo-V2.5系列API永久降价,雷军押注AI未来三年投入600亿
2026年5月27日,小米MiMo-V2.5系列API永久降价,最高降幅99%,取消分级定价;雷军宣布未来三年AI投入600亿元,押注开源与生态布局。
2026年5月27日零时,小米技术发出一份公告,宣布MiMo-V2.5系列API永久降价,最高降幅99%,全球同步生效。雷军亲自转发微博,喊话开发者来接入。
这件事值得认真看一下——不只是因为"99%"这个数字,更是因为它背后的定价逻辑、产品实力和战略意图,都在发生一些值得关注的变化。
降了多少?先看数字
最直观的,是价格表的变化。
小米这次调整有个细节容易被忽视:取消了原有的上下文窗口分级定价。以前,≤256k 和 256k-1M 的上下文是两套不同价格,开发者要自己算成本,挺麻烦的。现在统一计费,省去了不少心智负担。
具体降了多少,看下面两张表。
MiMo-V2.5-Pro 定价变化
| 计费项 | 新价格(元/百万tokens) | 原短窗口价格 | 降幅 | 原长窗口价格 | 降幅 |
|---|---|---|---|---|---|
| 输入(缓存命中) | 0.025 | 1.40 | 98% | 2.80 | 99% |
| 输入(未命中缓存) | 3.000 | 7.00 | 57% | 14.00 | 79% |
| 输出 | 6.000 | 21.00 | 71% | 42.00 | 86% |
MiMo-V2.5 标准版定价变化
| 计费项 | 新价格(元/百万tokens) | 原短窗口价格 | 降幅 | 原长窗口价格 | 降幅 |
|---|---|---|---|---|---|
| 输入(缓存命中) | 0.020 | 0.56 | 96% | 1.12 | 98% |
| 输入(未命中缓存) | 1.000 | 2.80 | 64% | 5.60 | 82% |
| 输出 | 2.000 | 14.00 | 86% | 28.00 | 93% |
缓存命中的输入价格降幅最夸张,Pro版直接从最高2.80元砍到0.025元,降了99%。对于那些大量使用系统提示词(system prompt)、依赖缓存复用的应用场景,这个降幅几乎是颠覆性的。
Token Plan方面也同步调整:同等付费档位下,可用的Token量提升到原来的5至8倍,已订阅用户的额度全部重置。另外,MiMo-V2.5-TTS系列继续维持限时免费;MiMo-V2-Pro与MiMo-V2-Omni保持原价,Token Plan即将下线,官方明确引导开发者向V2.5系列迁移。
MiMo-V2.5是什么来头?
降价当然要有底气。产品本身说不清楚,价格再低也没人买账。
MiMo是小米2026年3月正式推出的自研大模型系列。带队的是罗福莉——前DeepSeek核心技术人员,2025年11月正式加盟小米,据报道雷军以千万年薪力邀。团队平均年龄25岁,清北毕业生占比超六成。
V2.5系列目前包含两款主力产品:
MiMo-V2.5-Pro,定位复杂任务,深度适配Agent与Coding场景。在GDPVal-AA和ClawEval两个榜单上,位列全球开源模型第一;综合智能指数、Agent指数也并列全球开源第一。这类榜单数据向来可以打折扣看,但能同时出现在多个榜单头部,产品实力大体上是站得住脚的。
MiMo-V2.5,原生全模态模型,支持文本、图像、视频、音频理解,具备Agent能力,最长支持100万tokens的上下文窗口。对于需要同时处理多种类型输入的应用来说,这个产品形态有明显的场景适配优势。
2026年4月28日,小米已正式开源MiMo-V2.5系列,采用MIT协议。MIT是最宽松的开源协议之一:商用、二次训练、修改分发,全部允许,无需额外授权。这对想在私有化部署或二次开发上做文章的团队来说,吸引力相当直接。
配套的生态计划叫做MiMoOrbit,包含两个方向:面向AI Builder的"百万亿Token创造者激励计划",以及面向Agent框架团队的"Agent生态共建计划"。降价首日就完成了阿里平头哥、AMD、百度昆仑芯等多家芯片厂商的接入适配,同时完成SGLang与vLLM推理框架的Day0适配——也就是新版本发布当天就能用。
卢伟冰在转发公告时说得很直接:"降价背后是模型推理系统上的持续优化,有技术精进才有更香价格。"这话听起来像PR稿,但推理效率提升→单次推理成本下降→可以给出更低价格,这个逻辑链本身是成立的。
雷军的600亿在赌什么?
看到"600亿"这个数字,可能要先看看小米目前的财务状况。
2026年一季度,小米总收入991.42亿元,同比下滑10.9%;经调整净利润60.72亿元,同比下滑43.1%。这是相当明显的业绩压力。在这个背景下,宣布今年AI投入至少160亿元、未来三年AI投入600亿元,同时全年研发投入预计超400亿元,当季研发投入已达90亿元(同比增长33.4%)——这种逆势加码,确实需要强烈的战略信念才能撑住。
雷军的逻辑大概是:现在是AI基础设施层的窗口期。谁能在这个阶段把开发者生态做大,谁就在未来的AI平台竞争中占据主动。
小米的硬件基本盘还算扎实。一季度手机×AIoT业务收入793亿元;智能电动汽车及AI等创新业务收入199亿元,新车交付超8万辆。AI能力贯穿硬件全线——手机、家居、汽车——而降价后的MiMo API,就是把这套AI能力向外部开发者开放的接口。
"低价入场、开源筑基、生态锁定",这套路不是小米首创,但小米有硬件终端做承接,逻辑上比纯云厂商更完整一些。
放在行业里看:这是一场什么竞赛?
小米这次降价有个明显的对照对象:DeepSeek。
DeepSeek-V4-Pro API在5月31日限时优惠结束后,调整为原定价的四分之一——输入缓存命中0.025元/百万tokens,未命中缓存3元,输出6元,整体降幅75%。
再看小米MiMo-V2.5-Pro的新定价:输入缓存命中0.025元,未命中缓存3元,输出6元。
两者几乎完全一致。这不太可能是巧合,竞争意味非常明显。
目前国内大模型市场的定价格局,大体上呈现出一种K型分化:
- 降价阵营:阿里云通义千问、字节跳动豆包、小米MiMo等通用型大模型相继降价,走量优先,争夺开发者增量市场
- 维稳阵营:智谱GLM、腾讯混元等主打企业定制服务的模型维持原价甚至小幅上调,溢价保值,服务存量客户
这背后的逻辑也不复杂:通用模型同质化严重,差异化空间有限,只能靠价格吸引开发者;而深度定制的企业服务,客户黏性高,价格敏感度低,没必要跟着降。
降价能持续的前提,是推理效率的持续提升。从过去几年的趋势来看,同等计算资源下能处理的token量每年大约翻倍,这是支撑行业整体降价的技术根基。没有这个支撑,降价就是纯粹的亏本补贴,迟早撑不住。
对开发者来说,这意味着什么?
几个比较实在的变化:
成本核算简单了。 取消窗口分级定价,不用再为超出256k上下文要不要切换档位而纠结,报价和预算都更清晰。
缓存密集型应用降价最明显。 如果你的应用有固定的长系统提示词,或者频繁复用相同上下文,缓存命中率高,实际成本可能比账面降幅更大。
MIT协议开源是个加分项。 私有化部署、二次开发、模型微调,都不需要和小米另谈授权,省去了很多法务和商务摩擦。
Token Plan用量提升值得重新算一遍。 同等费用下Token量提升5到8倍,原来的预算可能可以支撑更多的调用量或者更高的请求频率。
当然,降价只是入场门槛,实际用起来的体验——延迟、稳定性、API文档质量、技术支持响应速度——这些才是决定开发者留不留下来的核心因素。
结语
99%的降幅是个很吸引眼球的数字。但把这次降价拆开来看,它更像是小米在AI平台化路径上的一次综合表态:极致降价打开开发者增量,MIT开源降低迁移成本,600亿投入承诺支撑长期预期,MiMoOrbit生态计划做留存。
大模型竞争的焦点,已经从"谁的参数最多"变成了"谁的生态最大"。价格战是手段,开发者规模才是目标。
这条路能不能走通,不只取决于小米能把价格压多低,也取决于MiMo在实际使用中能不能撑起开发者的期待。窗口期大家都知道有限,谁先把生态密度做上去,谁就更有机会在下一轮竞争中坐稳位置。