AI大模型

最高降幅99%！小米MiMo-V2.5系列API永久降价，雷军押注AI未来三年投入600亿

2026年5月27日，小米MiMo-V2.5系列API永久降价，最高降幅99%，取消分级定价；雷军宣布未来三年AI投入600亿元，押注开源与生态布局。

晨涧云

2026-05-27 — 阅读时间 9 分钟

2026年5月27日零时，小米技术发出一份公告，宣布MiMo-V2.5系列API永久降价，最高降幅99%，全球同步生效。雷军亲自转发微博，喊话开发者来接入。

这件事值得认真看一下——不只是因为"99%"这个数字，更是因为它背后的定价逻辑、产品实力和战略意图，都在发生一些值得关注的变化。

降了多少？先看数字

最直观的，是价格表的变化。

小米这次调整有个细节容易被忽视：取消了原有的上下文窗口分级定价。以前，≤256k 和 256k-1M 的上下文是两套不同价格，开发者要自己算成本，挺麻烦的。现在统一计费，省去了不少心智负担。

具体降了多少，看下面两张表。

MiMo-V2.5-Pro 定价变化

计费项	新价格（元/百万tokens）	原短窗口价格	降幅	原长窗口价格	降幅
输入（缓存命中）	0.025	1.40	98%	2.80	99%
输入（未命中缓存）	3.000	7.00	57%	14.00	79%
输出	6.000	21.00	71%	42.00	86%

MiMo-V2.5 标准版定价变化

计费项	新价格（元/百万tokens）	原短窗口价格	降幅	原长窗口价格	降幅
输入（缓存命中）	0.020	0.56	96%	1.12	98%
输入（未命中缓存）	1.000	2.80	64%	5.60	82%
输出	2.000	14.00	86%	28.00	93%

缓存命中的输入价格降幅最夸张，Pro版直接从最高2.80元砍到0.025元，降了99%。对于那些大量使用系统提示词（system prompt）、依赖缓存复用的应用场景，这个降幅几乎是颠覆性的。

Token Plan方面也同步调整：同等付费档位下，可用的Token量提升到原来的5至8倍，已订阅用户的额度全部重置。另外，MiMo-V2.5-TTS系列继续维持限时免费；MiMo-V2-Pro与MiMo-V2-Omni保持原价，Token Plan即将下线，官方明确引导开发者向V2.5系列迁移。

MiMo-V2.5是什么来头？

降价当然要有底气。产品本身说不清楚，价格再低也没人买账。

MiMo是小米2026年3月正式推出的自研大模型系列。带队的是罗福莉——前DeepSeek核心技术人员，2025年11月正式加盟小米，据报道雷军以千万年薪力邀。团队平均年龄25岁，清北毕业生占比超六成。

V2.5系列目前包含两款主力产品：

MiMo-V2.5-Pro，定位复杂任务，深度适配Agent与Coding场景。在GDPVal-AA和ClawEval两个榜单上，位列全球开源模型第一；综合智能指数、Agent指数也并列全球开源第一。这类榜单数据向来可以打折扣看，但能同时出现在多个榜单头部，产品实力大体上是站得住脚的。

MiMo-V2.5，原生全模态模型，支持文本、图像、视频、音频理解，具备Agent能力，最长支持100万tokens的上下文窗口。对于需要同时处理多种类型输入的应用来说，这个产品形态有明显的场景适配优势。

2026年4月28日，小米已正式开源MiMo-V2.5系列，采用MIT协议。MIT是最宽松的开源协议之一：商用、二次训练、修改分发，全部允许，无需额外授权。这对想在私有化部署或二次开发上做文章的团队来说，吸引力相当直接。

配套的生态计划叫做MiMoOrbit，包含两个方向：面向AI Builder的"百万亿Token创造者激励计划"，以及面向Agent框架团队的"Agent生态共建计划"。降价首日就完成了阿里平头哥、AMD、百度昆仑芯等多家芯片厂商的接入适配，同时完成SGLang与vLLM推理框架的Day0适配——也就是新版本发布当天就能用。

卢伟冰在转发公告时说得很直接："降价背后是模型推理系统上的持续优化，有技术精进才有更香价格。"这话听起来像PR稿，但推理效率提升→单次推理成本下降→可以给出更低价格，这个逻辑链本身是成立的。

雷军的600亿在赌什么？

看到"600亿"这个数字，可能要先看看小米目前的财务状况。

2026年一季度，小米总收入991.42亿元，同比下滑10.9%；经调整净利润60.72亿元，同比下滑43.1%。这是相当明显的业绩压力。在这个背景下，宣布今年AI投入至少160亿元、未来三年AI投入600亿元，同时全年研发投入预计超400亿元，当季研发投入已达90亿元（同比增长33.4%）——这种逆势加码，确实需要强烈的战略信念才能撑住。

雷军的逻辑大概是：现在是AI基础设施层的窗口期。谁能在这个阶段把开发者生态做大，谁就在未来的AI平台竞争中占据主动。

小米的硬件基本盘还算扎实。一季度手机×AIoT业务收入793亿元；智能电动汽车及AI等创新业务收入199亿元，新车交付超8万辆。AI能力贯穿硬件全线——手机、家居、汽车——而降价后的MiMo API，就是把这套AI能力向外部开发者开放的接口。

"低价入场、开源筑基、生态锁定"，这套路不是小米首创，但小米有硬件终端做承接，逻辑上比纯云厂商更完整一些。

放在行业里看：这是一场什么竞赛？

小米这次降价有个明显的对照对象：DeepSeek。

DeepSeek-V4-Pro API在5月31日限时优惠结束后，调整为原定价的四分之一——输入缓存命中0.025元/百万tokens，未命中缓存3元，输出6元，整体降幅75%。

再看小米MiMo-V2.5-Pro的新定价：输入缓存命中0.025元，未命中缓存3元，输出6元。

两者几乎完全一致。这不太可能是巧合，竞争意味非常明显。

目前国内大模型市场的定价格局，大体上呈现出一种K型分化：

降价阵营：阿里云通义千问、字节跳动豆包、小米MiMo等通用型大模型相继降价，走量优先，争夺开发者增量市场
维稳阵营：智谱GLM、腾讯混元等主打企业定制服务的模型维持原价甚至小幅上调，溢价保值，服务存量客户

这背后的逻辑也不复杂：通用模型同质化严重，差异化空间有限，只能靠价格吸引开发者；而深度定制的企业服务，客户黏性高，价格敏感度低，没必要跟着降。

降价能持续的前提，是推理效率的持续提升。从过去几年的趋势来看，同等计算资源下能处理的token量每年大约翻倍，这是支撑行业整体降价的技术根基。没有这个支撑，降价就是纯粹的亏本补贴，迟早撑不住。

对开发者来说，这意味着什么？

几个比较实在的变化：

成本核算简单了。 取消窗口分级定价，不用再为超出256k上下文要不要切换档位而纠结，报价和预算都更清晰。

缓存密集型应用降价最明显。 如果你的应用有固定的长系统提示词，或者频繁复用相同上下文，缓存命中率高，实际成本可能比账面降幅更大。

MIT协议开源是个加分项。 私有化部署、二次开发、模型微调，都不需要和小米另谈授权，省去了很多法务和商务摩擦。

Token Plan用量提升值得重新算一遍。 同等费用下Token量提升5到8倍，原来的预算可能可以支撑更多的调用量或者更高的请求频率。

当然，降价只是入场门槛，实际用起来的体验——延迟、稳定性、API文档质量、技术支持响应速度——这些才是决定开发者留不留下来的核心因素。

结语

99%的降幅是个很吸引眼球的数字。但把这次降价拆开来看，它更像是小米在AI平台化路径上的一次综合表态：极致降价打开开发者增量，MIT开源降低迁移成本，600亿投入承诺支撑长期预期，MiMoOrbit生态计划做留存。

大模型竞争的焦点，已经从"谁的参数最多"变成了"谁的生态最大"。价格战是手段，开发者规模才是目标。

这条路能不能走通，不只取决于小米能把价格压多低，也取决于MiMo在实际使用中能不能撑起开发者的期待。窗口期大家都知道有限，谁先把生态密度做上去，谁就更有机会在下一轮竞争中坐稳位置。

最高降幅99%！小米MiMo-V2.5系列API永久降价，雷军押注AI未来三年投入600亿

晨涧云

降了多少？先看数字

MiMo-V2.5-Pro 定价变化

MiMo-V2.5 标准版定价变化

MiMo-V2.5是什么来头？

雷军的600亿在赌什么？

放在行业里看：这是一场什么竞赛？

对开发者来说，这意味着什么？

结语

阅读更多

Kimi K3全解析：2.8万亿参数旗舰上线，智能体编程新答卷

GPT-5.6发布：三档模型体系与Codex、ChatGPT大整合解读

Seedream 5.0 Pro发布：字节图像模型的设计级跃升与真实差距

晨涧云GPU算力资源盘点：2026年7月，哪些卡好租，哪些卡要等