AI算力

AI账单失控：烧Token曾经是荣耀，现在是头号难题

从Meta 8万员工竞相烧Token，到Uber全年AI预算不到年中已花光，再到某公司单月5亿美元账单却说不清买到了什么——AI支出在短短一年内从没人在意变成了头号难题。这篇文章梳理真实案例，拆解成本失控的底层逻辑，以及巨头们开始踩刹车背后的行业转折。

晨涧云

2026-06-17 — 阅读时间 10 分钟

烧Token，曾经是一种荣耀

去年这个时候，很少有公司会认真追问AI到底花了多少钱。今年，这个问题已经成了很多企业高管会议上最烫手的议题。

Sam Altman前不久公开承认，他自己都对AI支出规模感到困惑——这话出自OpenAI的创始人，多少有点耐人寻味。

在此之前，"烧Token"不是问题，而是某种身份象征。Meta内部员工自发做了一个排行榜，8万名员工互相比拼谁用AI用得更猛，30天内集体烧掉超过60万亿个Token，折合约9亿美元。没人觉得这有什么不对，反而有种竞技的氛围在里面——谁用得少，谁才是落伍的。

英伟达CEO黄仁勋在公开场合表态：如果一个工程师一年用不到25万美元的Token，他会"深感不安"。说这话的人是算力的最大卖家，立场本身就值得留意，但这句话确实代表了那个时期的主流态度：不烧Token，就是不够努力。

现在流行一个冷笑话：2026全年的AI预算，第一季度就花完了。

一个月5亿美元，这些账单是怎么烧出来的

笑话背后是真实的账单。

某家大公司开通了Claude的全线权限，单月AI支出烧掉了5亿美元，折合人民币约34亿。作为参考，A股95%的上市公司，一整年的营收都没有这个数字高。

这笔钱买到了什么？运营负责人的说法是："很难将支出与实际产出对应起来。"

类似的情况在Uber身上也发生了。Uber给2026全年设定了Cloud Code预算，但不到年中，预算已经提前花光。Uber高管公开承认，目前还无法将Token消耗量与成功交付的产品直接挂钩。

米哈游有一个更戏剧性的案例。某员工调用了数十个AI智能体协作处理任务，一晚上什么实质性工作都没做，账单显示烧掉了200万人民币。事后复盘，根本原因是多个Agent之间互相调用、互相等待，形成空转循环——Token在不断消耗，但有效输出为零。

还有一家公司，月度AI账单跑到40万美元，老板直接拍板：每人每月限额500美元，模型从Claude Code换成了DeepSeek。

这些不是极端案例。2026年初以来，类似的故事在各个行业反复出现，只是规模大小不同。

从更宏观的视角看，这场烧钱狂欢的规模有多大：

数据来源	数字	说明
OpenAI 2026年预计营收	130亿美元	同年预计亏损140亿美元
字节跳动算力日耗	4.38亿美元	利润同比暴跌70%
全球五大云厂商AI投资	6900亿美元	同比翻倍
腾讯云Token单次涨幅	463%	一夜调价

卖算力的人赚到钱了吗？不一定。OpenAI每收入1美元，算力成本平均只能回收0.68美元——卖得越多，亏得越多。

Token消耗是普通对话的上千倍，钱都去哪儿了

很多人觉得AI不就是问问题、给答案，怎么会这么贵？

答案在于Agent任务的工作方式。

当你让一个AI智能体完成一项任务，它不是直接给你答案，而是把任务拆成十几个步骤，每一步都要调用模型、生成输出、传递上下文，再进入下一步。这个链条里，每一个环节都在消耗Token。研究数据显示，Agentic AI的Token消耗量，最高可以达到普通对话AI的1000倍。

米哈游那个200万的案例，原理就在这里。多个Agent协作时，它们互相传递的上下文、互相等待产生的重复调用，每一次都在计费，而这一切发生得极快，快到账单出来之前没人意识到。

还有一类消耗，更隐蔽，也更值得警惕：考核驱动的表演式使用。

部分企业把"Token消耗量"做成了KPI——用得越多，说明AI用得越积极。结果是什么？员工开始"演"：反复调用AI生成无用内容、凑数据、刷指标，不产生任何实际价值，反而拖慢了真正的工作流程。

代码领域的数据尤其直白。GitClear统计发现，AI辅助编写的代码，两周内的回滚量翻了9倍，复制粘贴的重复代码翻了8倍。代码写得快了，但后期维护成本更高——这笔账被算进了"AI提升效率"里，其实只是把问题推后了。

定价结构也在推高成本。Salesforce为了区分什么任务用贵模型、什么任务用便宜模型，专门花了3亿美元给Anthropic做智能路由系统——连"用哪个模型"这件事本身，都要额外付一大笔钱。

砸了几千亿，买回来的是什么

ROI的问题，在2026年上半年终于被摆上了台面。

MIT做了一项调研，结论是：企业投入的三四百亿美元里，95%打了水漂。这个数字在业内引发了不小的争议，但没有人能拿出有力的反驳数据。

摩根大通的测算更具体：要实现仅仅10%的投资回报率，AI行业每年至少需要产生6500亿美元的营收。目前全行业离这个门槛还差得很远。

超过半数的CEO表示，尚未从AI部署中看到实际收益。只有12%的企业负责人实现了"高营收+低成本"的双重目标。

微软的内部报告直接点明：使用AI的成本，已经高于雇用人类员工，但并没有带来相应的生产力提升和创新回报。

"AI替代人工"这个故事，也在被重新审视。2026年1月的报告显示，企业并没有大规模用AI替代员工——不是不想，而是AI在可靠性和判断力上仍然差得太远，真正能交给AI独立完成的工作，比想象中少得多。

还有一类情况更复杂：部分企业宣称的"AI驱动裁员"，实际上可能是用AI做遮羞布。业务本身在走下坡路，裁员是必然选项，但贴上"AI替代"的标签，听起来更像是在跟上趋势，而不是承认经营困难。2025年AI相关裁员同比增长了100%，其中有多少是真正的技术替代，有多少是借势操作，很难厘清。

微软、Meta、Amazon、Uber，巨头们开始算账了

踩刹车的信号，在2026年上半年密集出现。

微软以"统一到自家工具"为由，削减了大批员工使用Claude的权限。官方解释是工具整合，外界普遍认为真实原因是成本失控。毕竟，微软自己就有Copilot，为什么还要给员工付Anthropic的钱？

Meta和Amazon也在同步收缩。Uber高管在内部会议上明确警告：Token消耗量与成功的产品交付之间，目前还没有建立起清晰的关联，继续这样烧下去，说不清楚价值在哪里。

Anthropic遇到了一个反直觉的处境：用户量在高速增长，但他们开始主动给用户限流。原因很简单——AI算力不像互联网带宽，用户越多、调用越频繁，成本就越高，而不是像互联网那样边际成本趋近于零。用户增长对Anthropic来说，在某个临界点之后反而是压力，不是喜讯。

定价体系也在松动。AWS打破了自己20多年的定价惯例，开始重新调整云服务价格。豆包等国内产品，也从免费使用开始转向收费模式。这些不是孤立的商业决策，背后是整个行业对"无限扩张"逻辑的重新评估。

有分析师早在2025年底就发出预警，认为AI有可能重蹈2000年代初电信和光纤基础设施的覆辙——那一轮大规模建设里，资本砸下去了，营收增速却远远跟不上投资规模，泡沫破裂后留下一地烂摊子。历史不一定重演，但参考系在那里。

先想清楚要解决什么问题，再谈AI

回到米哈游那个200万的案例。

这200万烧得不是完全没有价值。事后复盘，团队弄清楚了Agent协作为什么会空转、问题出在哪个环节、下一步应该怎么调整架构。这笔钱是一份诊断报告的费用，虽然贵，但是有结论。

那家单月5亿美元的公司呢？账单摆在那里，"很难将支出与实际产出对应起来"——连买到了什么都说不清楚。

这是目前AI使用上最根本的分野：有没有在烧钱之前想清楚要解决什么问题，烧完之后有没有办法验证问题是否真的被解决了。

"精打细算地用AI"正在取代"抢着上AI"，这个转变不是保守，而是行业被账单逼出来的必要修正。Salesforce花3亿美元做模型路由，看起来荒诞，但背后的逻辑是：不同的任务应该用不同定价的模型，不是所有问题都值得调用最贵的算力。这种思维方式，比"Token越多越好"要理性得多。

当前市场有一个核心矛盾没有解开：AI公司需要大规模Token消耗才能支撑收入，但使用AI的企业正在发现这笔账越来越难算过来。双方都在等对方先让步——AI公司希望企业继续烧，企业希望AI公司把价格降下来，或者先证明价值。

这个僵局要打破，大概需要三件事同时发生：算力成本继续大幅下降；模型在可靠性和实用性上真正成熟，而不只是在演示环境里表现好看；ROI能够被企业用标准化的方式清晰度量，而不是靠"直觉上感觉有用"来说服财务部门。

三件事都不是不可能，但也都没有明确的时间表。

最后一个问题，还没有人给出令人信服的答案：这场狂欢，最终谁来买单？是继续砸钱却看不到回报的企业？是被"AI替代"预期压着、人心惶惶的员工？还是估值撑在高位、但利润表还是一片红的AI公司？

账单不会消失，只是换人付。

AI账单失控：烧Token曾经是荣耀，现在是头号难题

晨涧云

烧Token，曾经是一种荣耀

一个月5亿美元，这些账单是怎么烧出来的

Token消耗是普通对话的上千倍，钱都去哪儿了

砸了几千亿，买回来的是什么

微软、Meta、Amazon、Uber，巨头们开始算账了

先想清楚要解决什么问题，再谈AI

阅读更多

Fable 5被封48小时后，智谱GLM-5.2全量开放：1M上下文+MIT开源的战略答卷

Anthropic 发布 Claude Fable 5：最强公开模型的「神话」与现实

ChatGPT记忆系统全面升级：Dreaming V3如何让AI真正「认识」你

MiniMax M3正式发布：编程能力跃升、百万上下文背后的技术野心与商业阵痛