AI账单失控:烧Token曾经是荣耀,现在是头号难题

从Meta 8万员工竞相烧Token,到Uber全年AI预算不到年中已花光,再到某公司单月5亿美元账单却说不清买到了什么——AI支出在短短一年内从没人在意变成了头号难题。这篇文章梳理真实案例,拆解成本失控的底层逻辑,以及巨头们开始踩刹车背后的行业转折。

AI账单失控与Token危机

烧Token,曾经是一种荣耀

去年这个时候,很少有公司会认真追问AI到底花了多少钱。今年,这个问题已经成了很多企业高管会议上最烫手的议题。

Sam Altman前不久公开承认,他自己都对AI支出规模感到困惑——这话出自OpenAI的创始人,多少有点耐人寻味。

在此之前,"烧Token"不是问题,而是某种身份象征。Meta内部员工自发做了一个排行榜,8万名员工互相比拼谁用AI用得更猛,30天内集体烧掉超过60万亿个Token,折合约9亿美元。没人觉得这有什么不对,反而有种竞技的氛围在里面——谁用得少,谁才是落伍的。

英伟达CEO黄仁勋在公开场合表态:如果一个工程师一年用不到25万美元的Token,他会"深感不安"。说这话的人是算力的最大卖家,立场本身就值得留意,但这句话确实代表了那个时期的主流态度:不烧Token,就是不够努力。

现在流行一个冷笑话:2026全年的AI预算,第一季度就花完了。


一个月5亿美元,这些账单是怎么烧出来的

笑话背后是真实的账单。

某家大公司开通了Claude的全线权限,单月AI支出烧掉了5亿美元,折合人民币约34亿。作为参考,A股95%的上市公司,一整年的营收都没有这个数字高。

这笔钱买到了什么?运营负责人的说法是:"很难将支出与实际产出对应起来。"

类似的情况在Uber身上也发生了。Uber给2026全年设定了Cloud Code预算,但不到年中,预算已经提前花光。Uber高管公开承认,目前还无法将Token消耗量与成功交付的产品直接挂钩。

米哈游有一个更戏剧性的案例。某员工调用了数十个AI智能体协作处理任务,一晚上什么实质性工作都没做,账单显示烧掉了200万人民币。事后复盘,根本原因是多个Agent之间互相调用、互相等待,形成空转循环——Token在不断消耗,但有效输出为零。

还有一家公司,月度AI账单跑到40万美元,老板直接拍板:每人每月限额500美元,模型从Claude Code换成了DeepSeek。

这些不是极端案例。2026年初以来,类似的故事在各个行业反复出现,只是规模大小不同。

从更宏观的视角看,这场烧钱狂欢的规模有多大:

数据来源 数字 说明
OpenAI 2026年预计营收 130亿美元 同年预计亏损140亿美元
字节跳动算力日耗 4.38亿美元 利润同比暴跌70%
全球五大云厂商AI投资 6900亿美元 同比翻倍
腾讯云Token单次涨幅 463% 一夜调价

卖算力的人赚到钱了吗?不一定。OpenAI每收入1美元,算力成本平均只能回收0.68美元——卖得越多,亏得越多。


Token消耗是普通对话的上千倍,钱都去哪儿了

很多人觉得AI不就是问问题、给答案,怎么会这么贵?

答案在于Agent任务的工作方式。

当你让一个AI智能体完成一项任务,它不是直接给你答案,而是把任务拆成十几个步骤,每一步都要调用模型、生成输出、传递上下文,再进入下一步。这个链条里,每一个环节都在消耗Token。研究数据显示,Agentic AI的Token消耗量,最高可以达到普通对话AI的1000倍。

米哈游那个200万的案例,原理就在这里。多个Agent协作时,它们互相传递的上下文、互相等待产生的重复调用,每一次都在计费,而这一切发生得极快,快到账单出来之前没人意识到。

还有一类消耗,更隐蔽,也更值得警惕:考核驱动的表演式使用

部分企业把"Token消耗量"做成了KPI——用得越多,说明AI用得越积极。结果是什么?员工开始"演":反复调用AI生成无用内容、凑数据、刷指标,不产生任何实际价值,反而拖慢了真正的工作流程。

代码领域的数据尤其直白。GitClear统计发现,AI辅助编写的代码,两周内的回滚量翻了9倍,复制粘贴的重复代码翻了8倍。代码写得快了,但后期维护成本更高——这笔账被算进了"AI提升效率"里,其实只是把问题推后了。

定价结构也在推高成本。Salesforce为了区分什么任务用贵模型、什么任务用便宜模型,专门花了3亿美元给Anthropic做智能路由系统——连"用哪个模型"这件事本身,都要额外付一大笔钱。


砸了几千亿,买回来的是什么

ROI的问题,在2026年上半年终于被摆上了台面。

MIT做了一项调研,结论是:企业投入的三四百亿美元里,95%打了水漂。这个数字在业内引发了不小的争议,但没有人能拿出有力的反驳数据。

摩根大通的测算更具体:要实现仅仅10%的投资回报率,AI行业每年至少需要产生6500亿美元的营收。目前全行业离这个门槛还差得很远。

超过半数的CEO表示,尚未从AI部署中看到实际收益。只有12%的企业负责人实现了"高营收+低成本"的双重目标。

微软的内部报告直接点明:使用AI的成本,已经高于雇用人类员工,但并没有带来相应的生产力提升和创新回报。

"AI替代人工"这个故事,也在被重新审视。2026年1月的报告显示,企业并没有大规模用AI替代员工——不是不想,而是AI在可靠性和判断力上仍然差得太远,真正能交给AI独立完成的工作,比想象中少得多。

还有一类情况更复杂:部分企业宣称的"AI驱动裁员",实际上可能是用AI做遮羞布。业务本身在走下坡路,裁员是必然选项,但贴上"AI替代"的标签,听起来更像是在跟上趋势,而不是承认经营困难。2025年AI相关裁员同比增长了100%,其中有多少是真正的技术替代,有多少是借势操作,很难厘清。


微软、Meta、Amazon、Uber,巨头们开始算账了

踩刹车的信号,在2026年上半年密集出现。

微软以"统一到自家工具"为由,削减了大批员工使用Claude的权限。官方解释是工具整合,外界普遍认为真实原因是成本失控。毕竟,微软自己就有Copilot,为什么还要给员工付Anthropic的钱?

Meta和Amazon也在同步收缩。Uber高管在内部会议上明确警告:Token消耗量与成功的产品交付之间,目前还没有建立起清晰的关联,继续这样烧下去,说不清楚价值在哪里。

Anthropic遇到了一个反直觉的处境:用户量在高速增长,但他们开始主动给用户限流。原因很简单——AI算力不像互联网带宽,用户越多、调用越频繁,成本就越高,而不是像互联网那样边际成本趋近于零。用户增长对Anthropic来说,在某个临界点之后反而是压力,不是喜讯。

定价体系也在松动。AWS打破了自己20多年的定价惯例,开始重新调整云服务价格。豆包等国内产品,也从免费使用开始转向收费模式。这些不是孤立的商业决策,背后是整个行业对"无限扩张"逻辑的重新评估。

有分析师早在2025年底就发出预警,认为AI有可能重蹈2000年代初电信和光纤基础设施的覆辙——那一轮大规模建设里,资本砸下去了,营收增速却远远跟不上投资规模,泡沫破裂后留下一地烂摊子。历史不一定重演,但参考系在那里。


先想清楚要解决什么问题,再谈AI

回到米哈游那个200万的案例。

这200万烧得不是完全没有价值。事后复盘,团队弄清楚了Agent协作为什么会空转、问题出在哪个环节、下一步应该怎么调整架构。这笔钱是一份诊断报告的费用,虽然贵,但是有结论。

那家单月5亿美元的公司呢?账单摆在那里,"很难将支出与实际产出对应起来"——连买到了什么都说不清楚。

这是目前AI使用上最根本的分野:有没有在烧钱之前想清楚要解决什么问题,烧完之后有没有办法验证问题是否真的被解决了。

"精打细算地用AI"正在取代"抢着上AI",这个转变不是保守,而是行业被账单逼出来的必要修正。Salesforce花3亿美元做模型路由,看起来荒诞,但背后的逻辑是:不同的任务应该用不同定价的模型,不是所有问题都值得调用最贵的算力。这种思维方式,比"Token越多越好"要理性得多。

当前市场有一个核心矛盾没有解开:AI公司需要大规模Token消耗才能支撑收入,但使用AI的企业正在发现这笔账越来越难算过来。双方都在等对方先让步——AI公司希望企业继续烧,企业希望AI公司把价格降下来,或者先证明价值。

这个僵局要打破,大概需要三件事同时发生:算力成本继续大幅下降;模型在可靠性和实用性上真正成熟,而不只是在演示环境里表现好看;ROI能够被企业用标准化的方式清晰度量,而不是靠"直觉上感觉有用"来说服财务部门。

三件事都不是不可能,但也都没有明确的时间表。

最后一个问题,还没有人给出令人信服的答案:这场狂欢,最终谁来买单?是继续砸钱却看不到回报的企业?是被"AI替代"预期压着、人心惶惶的员工?还是估值撑在高位、但利润表还是一片红的AI公司?

账单不会消失,只是换人付。