AI账单暴涨,实际效益难言:谁在助推“Token通胀”?

玩轉最新遊戲資訊,洞悉行業動態 - j9
作者 David Thompson
发布于 2026-07-03
阅读量 5分钟阅读
玩轉最新遊戲資訊,洞悉行業動態 - j9 玩轉最新遊戲資訊,洞悉行業動態 - j9

每天,人们消耗的Token数量高达数万亿,这仅仅是中国用户日均消耗量的一小部分。到了2026年上半年,从中国的科技创新中心到美国的硅谷,企业内部最热门的话题变成了“你今天花了多少Token?”。这个数字可能高达几十万、几百万甚至几千万。对于普通人来说,这听起来像是天方夜谭,但事实是,他们谈论的并非人民币,而是Token。

尽管Token与实际金钱之间存在巨大的数量差距,但Token数量的飞速增长却是不争的事实。有报道称,一家国外公司在为员工批量开通Anthropic的Claude企业版时,因未设置消费上限,一个月后收到的账单高达5亿美元,约合人民币34亿元。

在国内,近期发生的一个案例来自米哈游。该公司《崩坏》系列的技术团队负责人郑银河在2026年5月的阿里云峰会上透露,一名工程师在测试多Agent协作时,由于未设置熔断机制,导致数十个智能体陷入无限循环调用,在短短13小时内就产生了高达200万元人民币的Token费用。

然而,在AI账单激增的同时,其带来的实际效益却难以令人满意。米哈游工程师那200万元的Token费用,足以支付一个小型研发团队一个月的薪资,最终却只换来了“AI摸鱼”式的无产出。企业可能只是完成了裁员目标,并将节省下来的人力成本重新投入到AI建设和Token购买中。

Token作为AI时代的重要“货币”,其单位价值正在被稀释,消耗量呈指数级增长,投入与产出之间出现了错位,呈现出明显的通胀特征。这种通胀的程度,甚至可能比津巴布韦的货币贬值更为夸张。那么,究竟是谁在助长这种“Token通胀”的现象呢?

01 从过度使用到严格管控

2026年上半年,硅谷流行起一种名为“Tokenmaxxing”的趋势,即最大化Token的使用量。大型科技公司纷纷鼓励员工尽可能多地消耗Token,甚至将其与绩效考核直接挂钩。

Meta公司内部设立了追踪8.5万名员工Token消耗量的排行榜,并为消耗量高的员工颁发“Token传说”或“缓存大师”等称号。亚马逊也推出了名为“KiroRank”的内部AI使用排行榜,将Token消耗数据纳入团队绩效评估。英伟达CEO黄仁勋更是表示,如果他的工程师消耗的Token价值不到年薪的一半,他会感到担忧。

国内厂商也迅速跟进。腾讯于2026年3月启动了全员AI激励计划,为每位员工提供年均22万元的Token资源,覆盖Cursor、CodeBuddy等国内外多款工具,公司内部也一度出现了Token消耗排行榜。

结果不出所料,这些公司的AI账单开始失控。

在短短30天内,Meta员工消耗了60.2万亿Token,成本超过1亿美元。Uber仅用了4个月就花光了2026年全年的AI预算,管理层不得不紧急出台限额令,规定每位员工每月AI工具费用不得超过1500美元。亚马逊也开始实施严格的Token限额管理,高级副总裁Dave Treadwell甚至呼吁员工“不要为了使用AI而使用AI”。

就在上个月,腾讯内部也发布了额度调整通知:全员Token配额大幅缩减,核心研发团队的月额度从宽松状态收紧至7000元人民币,外包岗位的额度更是降至1000元人民币。

从最初的全员敞开使用,到如今的严格限额,短短三个月内,情况发生了戏剧性的转变。究其原因,无非是飙升的账单让即使是财力雄厚的大公司也感到难以承受。

正如OpenAI首席执行官山姆·奥特曼近期在一个企业客户活动上所言:“今年年初,AI的运行成本还不是一个被提及的问题,但现在它已经成了一个巨大的挑战。”

这背后是需求的爆炸式增长。国家数据局的数据显示,2026年3月,中国日均Token调用量已超过140万亿,而2024年初仅为1000亿,两年内增长了千倍以上。

从全球范围来看,这种增长趋势并未显示出放缓的迹象。高盛近期发布的报告预测,到2030年,全球月度Token消耗量将比2026年增长24倍,达到约120千万亿(120 quadrillion)Token/月,其中企业级智能体是主要的增长驱动力。

Token账单的失控也带来了另一个负面影响。为了弥补AI成本的巨大缺口,今年一季度,十余家海外科技巨头进行了超过4万人的裁员,程序员首当其冲;而在国内,“630”成为了许多互联网从业者的“最后一天”。

在Meta,几乎没有人再手动编写代码;在国内的头部大厂,新增代码中高达90%由AI生成。AI代码生成比例的急剧上升,直接导致了对人力需求的下降,并引发了职场震荡。

02 Token账单飙升之谜

账单费用由“用量”和“价格”两部分构成。然而,在这看似简单的公式背后,隐藏着两层不透明的推高逻辑,最终导致了指数级的成本膨胀。

许多人存在一种误解:大模型的价格一直在下降,AI不应该越来越便宜吗?实际上,这种说法只对了一半。便宜的通常是通用型轻量级模型,而企业真正需要的高价值场景,如编程、长上下文处理和复杂推理等,其价格不仅没有下降,反而呈现上涨趋势。

Anthropic推出的安全增强版模型Fable 5,其输入价格高达每百万Token 10美元,输出价格为50美元,是同期Opus系列的两倍。

国内的智谱AI也是一个典型例子。据天眼查数据显示,2026年第一季度,智谱AI因新模型迭代连续三次上调了核心API的价格,累计涨幅达83%。其面向通用场景的GLM-4.7轻量模型,输入价格仅为2-4元/百万Token,输出价格为8-16元;而针对编程和Agent场景的GLM-5.2,输入价格上涨至8元,输出高达28元,两者价差最高可达4倍。

此外,腾讯云在2026年3月至4月经历了两次价格调整,混元HY 2.0 Instruct模型的输入价格涨幅高达463%;MiniMax核心模型的定价也有30%-50%的上调。

与此同时,模型厂商的计费模式已从订阅制全面转向按量付费,这意味着厂商的收入直接与Token消耗量挂钩。这造成了一个结构性矛盾:客户的目标是以最少的Token完成任务,而厂商的商业利益则天然地倾向于让客户消耗更多的Token。

从实际数据来看,Token消耗量的增长并非线性,而是指数级的。

自2025年底以来,AI产业最核心的变化是从对话式AI向智能体(Agent)的跃迁。AI不再是简单的问答交互,而是演变为自主规划、循环调用、多轮纠错的复杂流程,Token消耗也随之从线性增长转变为指数级膨胀。

Agent虽然功能强大,但根据腾讯研究院的分析,它存在几种典型的低效消耗模式:

  • **上下文陷阱:**智能体在每一步操作时都会重复带入历史对话、工具日志和文件内容,同一批信息被反复计费。
  • **技能冗余:**对49个软件工程技能的基准测试显示,79.6%的技能对任务通过率没有提升,却可能带来高达451%的Token开销增长。
  • **多Agent的“沟通成本”:**多个智能体协同工作时,会不断重复任务背景、结论和格式化的套话,每一次对话都可能产生重复计费。
  • **长任务的“熵增”:**任务链条越长,越容易出现偏差,而为了纠偏,需要增加摘要、检查、回滚等机制,进一步推高消耗。

这些损耗并非简单的叠加,而是相互作用产生的乘积效应。一个复杂的多Agent任务,可能近一半的Token被用于内部协调、自我纠错和重复读取,真正用于生成有效内容的比例并不高。对于缺乏技术能力的企业来说,这更是一笔难以看清、难以计算的糊涂账。

03 害怕被落下(FOMO)的焦虑

如果说大模型厂商的产品和定价策略是公开的“阳谋”,那么企业内部的Token消费则是一场自上而下的“自我消耗”。

企业普遍担心错过AI变革的浪潮,因此纷纷积极拥抱AI。这种压力也传递到每一位员工身上,尤其是在AI可能取代人工的阴影下,员工普遍将“会使用AI、多使用AI”视为一种安全感来源。

许多公司将AI代码生成率、工具使用时长纳入OKR考核,甚至设立全员可见的数据看板,以此来“倒逼”员工增加Token消耗。一些原本几秒钟就能用搜索引擎或人工解决的简单任务,如邮件回复、基础代码片段、常规数据查询等,也被交给大模型处理——反正花费的是公司预算,用得越多越显得“拥抱变革”。

企业将Token消耗量与员工绩效挂钩,默认“AI使用量”等同于“价值创造”,并愿意为此支付高昂的费用。

有人认为这是历史发展的必然。历史上每一次通用技术革命,都经历了类似的阶段。蒸汽机刚发明时,工厂主发现其成本效益不如马匹;电灯刚投入使用时,其成本远高于煤气灯。

但不同的是,电力消耗产出了实实在在、可衡量的工厂效益,而Token换来的“智能”到底创造了多少价值?答案是,目前仍然难以量化。

据晚点LatePost报道,一位互联网大厂的技术管理者表示,自己部门20多人,一个月消耗5万元Token,但回顾下来,并未沉淀出多少可落地的成果。这笔钱相当于10名实习生的月薪,转化为无形的Token后,甚至连清晰的产出物都没有。

在许多基础场景中,使用AI反而比人工更昂贵,这似乎与常识相悖。

国内一家人力资源服务商曾进行过测算:使用AI筛选和初步评估一份简历,Token加上系统成本约为1.2元/份;而雇佣兼职人事处理的成本仅为0.8元/份。类似的情况在数据标注、基础文案撰写、简单客服问答等领域也普遍存在。

AI还带来了更隐蔽的成本。有软件公司的研发负责人反映,引入AI编程工具后,初级开发者的效率看似提升了,但高级工程师的评审工作量翻倍,线上故障的返工成本增加了30%以上。综合计算下来,反而不划算,而且员工的工作负担更重了。

这正是Token经济最核心的矛盾所在:Token消耗与价值创造之间,从来都不是简单的线性关系。消耗的Token越多,产出的价值并不一定越大;相反,很多时候消耗的增加恰恰源于无效的循环、冗余的设计和盲目的焦虑。

04 结语

回到最初的问题:谁在推动“Token通货膨胀”?这并非某个AI厂商的恶意营销,也不是少数员工的滥用浪费,而是我们所有人的共同行为。

从提供底层算力基础设施的GPU和存储供应商,到大模型架构固有的膨胀属性;从每一个担心错过AI浪潮而焦虑的企业,到每一位担心被时代淘汰的员工——我们所有人,共同推高了Token的消耗,导致了Token的贬值,也推高了那本日益厚重的AI账单。

我们都在助推Token的通胀,而我们自己也在这股浪潮中步履维艰。

留下你的寶貴意見,與我們一同成長

j9