120万亿Token!中国AI,正在“卷”死美国

发布时间:

2026-04-12 18:03:36

来源:格隆汇

120万亿Token!中国AI,正在“卷”死美国

202642日,火山引擎在一场巡展上,扔出了一颗“核弹”:

豆包大模型日均Token使用量,突破120万亿!

3个月内翻倍,相比发布时增长了1000倍。

同一场发布会上,火山引擎总裁谭待还抛出了一个重要细节:累计Token使用量超一万亿的企业客户,已从2025年底的约100家增至140家,短短3个月新增了40家,这标志着——AI已经从“免费试用”阶段正式进入“企业规模化付费”阶段

几乎同一天,智谱AI发布上市后首份财报,给出了一个极具冲击力的数字:2025年全年收入7.24亿元,同比增长132%;其MaaSAPI平台的年度经常性收入(ARR)已突破17亿元(约2.5亿美元),同比实现60倍增长。更关键的是,智谱的平台注册用户已突破400万,覆盖全球超过218个国家和地区。

而英伟达也没闲着,3个月内狂砸60亿美元,同时投了MarvellLumentumCoherent三家,全押在硅光子和AI光互联上。

这三件事放在一起,再次释放一个无比强烈的信号:中国AI的超级红利期,已经全面到来了


01


120万亿Token,听起来抽象。我们算笔账:

假如平均一次API调用消耗2000Token120万亿÷2000=每天6000亿次调用。

从个人助手到企业服务,从写文案到生成视频,AI已经从“尝鲜工具”变成了水电煤一样的基础设施。

更关键的是——这不是免费的狂欢,而是真金白银的付费。

数据显示,累计Token使用量超万亿的企业客户,3个月内从100家涨到140家;个人用户的Token用量,近1个月暴增16

而智谱在2026年一季度逆势将核心模型API价格上调83%后,平台调用量反而增长了约400%,呈现出典型的“量价齐升”态势。

这意味着客户不再为低价买单,而是为“能不能完成任务”付费。

免费试用→高频付费→涨价不减量,这个商业闭环,彻底跑通了。

为什么Token涨得这么疯?

因为AI的使用方式,彻底变了。

第一,视频生成,一口吃掉百万Token

字节自研的Seedance2.0,被谭待称为“中国第一个毫无争议的全球SOTA视频模型”。2026年春晚《贺花神》《驭风歌》的视觉特效就是用它生成的。

但伴随爆火的是长达7小时的排队,高峰时段排队人数长期保持在9万人左右——需求远远超出了供给。

为什么这么火?因为视频生成的Token消耗远超文本:生成1分钟720p视频,需要超过100Token,是普通文本对话的100多倍。

但与传统影视制作相比,Seedance2.0的性价比简直是降维打击——制作效率较传统模式提升逾一倍,制作成本下降70%

按业内测算,整体制作成本有望从过去的万元级降至数千元。

这才是豆包3个月Token翻倍的真实推手。

第二,智能体,让AI从“问答”变“干活”。

升级后的ArkClaw(龙虾智能体),不再是聊聊天那么简单。它能对接飞书、微信、钉钉、微博,联动网盘,自主完成信息检索、数据处理、跨工具协作。

一次企业级任务,动辄几十万甚至上百万Token

中信证券测算,智能体执行任务时整体Token消耗可能提升十倍以上,对应的算力需求得涨百倍以上。这种“推理密度”的增加,让单次任务的Token消耗呈指数级上升。

OpenRouter平台上,超过70%Token消耗来自互联网大厂、中大型企业、专业程序员的生产环境。100K1MToken这个区间(智能体工作流最典型的消耗区间),中国模型的调用量遥遥领先。

应用爆发Token增长→模型优化→更多应用。这个正向商业落地循环,真的已经转起来了。


02


很多人问:中国大模型商业化能如此迅猛,凭什么?

答案很简单:成本,低到令人发指的成本!

大模型运营成本里,60%-80%是电费。中国西部(甘肃、内蒙古、贵州)绿电价格只要0.13-0.3/度。在美国呢?0.8-1.2/度。

光电力一项,中国就比美国便宜4-5倍。

如果假设一个大型推理集群年用电量为100GWh,仅电力一项,中国的年成本约1150万美元,美国约1540万美元——差出近400万美元。

再加上MoE架构、极致量化、KV缓存……推理效率再比美国高3-10,双重降维打击下,中国模型的推理成本被压缩至美国模型的1/61/10

最终体现在API定价上(美元/百万Token):

-MiniMaxM2.5:输入0.3、输出1.1

-智谱GLM-5:输入0.3、输出2.55

-通义Qwen3.5:输入0.11、输出0.44

-对比ClaudeOpus4.6:输入5、输出25

这意味着,中国模型成本只有美国巨头的1/101/20,甚至更低。

形同天堑一样的差距。

而性能呢?在文本生成、代码、翻译、日常推理等90%的高频场景,中国头部模型已经达到GPT-5Gemini395%以上。

对绝大多数用户来说,“够用、好用、便宜”就是全部。中国模型完美踩中了这个点。

于是,全球开发者用脚投票:OpenRouter平台数据显示,47.17%的用户是美国本土开发者,中国开发者仅占6.01%,但中国大模型在该平台的周Token调用量占比已达61%,连续三周超越美国

更震撼的是调用量排名:在全球前九大模型中,中国占据五席小米MiMo-V2-Pro、阶跃星辰Step3.5FlashMiniMaxM2.5DeepSeekV3.2包揽前四,智谱GLM-5Turbo位列第六。

这样的大模型,超级便宜又足够能打,海外市场想要“脱钩”?不存在的。“成本刚需”已经碾碎了所有壁垒。

不过,另一方面,中国Token的超级红利,却是OpenAIGooglexAI的压力挑战。

来看几个硬核数据:

OpenAIChatGPT在生成式AI网页流量中的份额从20251月的86.7%暴跌至20261月的64.5%,一年跌了22.2个百分点。2月全球月活用户约5.35亿,环比下降6.5%。运营亏损预计将达到140亿美元,几乎是前一年的三倍。更讽刺的是,80%的用户全年交互不足1000次——打开率还不如外卖软件。

Google:尽管Gemini的份额从5.7%涨到了21.5%,但AIStudio开发者流失25%,被迫推出低价版GeminiFlash3美元/百万Token),但成本仍是中国模型的3倍。

xAIGrok份额从不足1%涨到3.4%,但X平台使用率下滑40%,性能不及GPT-5,成本是中国模型的10倍,基本与性价比无缘。

未来几年,我们或许会看到,全球AI市场正在形成清晰的分层格局:

一边是美国模型守住全球20%高端用户,主打国际市场专业推理、品牌溢价、企业安全,然后拿走80%收入;

另一边是中国模型拿下全球80%大众用户,主打靠薄利多销的普惠、性价比、规模化落地,拿下20%收入。

别看这20%的收入比例虽小,但放在全球市场,集中在国内少数几家大模型巨头公司上,依旧能让它们吃得满嘴流油。


03


豆包大模型日均Token使用量120万亿的背后,是算力需求的指数级暴涨的最好验证信号。

传统铜缆互联,在万卡集群中,70%的算力都浪费在数据传输上。根本扛不住视频、智能体的高带宽需求。

于是硅光子技术,成为当前唯一的解。用光信号替代电信号,带宽提升10-100倍,功耗降低70%,延迟减半。

最近,英伟达对硅光子技术的布局堪称教科书级别:

3月初:向LumentumCoherent各投20亿美元,锁定CW激光器、EML芯片等1.6T/CPO时代的核心原材料;

3月底:再向Marvell20亿美元,通过NVLinkFusion首次向第三方定制芯片开放互联协议。

30天内豪掷60亿美元,完成了对AI算力集群光互联版图的系统性合围。

黄仁勋曾高调明确说过:“推理转折点已经到来,Token生成需求激增,全球都在竞相构建人工智能工厂。”

这意味着什么?

光通信(光芯片、光模块、光纤光缆)成为AI板块最确定、弹性最大的增量赛道。

据悉,2026年全球EML光芯片需求约3.5亿颗,产能仅约2亿颗,缺口高达1.5亿颗,产能已经排到了2028年。

于是我们看到了,从2025年至今,在美股、A股甚至港股,这些赛道里都诞生了大批量的1年数倍甚至超十倍的超级大牛股,即使如此,资金依旧疯狂涌入继续推高估值

因为它们笃定,这里的增量蛋糕,还足够大,足以撑起未来更大的估值叙事。

有人担心:这波红利能持续多久?

我觉得,至少能维持3-5年。因为有三道墙,海外的大模型翻不过來:

第一,能源壁垒。“东数西算+西部绿电”是全球独有的算电协同体系。美国受地理和能源结构限制,永远复刻不了中国0.13-0.3/度的绿电成本。

第二,规模壁垒。Token调用量越大,单位成本越低。规模→成本→更多规模,正向循环一旦形成,美国模型就被彻底挤出性价比市场。

第三,生态壁垒。中国开源大模型的全球下载量已跃居世界第一。阿里通义千问Qwen累计下载超7亿次,全球第一;基于中国模型的衍生模型超18万个,远超GoogleMeta总和。全球开发者已经形成了路径依赖,迁移成本极高。

这意味着,至少到2028年,中国的大模型都能享受到这一超级巨大的结构性红利。


04 结语


中国日均Token调用量从不到1000亿到180万亿,调用量两年增长超千倍,这样的数据,足够说明一个趋势——“一套以Token计费为基础的新型商业逻辑正在全球加速演进”

Token,是AI时代的“数字石油”。而中国大模型,正在成为全球最廉价、最高效的“数字石油生产商”。

1/20的成本,95%的性能,120万亿的日均消耗。

三重优势叠加,让中国AI在全球市场势不可挡。

未来2-3年,依旧是中国Token出海的黄金窗口期。

AI应用持续爆发,算力与光通信同步兑现业绩,美国巨头持续退守高端,中国大模型全面主导全球普惠AI市场。

当廉价高效的中国Token覆盖全球每一个角落,AI的普惠时代,才真正到来。

而中国,将是这场革命的主导者,也是最大的受益者。(全文完)

免责声明:所有平台仅提供服务对接功能,资讯信息、数据资料来源于第三方,其中发布的文章、视频、数据仅代表内容发布者个人的观点,并不代表泡财经平台的观点,不构成任何投资建议,仅供参考,用户需独立做出投资决策,自行承担因信赖或使用第三方信息而导致的任何损失。投资有风险,入市需谨慎。

古东管家

请先登录后发表评论

0条评论