谷歌token消耗量一年增长50倍,已是微软/ChatGPT的6倍
创始人
2025-06-18 14:16:32

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

今天巴克莱一篇对比谷歌和微软在推理流量上token消耗的对比,非常有意思,甚至有些出乎投资者意料外的内容。“免费”带来需求暴增,而且推理成本比预期的低不少。

1.AI推理规模的绝对领先

Alphabet在1Q25共推理≈634万亿(634T)tokens,而Microsoft约100T;到2025年4月,月度推理量已升至480T,较一年前的9.7T激增50倍,显示Google在AI推理流量上具备6倍于Azure/ChatGPT的规模优势。

2.增长驱动力——免费AI产品而非付费订阅

推理量暴涨主要来自Search的AIOverviews等免费场景;GoogleSearch用户基数约为ChatGPT的5–6倍,免费AItoken增速(50×)远超付费大模型收入增速(3–4×),凸显Google先以用户与数据壁垒为先、后续再寻求变现。

3.成本冲击被高估:推理花费仅占搜索收入≈1%

按Gemini2.5费率估算,1Q25推理成本约7.5亿美元,仅占搜索收入的≈1%(占COGS+Opex1.6%);即便token按4倍速度继续攀升,也仍低于搜索核心基础设施成本(≈18%收入),缓解市场对利润率下滑的担忧。

4.资本开支结构:训练为主,推理仅用≈10%

GoogleAI计算CAPEX中约90%仍投向训练与新模型,推理对应的芯片CAPEX在1Q25仅6.2%(≈6亿美元)。若按480T月度run-rate估算,2Q25推理CAPEX也仅升至≈14%,显示资金仍主要押注长期模型演进。

5.硬件效率:≈27万颗TPUv6即可支撑现有推理

采用50/50Pro与Flash模型、15%ActiveParameters假设,Google仅用≈270kTPUv6(ASP≈4,500美元)即可覆盖1Q25推理负荷,体现自研加速器在功耗与成本端的优势。

6.未来催化:Astra、Mariner、Veo等代理式应用

尚未全面放量的通用AI助手(ProjectAstra)、浏览器代理(Mariner)和视频生成模型(Veo)预计将进一步推高token基数,Google已提前把Compute CAPEX提升到总CAPEX的>50%,为2026年后AI需求埋下增量弹性。

相关内容

热门资讯

今年我省粮食产量达515.56... (来源:辽宁日报)转自:辽宁日报 图为在中储粮(盘锦)储运有限公司,装运粮食的重型卡车排起长队...
国家发展改革委部署促进投资止跌... (来源:辽宁日报)转自:辽宁日报 新华社北京12月13日电 (记者魏玉坤) 记者13日从全国发展和改...
江苏省实施《中华人民共和国森林... (来源:新华日报) 目 录 第一章 总则 第二章 森林、林木和林地权属管理...
姜堰数字化产品讲“活”理论 (来源:新华日报) □ 本报记者 卢佳乐 通讯员 姜宣 “王教授,您约我‘喝茶论道’,...
联合国维和部队在苏丹遇袭 6人... 转自:财联社【联合国维和部队在苏丹遇袭 6人死亡】财联社12月14日电,当地时间13日,苏丹武装部队...