7月28日,2025世界人工智能大会(WAIC)“启明创投·创业与投资论坛——创业投资开启AI技术与应用共振周期”在上海世博中心举办。
著名专家与学者,顶尖投资人和领军创业者汇聚一堂,围绕AI领域的技术突破、前沿趋势、应用落地等主题展开分享与交流。
论坛现场 潘洁摄清华大学电子工程系长聘教授,无问芯穹发起人汪玉表示,AI具备形成生产力的潜力,其中数据是提升生产力的关键要素。
他直言,在AI大模型时代,数据要素或可聚焦于“Token”。AI 1.0时代,垂类数据用于训练垂类模型;AI 2.0时代,全球数据转化为Token训练大模型,再输出至不同模态以支持多模态应用。因此,Token的输入输出至关重要,数据处理的范式也从“电能—算力—简单任务”转变为“电能—算力—Token—复杂任务”。相应地,基础设施的评价标准从每焦耳或每瓦特的计算次数,转变为支撑的Token数,AI 2.0时代需着重思考单位功耗下的Token变化。
“随着人工智能发展,在保证智能水平超过一定阈值的前提下,可将优化Token/J作为基础设施和系统设计的重要指标。”汪玉进一步指出,不同智能等级对Token/J的要求差异显著,从智能对话到具身智能控制,随着智能要求提升,Token/J的差距可达2—3个数量级,这需要软硬件协同优化。
在他看来,无问芯穹已具备支持算力多元调度的能力,可服务全国多地的算力消耗方,未来将进一步提升应用高效性,“我们希望联动产业链上下游伙伴,共同打造新一代云端和终端设备,适配各类端侧芯片,服务联想等合作伙伴。一方面,通过异构云赋能千行百业;另一方面,推动新终端走进千家万户”。
启明创投主管合伙人周志峰表示,过去,人们常常提到“大语言模型”,但语言只是人类感知和交互的一个维度。如果能够将语音、图像、视频,甚至未来的物联网多维信息融入其中,那么模型对世界的感知与交互将会变得更加丰富多彩。
他说,除了语言主导的模型外,图像和视频生成模型也取得了很大的进展。今年5月,谷歌发布的“Veo 3”模型,已经能生成非常真实的视频,而且还能自动添加音效、对白、背景噪音,让你感觉就像是在观看一个真实世界的视频记录。
“再就是Agent,这是从今年3月开始最火的话题。”周志峰认为,其的爆火是因为基础模型能力的提升。如今,基础模型的上下文窗口更大,能够使用外部工具,核心还是“推理能力”的增强。现在甚至出现了“智能体的摩尔定律”——任务处理复杂度每七个月翻一倍,“我们可以大胆地期待,Agent再经历一、两个‘七个月周期’后,会达到什么样的智能水平,或许会给我们带来更多的惊喜”。
作为中国在AI领域最早投资且布局最丰富的投资机构,这是启明创投连续第三年主办该论坛。从AI 1.0到AI 2.0,启明创投累计投资100余个AI项目,投资企业覆盖AI产业全链条。
随后,周志峰围绕基础模型、多模态模型、AI Agent、AI基础设施、AI应用、具身智能,连续第三年发布启明创投AI十大展望。
具体内容包括:未来12—24个月,200万Token的上下文窗口将成为顶级AI模型的标配;通用视频模型有望在12—24个月内出现;未来12—24个月,Agent形态将从“工具辅助”走向“任务承接”,首批真正意义上的“AI员工”将进入企业;AI芯片领域,将有更多“国设”且“国造”的GPU开启批量交付;AI交互范式转移将在未来两年内加速到来;AI BPO(业务外包)模式将在未来12—24个月实现商业化突破,从“交付工具”走向“交付结果”,并通过“按结果付费”的方式,在金融、客服、营销、电商等流程标准化行业快速扩张等。