(来源:中智观察)
1月22日,在百度文心Moment大会现场,文心大模型5.0正式版上线。
百度介绍,文心大模型5.0正式版参数达2.4万亿,采用原生全模态统一建模技术,具备全模态理解与生成能力,支持文本、图像、音频、视频等多种信息的输入与输出。并且宣布,在40余项权威基准的综合评测中,文心5.0正式版的语言与多模态理解能力稳居国际第一梯队。图像与视频生成能力与垂直领域专精模型相当,整体处于全球领先水平。
但其实我更关注的是前两天百度旗下文心助手发布的消息,它对外宣称实现了搜索与AI的深度重构。它不仅接入了百度地图、百度健康等内部产品,还通过MCP服务工具链接了京东、美团、携程、盈米基金等上百家合作伙伴,覆盖电商、健康、本地生活、金融、法律等十余个领域实现了从“信息提供者”向“服务交付者”的转变。
一周前,1月15日阿里千问App率先实现了“一句话搞定实际任务”的革命性体验。当天,千问App发布新版本,全面接入淘宝、支付宝、淘宝闪购、飞猪、高德等阿里生态业务,在全球首次实现点外卖、买东西、订机票等AI购物功能,并向所有用户开放测试。据了解,此次升级将上线超400项AI办事功能,让千问App成为全球首个能完成真实生活复杂任务的AI助手,引领AI行业从“聊天对话”迈入“办事时代”。
再到去年12月1日,字节跳动豆包团队与中兴通讯合作推出努比亚M153工程样机,即豆包手机。它助手基于GUI(图形用户界面)模拟点击技术,通过获得Android系统INJECT_EVENTS高危权限,实现了像用户一样直接操作屏幕元素的能力,从而完成跨应用自动任务,如购物比价、下单等。
豆包手机一发布,便在引发全网抢机热潮。但马上便触发超级App封禁。微信、支付宝等很多应用开始以“安全风险”为由限制其登录或操作。这揭示AI手机落地障碍:事件凸显了第三方AI代理面临的系统级操作权限、系统级记忆能力、跨应用接口连接三大核心障碍,这些关键资源目前掌握在手机厂商手中。
这三大事件的背后,其实都在清晰地表明一个信号:AI、大模型的竞争焦点,超级入口的权重超过了大模型本身技术变革的提升。
为什么?因为大模型进化的边际效应正在递减。
当模型的智商(IQ)达到120分以后,再提升到130分,对于90%的日常任务(订票、写邮件、查天气)来说,用户的体验差异是不明显的。就像现在的电动车,续航从600公里提升到700公里,对用户来说感知不强,但如果你能让他不用下车就能自动充电(也就是任务闭环),那才是革命性的。
因此,现在的局势是:大模型是电力:它必须稳定、便宜、无处不在,但它本身很难直接向C端用户收高价(除非是极客)。任务助手是电网+电器:谁掌握了这个界面,谁就拥有了定义用户行为的权力。
如果你只是一个模型,你就像是藏在发电厂里的发电机,用户看不见你。但如果你是一个任务助手(Agent),你就像是Siri的终极形态,用户说我要去火星,你就能自动帮他搞定火箭票、保险和行李托运。
在中国,这个逻辑更残酷:字节跳动的豆包、阿里的通义千问、百度的文心一言,他们在疯狂烧钱买流量、做APP,就是为了抢占这个第一界面。一旦用户习惯了在豆包里直接点外卖,他就再也不会去打开美团APP,也不会去用豆包或其他AI机器人。
所以我的判断是:未来1-2年,得入口者得天下。如果你的模型再好,但没有几亿用户天天用它来干活,你就没有数据飞轮,你的模型就会退化。