小米陈龙谈智驾:先让大模型长到十八岁
创始人
2026-05-10 21:34:25

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

(来源:21世纪经济报道)

近期,《21汽车·一见Auto》与小米汽车智能驾驶基座大模型负责人陈龙进行了一次面对面访谈。

“小时候,我们学说话和认字。随着慢慢成长,我们会经常摸、拿、抓、取一些东西。等到我们具备了强大的语言能力和对空间的理解和推理能力,差不多十八岁以后,我们再去学习。这样才能将我们习得的一切融入驾驶之中,不仅开得更快,还开得更好。XLA 大模型也一样。”在访谈时,陈龙对我们说。

3月份,小米刚发布了新一代SU7,并宣布辅助驾驶升级到 XLA 认知大模型架构。小米集团董事长雷军在新一代SU7发布会上称,之所以命名为 “XLA” 而非业内俗称的 “VLA(Vision-Language-Action Model,视觉 - 语言 - 动作)”大模型,是因为模型具备“多模态的认知输入”:小米还融入了声音、机器人数据等模态。

陈龙就是开发 XLA 认知大模型的负责人。童年时,他喜欢美剧《霹雳游侠》里的智能跑车 KITT,这台跑车有鲜明的自我意识,通过自动驾驶多次帮助主角化险为夷。长大后,他曾在英国剑桥大学孵化的自动驾驶公司 Wayve 任职,是将 VLA 模型引入辅助驾驶领域的先行者,致力于令大模型的驾驶决策过程更加透明。一年之前,他加入小米,担任辅助驾驶 VLA 技术负责人。

彼时的小米辅助驾驶架构还处于 “端到端(End-to-End,一种深度学习模型范式,直接从原始输入映射到最终输出) + VLM(视觉 - 语言模型,Vision-Language Model) ” 阶段。陈龙将这一阶段的核心,提炼为“数据驱动”。端到端拆掉了传统辅助驾驶的“感知”“规划”“决策”模块,通过直接灌入大量驾驶场景数据,直接让模型学习并输出驾驶行为。2024年,国内车企及供应商集体切换到端到端架构,辅助驾驶的整体水平均得到了质的提升。

但进入2025年,端到端架构的缺陷开始显现。通俗来说,大模型虽然靠“死记硬背”海量的驾驶数据提升了自己的驾驶水平,但现实世界总会出现更多元、更复杂的驾驶场景。大模型需要真正理解和认知人类社会和现实世界,才不会在现实世界中遇到新的场景时“傻眼”,像老司机一样思考,做到“举一反三”。——陈龙将新阶段的核心,提炼为“认知驱动”。

相关内容

热门资讯

带宽公司(BAND)股价飙升:... 带宽公司(BAND)盘中飙升9.31%,股价达71.02美元,创52周新高71.50美元。2026年...
疲劳驾驶认定规则 不涉及网约车... 《机动车驾驶人疲劳驾驶认定规则》6月1日起实施。连日来,“限制网约车司机驾驶时间”等解读在网上流传甚...
Tempus首个全基因组检测或... Tempus首款全基因组测序检测产品xH原计划2025年1月用于研究,现将于明年投入临床应用。今年早...
盈透证券5月日均收入交易笔数激...   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! 市场将盈透证券归为“...
不,这并非山寨币轮动 本周流传说法称比特币ETF资金流出14.2亿美元,HYPE ETF推动山寨币资金流入,但该说法经不起...