炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!
(来源:36氪)
2025年的商业世界正站在新旧转换的十字路口。在商业叙事重构、科技浪潮席卷的当下,WISE2025商业之王大会以“风景这边独好”为基调,试图在不确定中锚定中国商业的确定性的未来。我们在此记录这场思想盛宴的开篇,捕捉那些在变局中依然坚定前行的声音。
11月27-28日,被誉为“年度科技与商业风向标”的36氪WISE2025商业之王大会,在北京798艺术区传导空间落地。
今年的WISE不再是一场传统意义上的行业峰会,而是一次以“科技爽文短剧”为载体的沉浸式体验。从AI重塑硬件边界,到具身智能叩响真实世界的大门;从出海浪潮中的品牌全球化,到传统行业装上“赛博义肢”——我们还原的不仅是趋势,更是在捕捉在无数次商业实践中磨炼出的真知。
我们将在接下来的内容中,逐帧拆解这些“爽剧”背后的真实逻辑,一起看尽2025年商业的“风景独好”。
以下为货拉拉CTO张浩的演讲实录,经编辑:
大家下午好!我叫张浩,是货拉拉的CTO。
刚才圆桌环节,有讨论到AI今时今刻对哪个行业会有深刻的影响,地瓜机器人的秦总回答是还看不见。
接下来我给大家分享一下AI在货拉拉的应用落地,我先不讲将来,只讲我们过去两年的发展路径。讲完之后,请大家再做一个判断,看今时今刻的AI,对行业影响到底有多大?
大家在大街上应该都可以看到货拉拉的车,所以我不再赘述我们的业务场景。我们最早成立于香港,2014年进入到中国内地,到现在已经有12年的历史了。除了中国之外,我们在东南亚、南美洲等一共400多个城市和地区也有提供服务,月均有近2000万的活跃用户,200万的活跃司机。对于我们这样的业务撮合平台,最重要的事情就是撮合货主和司机之间的交易。所以运营的效率和用户的体验是货拉拉的核心能力,也是我们最需要AI能够拿下的两个核心方向。
每家公司的业务场景和落地阶段是不一样的。两年前,随着ChatGPT的横空出世,我们也开始在做这方面的研究。首先要解决的问题就是,在我们这样的行业和公司结构里,AI在哪些领域是能够起到最大作用的呢?
我们参考高盛2023年AI研报的评估方法,通过岗位调研、任务拆解、自动化难度评级,量化AI提效潜力。生成式AI将率先在高数据密度、人力密集型领域引发生产力革命,所以我们选择了业务安全、研发、产品、运营等场景作为高优先级落地,而在一些确定性要求高、容错率低的场景,比如数据分析,我们认为还不到时机。
确定了发展方向之后,接下来就是技术落地的路径问题。
跟所有科技公司一样,2023年最开始做的时候,我们也是想做行业内的垂类大模型。所以我们投入资源去做货运的行业大模型,花了很多的精力。
最后,我们用钱和时间买回来了两个结论:
第一点,基础大模型本身日新月异,在基础大模型里面花很多时间,还不如把我们整体行业里的数字资产、业务的API、行业的know-how落地做好。
第二点是,做我们自己的AI应用平台是比做基础大模型更重要的事,随着基础大模型的提高,我们自己的AI应用,也会自动地发挥更多效率。
有这两个认知之后,我们也开始调转重心,不再纠结于基础大模型。于是我们花了大概一年多的时间打造了很完整的三个平台应用,海豚平台、悟空平台和评测标注平台。
我简短地给大家讲一下我们这三个平台。
悟空平台的目的,是希望一个非专业人士,能够在5分钟之内,在公司内部搭建起一个初级的企业智能体应用。
所以它有三个比较大的特点:
一是可视化的流程编排,拖拖拽拽,就能把公司各种数据资产的API接口都拽在一起。
二是0代码的智能构建,通过自然语言就可以构建一些基本的智能体。
三是能建设企业级的工具库和MCP,就像刚才所说的,我们能够做的不是在技术层面去竞争,而是要把企业的数字化资产做到很好。
海豚平台则是面向更专业的算法开发者,为了让大家从整个数据训练到模型开发、上线维护、生命周期管理,都能做到一站式的提高效率。
我们想要通过这样一个很好的企业内部平台,为算法工程师们节省在资源、数据、模型开发、检测等等方面的时间。
当然,最重要的是构建了模型并上线之后的评测环节。对此我们推出的标注AB试验平台和拉拉智评,提升了我们在模型PK、AB试验分流等方面的完善度。
以前大家开玩笑说,“人工智能就是有多少人工就有多少智能”,因为很多时候的精力和时间都花在各种标注和评测上面。所以把评测机构做好,才能确保我们每次上线的结果都是真正可靠可重复的。
刚才简单讲了一下我们三个平台,这也是我们觉得比较骄傲的地方。我们用时间买回来一个经验:大模型是需要行业、大厂来提供的公共基础能力,但平台应用只能靠企业自己做好。做到这一点,才能够让我们的腿跑得更快。
接下来,给大家分享一下我们一些应用场景。这些场景里面,坦率说没有哪个是颠覆性的,但我认为是比较值得去推广的,也有一些微创新。
比如AI的安全防控。在货运的场景里面,大家如果用到货拉拉的话,一定会发现时不时会有违规的操作,包括违规载人,危险品驾驶,以及危险的驾驶行为等等。
这些是需要我们作为平台方来及时干涉的,但是这个周期很短,整个过程可能也就几分钟。如果这几分钟检测不到,或者没进行干预的话,就可能会发生问题。
基于安全驾驶的实时监测窗口时间很短,以及准确率要求很高的特点,我们通过大模型、通过语音、图像,还有通过整个非结构化数据的去进行实时检测和干预,对整个下单流程进行分层处置。一年多下来,我们危险品运输和违规载人的风险订单量下降了30%,同时订单提醒率也达到了100%。
第二点不得不说的是,任何一家科技公司都会使用AI Coding,必然需要思考的一个问题就是AI Coding能不能给产研提效?答案是肯定的。
从一年多以前使用AI Coding到今天为止,目前90%的个体、团队都用到了AI Coding。同时,我们整个研发流程的渗透率,从开始的PRD,到研发、上线、调试、后面的监控,AI Coding已经覆盖了60%,所以整体的渗透率是比较高的。
那么必然要说一说不高的地方。我们觉得AI Coding今时今刻大概只能提升10%的工作效率。
如果在座有工程师的话,会知道程序员并不是每天8小时都坐在那里写代码。我们算了一下,工程师每个工作日大概平均花30%的时间写代码。假设代码工作中,30%的是由AI生成的,最多就10%的上线代码是通过AI Coding得到的。这个比例还不算高。
因为我们发现,AI Coding可以在新的工程以及前端的任务里,大段大段地产生代码。但是,对一些很复杂的业务逻辑,开发者需要通过自然语言进行很多反复的交流,才能让AI得出正确的逻辑,同时还不一定能保证这些代码会上线。
也就是说,虽然写代码的时间少了,但你后面检查、纠错、测试的时间却增多了。所以一加一减,最后其实并没有那么高的效果。
接下来还有一些微创新。比如在产品体验方面,新客户可能并不清楚什么样的车适合装什么样的货,也有客户也不知道自己要装的货物有多大多重。所以我们自己做了一个“拍货选车”,用户通过自己的摄像头给货物拍一张照片,AI就能够通过点云分割,计算体积,在跟我们车库内的车型做自动匹配后,一般仅仅10秒钟就做出最合适的推荐。这个功能出来以后,大家使用的效果也是比较好的。
作为一家互联网公司,我们每天会收到成千上万的用户反馈。这些反馈的内容是林林总总的,需要打标、分类、总结,效率是非常低的。所以我们就用大语言模型做了一个用户反馈的分析器,依靠小模型来快速地识别分类,然后再通过大模型进行总结整理。
我们发现这个效果就非常好。比如我们很快就意识到,很多用户反馈我们开发票的效率太低。这种以前很可能会被忽略掉的信息,现在就能被很精准的捕捉到了。
同样的,大家肯定都经历过同事的离职和产品迭代,可能几个月几年之后,就再也不知道某个东西是谁做的,这个东西当时为什么这么做,于是存在大量的知识死角。
那这个怎么办呢?我们也用大语言模型,把我们公司所有的PRD文档、代码仓库、配置等等抓到一起。通过数据分析,我们得到了一个AI产品知识专家,这个专家就可以帮大家解决很多历史性的问题,尤其是很多知识垃圾和跨部门协作的问题。
在我们业务流程里,会有大量的、给用户发短信的需求。短信也是不便宜的,这个成本里有没有可以节省的部分呢?其实是很多的。
因为短信的内容其实是人写的,人写的就有提高的空间,所以大语言模型天然就很适合这个事情。通过智能的优化和分析,我们能够简化、优化以前表达不准确、过于冗长的短信内容,这帮我们在短信方面一年节省了大概12%左右的成本。
当然也有一个潜在的收益,就是风险防范。因为一条短信发出,可能就会送至几百万上千万用户。大语言模型能够对一些用词和内容的风险合规问题提前预测,使我们能够及时干预问题。
而且,今天AGI的技术已经让数字人无处不在了。以前纯粹文本或者是语音的助理缺乏人物形象,我们现在使用真实的AI数字人作为业务伙伴。这在无论是公司的内部场景里,还是外部场景里,都得到了非常好的应用。
比如我们的AI应用专家在通话时候,以前会出现方言听不懂、问题答非所问的现象。而且,在和外部做交流时,即使答对了,人有时候也不太信任,因为知道回答者是AI。
那怎么办呢?所以我们就做了一个AI+ASR+LDM+TTS的三维串联机构。
ASR通过我们自己独创的热词运营,还有一些跟第三方合作商供应的声学模型优化,使语义识别准确率达到94%。
同时比较重要的是,我们发现如果AI业务伙伴能带有一定的方言,往往会更有真实感。所以我们做了带口音音色的调整,让AI的真人度能够达到92%,也是做得不错的。
另外一点,很多时候,在线场景中,使用者往往带有情绪,比如问AI客服时,会带有焦急、生气的情绪。这种情况下,我们需要及时进行安抚,然后把使用者引流到不同的场景里面去,于是我们通过大语言模型做的问题改写、场景路由以及Multi-Agent的方式,让问题的解决率、准确率大幅提升。
说到最后,也闭环一下前面自己提的问题。我们觉得,今天的AI在很多以服务为主体的业务场景里,无非就是做两件事情:一是增收,二个就是降本。
每个行业不一样,像我们O2O行业里,不管是电商还是货运,它的本质还是服务行业,核心的价值依然是服务本身,这一点是不会被AI所取代的。未来如果无人驾驶+具身智能能够100%普及,这个工作也许AI能胜任,到今天为止还不是。
AI在我们这样的行业,或者是类似的行业中,提效的能力还是有些边缘的,大概在5%-10%。中间可能有的岗位会被影响得多一些,但总的来说还是一个提效、防风险和降成本的渠道。
接下来,当然我们还是要乐观。我觉得,首先,基础大模型的演进是日新月异的,它具有指数级的发展。所以很多在今天是问题的问题,可能三个月之后就不再是任何问题。
具体的落地方面,我们希望接下来还是朝多模态模型方案去进展。刚才提到了我们的AI业务伙伴,还是分三个阶段:ASR、LLM和TTS。但这个整体在维持它的准确率和时延上,我们还是比较困难的。
所以接下来,单个模型整合、端到端三个模块,将会是我们未来的一个方向。我们现在单个的数字人做得比较好,但未来我们希望从上游到下游,全部打通,用多个数字人整体提高企业的流程效率。
当然最重要的是用户体验,刚才提得比较少,因为确实现在我们觉得能够起到的作用还相对比较小。但是未来,我们希望随着AI能力的提高,将可以通过端到端的大模型助手,对智能选车、智能填单等,以及内部运营、答疑等带来提效。