o1 能带我们走进 AGI 吗?
创始人
2024-09-18 17:03:43
0

OpenAI 推出的 o1 模型,以其独特的推理模式,在编程和数学领域展示了显著的能力,引发了对通向 AGI(通用人工智能)新路径的广泛讨论。

最近,OpenAI 突然发布了 o1 模型,也就是传闻中的“🍓”模型,可能也是早先提到的 Q* 模型。

虽然这并非最强的原始版本,只是一个预览版,但它展示了一种不同于以往语言模型的推理模式:1 在生成结果前会先生成一条思考链,经过“思考”后再给出回复,这使得它在编程和数学方面的表现明显提升。

o1 的发布这些天引发了广泛的关注和讨论。

有些人非常激动,认为 o1 开辟了一条通向 AGI(通用人工智能)的新路径;也有人感到失望,觉得 o1 的实际表现还不如 Claude 3.5 或 GPT-4o,等待了这么久却只得到一个性能平平的模型。

我倾向于前者,对 o1 这个方向持乐观态度。并非因为 o1 的数学能力特别强,或者它能理解晦涩的小说内容,而是 o1 似乎真的探索出了大力出奇迹的一条新的方向,那就是在推理上的大力出奇迹,或者有学术一点的说法,叫推理规模扩展定律(inference scaling law)。

以前我们谈论的大力出奇迹或者说规模扩展定律(Scaling Law),主要针对的是训练过程,意味着训练数据越多、算力越强、模型参数越大,最终的模型性能就越好。因此,我们一直在追求更大的规模。

而推理规模扩展定律则是另一条路径,就是模型训练完成后,它会在推理上消耗很多算力,用算力和时间换取推理能力的大幅提升。

从 OpenAI 新发布的 o1 上就可以看到这条路径的实际应用:在生成结果前,要花大量的算力和时间在推理上,先生成思维链(Chain of Thought,CoT),借助思维链提升推理能力,得到更好的结果,甚至连复杂的奥数题都可以轻松解出来。

很多人对 o1 的思维链不屑一顾,觉得:“这不就是‘让我们一步一步思考’么?我在提示词让模型按照给定步骤生成也能类似的效果!”也有的找了一堆模型相互 PK,认为就是达到推理模型的效果了。

对于某些特定任务,这可能可行。例如,我曾设计过一个翻译提示词,让模型分三步:先直译、再反思、最后意译,效果相当不错。

但问题在于,大语言模型需要应对各种各样的任务,我们不可能为每一种任务都编写一套思维链提示词,这不现实。所以,我们需要模型自己生成思维链,能够针对每个任务自主搜索最佳路径,生成最合适的思维链,达到最好的推理和生成效果。

要训练模型自己生成思维链并不是意见容易的事情,因为你需要大量的思维链训练语料,还要有合适的奖励模型,奖励模型生成的好的思维链,惩罚生成的不好的思维链。但 o1 的发布证明这条路是可行的,我们可以让模型自己生成思维链。

OpenAI 并未透露他们的具体训练方法,但推测是在后期训练阶段,通过强化学习,利用大量的数学题和代码库,训练模型生成解题的思维链。然后,根据结果和过程,对模型的行为进行奖励或惩罚,提升其生成思维链的能力。

当像 o1 这样的推理模型训练成功后,它就具备了强大的推理能力。对于输入的任务,能够生成高质量的思维链,通过增加算力和时间投入,可以显著提升模型的推理效果,大力出奇迹。

那么,是否意味着只要拥有无限的计算能力和时间,推理模型就能超越人类,完成许多复杂的任务呢?

这让我想到了 AutoGPT——一个可以自主规划和分解任务,自动完成目标的智能体。最初,人们期望只要给它足够的 Token 和时间,它就能帮助人类完成复杂的任务。

但现实并不如人意,AutoGPT 很少能产生可靠的结果。限制它的正是其推理能力;面对许多任务,它无法有效地规划和分解,因而无法取得理想的结果。

o1 也是如此。能否通过计算能力换取智能,取决于其推理能力是否足够强大,能否在各种任务中生成高质量的推理过程。

目前,o1 在数学和编程领域表现突出,文字解密方面也有不错的表现,但在其他领域的推理能力尚未展现出来,还需要看后续的发展。不过从 OpenAI 内部人士的发言来看,他们自己是信心满满。

Greg Brockman: 根据我们的发布数据,在今年的国际信息学奥林匹克竞赛(IOI)中,模型在模拟人类条件下(每道题 50 次提交)取得了第 49 个百分位/213 分。但在每道题 10,000 次提交的情况下,模型得到了 362.14 分——超过了金牌线。因此,模型的潜力远比表面看起来的要大得多。

Jason Wei:AIME 和 GPQA 的结果确实很好,但这不一定能转化为用户可以感受到的东西。AI 使用人类语言来建模思维链在很多方面都很棒。

该模型可以做很多类似人类的事情,比如将复杂的步骤分解为更简单的步骤、识别和纠正错误以及尝试不同的方法。游戏已被彻底重新定义。

Shengjia Zhao:它不会完美,也不会适合所有事情,但它的潜力再次让人感到无限。再次感受到 AGI。

William Fedus:「ChatGPT 现在可以先仔细思考,而不是立即脱口而出答案。最好的类比是,ChatGPT 正在从仅使用系统 1 思维(快速、自动、直觉、容易出错)进化到系统 2 思维(缓慢、深思熟虑、有意识、可靠)。

这让它能够解决以前无法解决的问题。从今天 ChatGPT 的用户体验来看,这是向前迈出的一小步。

在简单的提示下,用户可能不会注意到太大的差异(但如果您遇到一些棘手的数学或编码问题,您会注意到的🙂 )。但这是未来发展的重要标志。

也许他们已经实现了类似于 AlphaGO 那样自己训练自己的模式,让模型的推理能力可以持续提升。如果未来 o1 能在大部分领域展现出强大的推理能力,那么我们就可以在任务中,通过增加算力和时间上的投入,换取超越人类的智能,实现大力出奇迹,真正迈向 AGI。

至少就目前而言,o1 已经在编程和数学领域展示了强大的能力。尤其是在编程方面,如果能通过算力和时间换取高质量的代码,也能创造巨大的价值!

目前推理规模扩展定律这方面 OpenAI 还是走在前面,他们也没有透露太多细节,但就像 Sora 一样,只要我们知道在推理上大力出奇迹这个方向是可行的,开源模型将会很快跟进,很快就会有接近 o1 推理能力的开源模型出现。

看来,未来对算力的需求还会进一步增加。

来自大聪明:

我之前写了这两篇,和宝玉在陈述同一事实,但角度不同。

《「草莓」实测:可能只是工程 Trick,且有扣费陷阱!》

《150 行代码,复刻「草莓」,青春版支持联网》

另一点,也是我和宝玉的一致结论:

o1 的对齐,应该是推理部分完全不对齐。

它的推理部分,有点像有多个模型,各司其职,有专门审查的模型。

没有隐藏的推理token做不到,现在就可以了,毕竟不需要马上输出。

顺着给大家看一个《来》的测试:

微小说《来》解读测试:

这是一篇著名的微小说,思想没那么纯洁的成年人都能懂这部小说隐含的那种意思,但是 AI 能吗?测试下来 GPT-4o 是懂的,但是表达的很隐晦,Claude 似乎是懂装不懂,o1 mini 就完全不懂,o1 preview不止懂,还直白的描述出来了。

小说《来》

o1 的解读

Claude 3.5 Sonnet

可以发现,只有 o1 是答对了的,然后告诉你,你这个问题违反了使用规范。

如果用 gpt-4o 进行回答 + cot&react 进行呢?

模棱两可的「o1 青春版」

本文由人人都是产品经理作者【赛博禅心】,微信公众号:【赛博禅心】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。

题图来自Unsplash,基于 CC0 协议。

相关内容

热门资讯

广州虎辉照明有限公司 照明有限公司是我国手电筒生产历史长、规格大、产销量和出口量多、工商贸结合、多元经营的国有大型企业。主...
东莞市厚街明清家居饰品经营部 东莞市帝皇金工艺品有限公司是一家集设计,开发,制造,销售及贸易为一体的公司。公司创建于2001年,座...
青岛爱多新能源有限公司 青岛爱多新能源有限公司成立于2003年,年销售额3000多万元,销售网络和客户遍及全国各地并出口到欧...
东莞市寮步天杰五金厂 东莞市寮步天博五金厂、*生产各种规格定型金属软管、鹅颈管、蛇管、USB软管、定型管、五金软管、金属咪...
福州市仓山区慧华工艺品厂 福建慧华工艺品厂,座落在交通便捷依山傍水的福州福厦公路旁,本工厂*生产纸灯,产品有吊灯、台灯、落地灯...
汨罗市顺达光学仪器厂 我厂是一家*生产各种放大镜,显微镜,玻璃放大镜片,光学镜片,教学镜头,舞台灯光镜片等的厂家,成立于9...
深圳市福田区工展中心三晶经营部 深圳市福田区工展中心三晶经营部 位于广东 深圳市福田区,主营 太阳能LED照明灯具 等。公司秉承“顾...
佛山市日森电子有限公司 佛山市日森电子有限公司是一家以研发、生产电子产品的高科技现代企业。拥有十多年研发、生产灯光照明、家电...
潮安县浮洋腾达陶瓷制作厂 本厂为*生产陶瓷小夜灯的厂家,现厂家厂价直销,价格为全网低,款式做到多,同时支持小额多款混批!在本厂...
永嘉县桥头镇鸿兴电子厂 永嘉县桥头镇鸿兴电子厂是一家*生产激光笔,激光模组等系列产品的独资企业,位于浙江省温州市桥头镇.我厂...
佛山市南海区贺隆五金电器有限公... 佛山贺隆五金电器有限公司是一家集研发、设计、生产于一体的*照明公司。一直生产高档的欧美风格与阿拉伯风...
广州维雪舞台灯光有限公司 广州维雪舞台灯光有限公司是一家以经营室外照明灯具为主的生产加工型企业,公司位于广东省 广州,注册资本...
江门市联星照明电器有限公司 江门市联星照明电器有限公司是一家有十多年历史,研究开发和生产各种电子节能灯、镇流器、光管支架、灯饰等...
东莞市石排欧尼电子五金加工厂 东莞欧尼电子五金加工厂是一家生产型企业,成立于二零零一年,工厂位于东莞市石排镇,交通便利.我厂一直从...
广州市白云区石井歌莱舞台灯光设... 广州市白云区石井歌莱舞台灯光设备厂 位于广东省广州市白云区,*生产及销售营舞台灯光设备,节庆用品,儿...
广州市鸿星电子有限公司 广州市鸿星电子有限公司坐落于广州新城,科技创新中心-广州市番禺节能科技园内番山创业中心,是一家*从事...
深圳响亮电子有限公司 本公司位于广东深圳市宝安区,常年对外销售舞台灯、激光灯、水晶魔球灯、帕灯等产品,公司秉承以用户需求为...
中山市卓特灯饰加工厂 欢迎您来到卓特灯饰加工厂网上店铺,我们主要生产现代酒店程客房类台灯、落地灯、壁灯、镜前灯等,其中以L...
深圳市晫欧照明科技有限公司 对外销售LED灯带,柜台灯,轨道灯,天花灯、电源导轨等产品,公司秉承以用户需求为核心,坚持“质量到位...
东莞市澳尔禾电子科技有限公司 AEH致力于节能,环保等产品的研发和生产,历经多年的发展,公司已在LED照明产品领域积累了非富的经验...