AI首夺数学奥赛金牌!谷歌Gemini闪耀IMO赛场 OpenAI同步“摘金”
创始人
2025-07-22 21:36:28
0

Alphabet(GOOGL.US)旗下谷歌表示,其人工智能模型在一场全球数学竞赛中荣获金牌,而微软(MSFT.US)支持的OpenAI 也宣称,其实验性推理模型取得了金牌级别的成绩。

谷歌称,Gemini Deep Think的先进版本完美解答了国际数学奥林匹克竞赛(International Mathematical Olympiad,简称IMO)六道题目中的五道,总得分35分,达到了金牌级别的表现。

DeepMind的唐·卢昂(Thang Luong)和爱德华·洛克哈特(Edward Lockhart)在一篇博客文章中写道:“今年,我们先进的Gemini模型以自然语言进行端到端运算,直接根据官方题目描述给出严谨的数学证明,而且这一切都在4.5小时的竞赛时限内完成。”

去年,谷歌DeepMind的AlphaProof和AlphaGeometry 2组合系统取得了银牌成绩,解答出六道题目中的四道,得分28分。

国际数学奥林匹克竞赛主席格雷戈尔·多利纳尔教授(Prof. Dr. Gregor Dolinar)表示:“我们可以确认,谷歌DeepMind 达到了众人期待已久的里程碑,在满分42分中获得了35分,这是金牌成绩。他们的解题方法在很多方面都令人惊叹。国际数学奥林匹克竞赛的评委们认为,这些解答清晰、准确,而且大部分都易于理解。”

谷歌指出,在向Google AI Ultra的订阅用户推出该模型之前,会先将这个Deep Think模型的一个版本提供给包括数学家在内的一批受信任的测试人员。

与此同时,OpenAI也宣称其实验模型达到了金牌水平。

OpenAI研究员亚历山大·魏(Alexander Wei)在社交媒体平台X上发布的一系列帖子中称:“我很高兴地宣布,我们最新的@OpenAI实验性推理大语言模型(LLM)攻克了人工智能领域一个长期存在的重大挑战:在全球最负盛名的数学竞赛——国际数学奥林匹克竞赛中取得了金牌级别的成绩。”

亚历山大·魏表示,该公司按照与人类参赛者相同的规则,用2025年国际数学奥林匹克竞赛的题目对其模型进行评估:两场考试,每场4.5小时,不能使用工具或网络,阅读官方题目陈述,并以自然语言书写证明过程。

魏称:“在我们的评估中,这个模型解答出了2025年国际数学奥林匹克竞赛六道题目中的五道。对于每一道题目,都由三位曾获得国际数学奥林匹克竞赛奖牌的人员独立对模型提交的证明进行打分,在达成一致意见后确定最终分数。该模型总共获得了42分中的35分,足以获得金牌!”

魏指出,这个达到国际数学奥林匹克竞赛金牌水平的大语言模型是一个实验性研究模型,该公司在未来几个月内没有计划发布具备这种数学能力水平的产品。

据了解,这些结果标志着人工智能系统首次在面向高中生的国际数学奥林匹克竞赛中跨越了金牌得分门槛。

相关内容

热门资讯

山西一辆载12人的中巴车因强降... (来源:今晚报)转自:今晚报 【#山西一辆载12人的中巴...
2025暑期档大盘票房连续10... 据猫眼专业版数据,今日大盘单日票房破亿,截至当前2025暑期档大盘单日票房已连续10天破亿,暑期档累...
观察快评:樊振东的真诚是对饭圈... (来源:猛犸新闻) 【观察快评:#樊振东的真诚是对饭圈文...
2025年中国内地电影暑期档票... 中新社北京7月27日电 (记者 高凯)据灯塔专业版数据,截至北京时间7月27日11时23分,中国内地...
向世界发出泉水邀约,2025济... 中国青年报客户端讯(中青报·中青网记者 邢婷 实习生 王姝然)7月25日晚,2025济南国际泉水节启...
青岛“汽车医生”研发“微创修复... 青岛日报社/观海新闻7月27日讯 7月26日是“青岛工匠日”,这是各行各业技术工匠们的节日。在青岛城...
超两万企业客户及开发者接入可灵... 7月27日,在2025世界人工智能大会(WAIC)上,可灵AI产品及运营负责人李杨披露,自今年4月可...
货拉拉多拉首款新车“多拉大面”...   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!   Hehson科技...
火,终究包不住 烁渊 凭死记硬背的一段顺口溜,与一个“不演而演”的小品,何占豪“混”进浙江文工团。同学们都说,...
WAIC前线|商汤科技发布悟能...   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! (来源:网易科技报道...