通义千问深夜“王炸”更新!Qwen3升级版全面超越Kimi-K2,Agent能力亮眼
创始人
2025-07-22 09:11:56
0

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

(来源:网易科技)

国内的AI大模型竞赛,再次被按下了加速键!

AI圈的小伙伴们可能还记得,几天前Kimi-K2的开源还在被津津乐道。然而,开源的王座,热度还没持续几天,就迎来了新的挑战者。

7月22日凌晨,阿里巴巴通义千问团队突然发布了旗舰模型Qwen3的重磅更新,推出 Qwen3-235B-A22B-FP8 非思考模式(Non-thinking)的更新版本,命名为Qwen3-235B-A22B-Instruct-2507-FP8。

新版本模型在多项核心能力上实现了惊人飞跃,不仅全面超越了Kimi-K2等顶级开源模型,甚至领先Claude-Opus4-Non-thinking等顶级闭源模型。

性能“爆表”,这次升级有多猛?

根据官方发布的数据,新模型的通用能力获得了全方位强化,在多个权威测评中表现极其亮眼:

值得一提的是,本次更新的Qwen3模型在Agent能力尤其亮眼:在BFCL(Agent能力)测评中表现卓越。这意味着模型在理解复杂指令、自主规划、调用工具以完成任务的能力上,达到了一个新的高度。“主打Agent”,将是未来AI应用的核心竞争力。

除了硬核的跑分,这次更新还带来了三大“体感”升级:

告别“混合思维”,分离训练有多强?

这次最核心的变化,是技术路线的革新。

通义千问团队宣布,正式告别此前的“混合思维模式”,迈向全新的“分离训练”时代。他们将用于直接回答的Instruct模型和用于复杂思考的Thinking模型进行独立训练。

简单来说,就是让“快思考”和“慢思考”各司其职,从而在各自的领域都做到极致。

本次发布的 Qwen3-235B-A22B-Instruct-2507-FP8 ,就是“快思考”路线下的最新成果。它主打非思考模式(Non-thinking),追求的是在指令遵循、文本理解和知识问答等任务上,做到更快、更准、更强~

开源圈“卷”出新高度,大招还在后头!

从Kimi-K2到DeepSeek-V3,再到今天的Qwen3新版,国内的开源AI竞赛已经进入白热化阶段。每一次更新都伴随着性能的飞跃和王座的更迭。

更让人激动的是,通义千问团队在发布更新的同时,还留下了一个悬念:

“还有大招,马上就要来了!”

这不禁让人猜想,分离训练的另一端——专注于复杂推理的“Thinking”模型是否也已在路上?

目前,最新的Qwen3模型已在魔搭社区(ModelScope)和HuggingFace全面开源更新。如果你是AI开发者或爱好者,现在就可以去亲身体验这个“开源新王”的威力了

相关内容

热门资讯

中船汉光涨2.01%,成交额2... 7月22日,中船汉光盘中上涨2.01%,截至13:07,报20.34元/股,成交2.09亿元,换手率...
密封科技跌2.01%,成交额8... 7月22日,密封科技盘中下跌2.01%,截至13:16,报23.36元/股,成交8731.91万元,...
大行评级|瑞银:预计长和中期基... 瑞银发表研究报告指,长和预计将于8月中旬公布中期业绩。该行预期上半年撇除一次性项目的基本溢利将按年增...
太极集团涨2.01%,成交额1... 7月22日,太极集团盘中上涨2.01%,截至13:17,报22.37元/股,成交1.81亿元,换手率...
国城矿业涨2.03%,成交额1... 7月22日,国城矿业(维权)盘中上涨2.03%,截至13:18,报14.05元/股,成交1.48亿元...
丛麟科技跌2.09%,成交额2... 7月22日,丛麟科技盘中下跌2.09%,截至13:20,报20.61元/股,成交2036.50万元,...
2025年《财富》中国500强...   7月22日金融一线消息,财富中文网于今日发布了2025年《财富》中国500强排行榜。该榜单采用与...
金沃股份跌2.09%,成交额1... 7月22日,金沃股份盘中下跌2.09%,截至13:00,报57.66元/股,成交1.20亿元,换手率...
关于征求《食品营养健康管理通用... 转自:市场监管总局网站各有关单位及个人:根据国家标准制修订计划,现就《食品营养健康管理通用术语》等9...
好消息!兰州市区又有3条道路通... 7月21日,备受关注的彭家坪片区S207#、S208#规划道路及秀川街道T098#路正式建成通车。这...