阿里巴巴正式开源千问3 仅需4张H20即可部署满血版
创始人
2025-04-29 07:53:19

快科技4月29日消息,今天凌晨,阿里巴巴开源新一代通义千问模型Qwen3(简称千问3),参数量为DeepSeek-R1的1/3,成本大幅下降。

千问3是"混合推理模型","快思考"与"慢思考"集成进同一个模型,对简单需求可低算力"秒回"答案,对复杂问题可多步骤"深度思考",节省算力消耗。

作为Qwen系列全新一代的混合推理模型,Qwen3 在 GPQA、AIME24/25、LiveCodeBench 等多个权威评测中表现出极具竞争力的结果。

在相同计算资源下,Qwen3 模型以更小的规模实现了对更大体量上一代模型的超越,真正做到了"小而强大"。

千问3总参数量235B,刷新了开源模型的智能水平新高,阿里称仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。

千问3模型版本包含2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型。

相关内容

热门资讯

您举报 我处理丨您随手拍举报的... 市民通过“随手拍”等平台举报的交通违法行为北京交警一直高度重视并持续处理中……1故意遮挡机动车号牌有...
饺子店冬至排队超15000桌!... 12月21日冬至当天,全国各地的饺子馆生意火爆。其中,北京金谷园饺子馆更是大排长龙,截至21日晚8点...
三星发布全球首款2nm手机芯片...   三星正式推出Exynos 2600 芯片。该芯片不仅是三星首款、更是全球首款 2 纳米移动芯片,...
武进不锈:2026年1月7日召... 证券日报网讯12月21日晚间,武进不锈发布公告称,公司将于2026年1月7日召开2026年第一次临时...
学者:美国对委施压是加强对西半... 【学者:#美国对委施压是加强对西半球控制#】#美国扣押油轮给委方制造经济困难#当地时间12月20日凌...