行业上限被拔高!夸克官宣:首个通过主任医师评测的大模型来了
创始人
2025-07-24 16:05:57

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

(来源:雷科技)

7月23日,夸克健康大模型成功通过中国12门核心学科的主任医师笔试评测,成为国内首个完成这一挑战的大模型。这是继5月通过副主任医师职称考试后,夸克健康大模型的又一次能力跃升。目前,“主任级AI医生”能力已经全面集成在夸克的AI搜索里,查询健康问题的时候,选择深度搜索就可以调用。

之所以是垂类大模型,原因很简单。一方面,垂类大模型相比通用大模型有更强的单一场景专业性,根据夸克公布的数据,在医疗场景下的性能比较,夸克健康大模型的答题正确率,全面超越了通用大模型DeepSeek。这并不是说通用大模型性能不行,只是“术业有专攻”,针对单一场景的垂类大模型,明显会更适合。

另一方面,对于专业领域,AI大模型要面对的是各种各样的问题,这意味着单一的数据库回答并不可靠,尤其是医学领域。举个例子,每一位病人都是感冒,但不同的人会有不同的症状表现,症状的轻重也各有不同,甚至还有一定的并发症和过敏等因素伴随,医生就需要根据病人的症状描述“对症下药”。

因此,垂类大模型不仅要“知识丰富”,更要“会思考”,夸克健康大模型以通义千问为基础,走出了一条面向垂直场景的工程化路线。夸克算法负责人表示:“我们不是在训练AI回答医学问题,而是在训练它学会医学思维。”换句话说,医学垂类大模型不能是AI“闭门造车”,更多的还是和真实医生一同共创。

(图片来自夸克)

而夸克健康大模型的核心突破之一,就是“慢思考”能力。这项能力融合了链式推理和多阶段临床演绎路径建模,驱动模型在面对复杂医疗问题时,能够分阶段、层层深入地推导出最终回答。

所谓的“医学思维”并非单方面的知识库或者推理能力,夸克健康大模型的思考,是基于高质量训练数据的。为此,夸克构建了“双数据产线+双奖励机制”的工程体系,将医学数据划分为“可验证”和“不可验证”两类,分别对应诊断类任务和健康建议类任务。另外,在训练方法上,夸克引入了“过程奖励模型”和“结果奖励模型”,确保推导过程和最终结果的合理性和准确性。

为了避免AI大模型为了高分而做题的应试行为,夸克健康大模型还设计了多阶段强化学习流程,通过真实医生标注、提问——思考——回答整组数据驱动强化学习,让夸克健康大模型成为了“不读死书”,拥有真正医学思维的AI大模型。

得益于在医学领域的专业性,夸克健康大模型得到了不少专业医师的认可,比如安贞医院心脏外科主任医师谢进生表示,夸克在一些问题上回答的专业度比专业医生更强。同时夸克AI搜索吸引了一大批医学生和医生群体,目前平台在全国医学生中月活用户已突破200万,覆盖率过半,这就是夸克健康大模型在医学领域专业性的证明。

这次夸克健康大模型证明了自己更高的能力上限,但这不是AI大模型的终点。医学大模型除了要在专业领域上不断精进,从应用层面去看,更应该让更多普通用户享受到“人均专业医师”的专业咨询。

相关内容

热门资讯

宝马将召回数十万辆汽车! 宝马将在全球召回数十万辆汽车德国汽车制造商宝马集团11日表示,将在全球范围召回数十万辆汽车,原因是发...
ETF主力榜 | 科创芯片设计...        2026年2月12日,科创芯片设计ETF鹏华(589170.SH)收涨3.90%,主力...
国家发展改革委等三部门:到20... 国家发展改革委、金融监管总局、中国民航局发布推动低空保险高质量发展的实施意见。其中提到,到2027年...
ETF主力榜 | 中银上海金E...        2026年2月12日,中银上海金ETF(518890.SH)收跌0.24%,主力资金(...
ATLINKS(08043)发... ATLINKS(08043)发布公告,本集团预计在截至2025年12月31日止年度期间录得不多于45...