5 月 27 日,夸克健康大模型在 12 门国家副主任医师职称考试中成绩超过合格线,成为国内首个成功跨越这一门槛的大模型。

据悉,夸克健康大模型以通义千问为基础,通过海量的高质量数据构建和多阶段后训练策略实现了此次突破。
全新的大模型能力已经可以直接通过夸克搜索调用。用户在使用中会发现,对于严肃医疗问题夸克会通过先分析后搜索,动态检索书籍、指南、药品说明书、医典论文等。这种高搜商的策略显著的提升了复杂病例的准确率。
此次副主任医师职称考试评测覆盖了 12 个常用学科,包括全科医学、普通内科学、普通外科学、妇产科学等。在上述学科领域,夸克健康大模型均超过合格线,并在全科医学、肿瘤内科学等 4 个学科达到主任医师及格线。
在初级与中级职称考试中,更小尺寸的夸克健康大模型相比满血版基础模型最高领先 7 分和 10 分左右。进入难度显著提高、强调临床综合运用的副高职称考试时,夸克最高领先幅度扩大至 30 分。这项研究验证了垂直模型在性能提升上具备巨大潜力。
面对多选题与病例分析题这两类「误判率最高」的问题时,夸克借助「医疗长思考」机制,在多选题领域达到 71%;在病例分析题中,夸克通过检索增强与分步推理组合策略,将正确率提升至 53%。