近日,国内医疗大模型评测平台 MedBench 公布最新多模态能力评测结果。数坤科技自主研发的医疗多模态大模型在本轮评测中取得综合排名第一。
此次评测并非单一能力测试,而是围绕医疗场景中多源信息理解、跨模态关联与医学任务完成度展开的综合评估。评测内容覆盖医学影像、临床文本等多类数据形态,重点考察模型在真实医疗问题中对信息的理解、整合与使用能力。
“懂医疗”,不是会说话,而是能按医疗逻辑处理信息
在国内医疗大模型企业中,数坤科技长期以“最懂医疗的 AI”作为自身定位。其核心特征并不在于语言生成能力,而在于模型从设计、训练到评测,始终围绕真实医疗问题的形成逻辑展开,使不同模态的信息能够按临床路径被理解和使用。
在医疗场景中,“懂医疗”并不等同于语言表达能力,也不等同于某一单一模态的优势,而体现在模型是否能够按照医学问题本身的结构来组织和理解信息。
数坤方面表示,其多模态模型在设计之初即以医疗任务为核心假设,围绕“一个医学问题如何被医生理解和决策”来构建模型能力:不是先分图像、再分文本,而是直接以病种、检查路径和临床决策流程为主线,让不同模态的信息在模型中形成可协同使用的结构。
在此次 MedBench 评测中,这种能力体现在模型能够在影像信息、文字描述之间完成稳定的跨模态关联,并顺利完成多项需要综合理解的医疗任务。
医工深度参与的训练方式:让模型“按临床方式被训练”
分析人士指出,数坤科技此次取得这一成绩,与其长期坚持的"医学MDT(多学科会诊)式训练策略"密切相关——就像三甲医院培养一个成熟的MDT专家团队需要影像科、病理科、临床科室的多年协同一样,数坤的模型训练也遵循着同样的逻辑。
“我们的模型不是简单地把图像和文本拼在一起,而是让它们像人类专家会诊一样,对同一病种的影像特征、病理报告、临床指标进行深度关联学习。”数坤技术团队负责人透露。
上述训练方式得益于数坤多年来在医工结合领域的深厚积淀:团队中有大量具备医学背景的研发人员,他们深知肺结节的CT影像特征如何与病理报告的细胞形态描述对应,明白冠脉CTA的狭窄程度如何与患者的心电图变化关联。
正是这种“医学原生”的训练思维,让模型在MedBench的严苛测试中展现出超越纯文本模型的临床洞察力。当普通大模型还在努力理解"磨玻璃结节"的文本定义时,数坤的模型已经能同步关联其影像学表现、生长规律及对应的临床处理路径。
“我们的目标不是做一个应对评测的模型,而是持续打磨能够理解医疗问题结构、支撑临床工作的智能系统能力。”数坤科技相关负责人说。
评测只是阶段性结果,目标仍是进入真实医疗流程
数坤科技相关负责人表示,MedBench为行业提供了一个重要的能力参照系,但评测本身并非终点。
真实医疗场景中,医学信息往往是连续的、多序列的,且存在不完整、不确定的情况。模型是否真正“懂医疗”,最终仍要接受真实诊疗流程的检验。
未来,随着评测体系向更复杂医疗场景不断演进,多模态医疗大模型的价值,也将越来越多地体现在能否长期、稳定地嵌入医疗系统之中。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
猜你喜欢
“无事不扰,有求必应” 深圳持续优化营商环境
iPad中国市场份额大跌 华为再夺中国平板第一 暴增21%
文远知行:与优步正式启动阿布扎比市中心首个Robotaxi商业运营服务
半导体板块涨3.46% 利扬芯片涨19.99%居首
焦点关注:外交部发言人林剑送新年祝福:马年大吉、龙马精神、马到功成
2025消费回望与前瞻,宸睿资本合伙人周莹
国家开放大学首届新商科创新创业大赛现场赛在北京举办