2026年1月,上海润达医疗科技股份有限公司、四川大学华西医院、华为技术有限公司及成都智算中心联合研发的睿宾Agent V2.0(以下简称“睿宾”)顺利通过中国信息通信研究院(以下简称“中国信通院”)可信AI智能体基准测试-专业任务专项评测。

近年来,大模型技术飞速发展推动智能体在垂直行业加速落地,医疗级智能体作为连接医学技术与临床需求的核心载体,不仅需具备精准的医学知识应用能力,更要满足医疗行业严谨性、安全性与可解释性的特殊要求,正成为优化医疗服务流程、提升医疗资源利用效率的关键力量。当前,医疗级智能体已逐步渗透到临床辅助诊疗、患者健康管理、医学科研支持等多个场景,推动人工智能从技术演示向医疗生产力工具转型,将为医疗健康行业高质量发展注入新动能。中国信通院依托多年在人工智能标准化领域的积累,联合业界多方力量编制发布了《智能体基准测试通用要求》等系列技术规范,构建了覆盖测试要求及测试内容等多维度的评测体系,其中测试内容涵盖综合能力、通用任务及专业任务,可用于对临床知识推理、多场景任务处理等能力开展基于基准的评测。
本次评测依据AIIA/T0253-2025《智能体基准测试通用要求》,针对多科室、多难度等级的医疗级知识推理任务展开,对睿宾在若干临床相关能力维度进行评测。
1.临床知识推理能力评测:测试数据涵盖呼吸科、肿瘤科、消化科、内分泌科等多个专科,并设置基础、进阶、专家三个难度等级。睿宾在该项评测中的知识推理准确率较好。
2.临床图文推理能力评测:测试任务涵盖临床诊断推理、治疗方案制定、医患沟通交流、医疗文档处理四大类,采用多专科混合数据。整体评测结果显示,睿宾在该项评测中的图文推理准确率较好。
此次通过权威评测,不仅为“睿宾”产品本身提供了一份权威认可的“能力证明”,增强了其在医疗领域的可信度与应用基础;也为整个行业验证了“AI+严谨医学”这条技术路径的可行性,对医疗智能体的规范发展具有示范意义;同时,也切实体现了成都智算中心作为公共算力平台,在支撑高水平产业创新与成果落地方面的重要价值。
未来,成都智算中心将继续发挥公共算力服务平台与生态聚合优势,支持合作伙伴进一步深化“睿宾”Agent医疗AI智能体的研发与应用,推动AI技术更安全、更可靠地服务于临床实践与医学研究,共同为医疗健康行业的高质量发展注入智能动能。