高能扫描仪
148.42MB · 2025-10-29
近日,深睿医疗联合中国人民解放军东部战区总医院(南京大学医学院附属金陵医院)放射科张龙江教授团队提出并验证了一项创新性"Sham-AI"的安慰剂对照策略,相关成果发表于《Radiology: Artificial Intelligence 》(IF13.2/中科院1区)。这一突破性成果,为医疗 AI 领域长期面临的 "临床价值验证" 难题提供了全新解决方案,推动医疗 AI 研究从 "技术性能比拼" 转向 "真实临床价值验证"的新领域。
文章题目:Development and Validation of a Sham-AI Model for Intracranial Aneurysm Detection at CT Angiography
近年来,人工智能(AI)在医学影像诊断领域取得显著进展,尤其在颅内动脉瘤早期检出方面已展现出媲美专家的性能。然而,过往研究大多采用开放标签设计,容易受自动化偏倚与霍桑效应等心理偏倚干扰,AI在临床实践中的真实增益仍缺乏有力证据。为破解这一长期困境,中国人民解放军东部战区总医院(南京大学医学院附属金陵医院)放射科张龙江教授团队联合深睿医疗共同提出并验证了一项创新性"Sham-AI"的安慰剂对照策略,为探索AI临床价值验证提供了创新工具。
研究设计亮点
创新的Sham-AI(安慰剂AI)
该研究基于1万多例颅脑CTA检查,构建标准AI与Sham-AI模型,其中标准AI集成全局上下文网络(GCN)+局部精细网络(LFN),而Sham-AI则通过不同AI模型的检测结果差值来获得近似外观但不具备核心智能分析功能的 "模拟 AI" 作为对照组,与标准 AI 系统的实验组同步开展临床试验。
Sham-AI在验证集上的患者层面灵敏度仅2.0%,而特异性与标准AI接近,确保其仅提供"外观提示"而不影响真实结果。这种设计能够有效排除 "界面友好性""操作便利性" 等非核心因素对临床评价的干扰,精准分离出 AI 技术本身在诊疗决策中产生的实际价值。

图:标准AI与Sham-AI 模型架构
多中心盲法验证排除心理偏倚干扰
为确保研究结果的真实性与普适性,团队在实验设计阶段便聚焦 "贴近真实临床" 原则,选择来自4家医院300例经过DSA这一"金标准"确诊的CTA病例,其中包含 50 例动脉瘤患者(共 61 个瘤体),涵盖不同大小、位置、形态的病灶,全面模拟临床中复杂多样的诊断场景,由来自7家医院28名放射科医生参与阅读实验,覆盖不同经验层级,避免单一机构或单一经验水平医生带来的结果偏差,让实验数据更具行业参考价值。
在标准 AI 辅助下,医生诊断灵敏度在保持高水平特异性的同时,增幅达 20.7% -- 这意味着标准 AI 能有效帮助医生发现更多潜在病灶,切实提升诊断准确性,而Sham-AI并未对医生的真实诊断能力产生干扰,仅改变了5.3%的真阳性结果和1.2%的假阴性结果,显著低于标准AI带来的性能提升(灵敏度提升20.7%)。

图:AI辅助阅片效果比较
研究数据清晰划分出 "AI 核心智能分析" 与 "辅助界面" 的不同价值,让标准 AI 对临床诊断的实际贡献从 "模糊感知" 变为 "精准量化",为判断 AI 技术的临床实用性提供了硬核依据。这些结果证明Sham-AI可以作为评估AI真实增益效果的"安慰剂对照"工具,为未来严谨的AI临床试验奠定了方法学基础。
同刊权威评论
同刊2025 年Vol. 7 No. 3期上刊登了由马萨诸塞总医院/哈佛医学院的 John D. Mayfield 与 Javier Romero 教授撰写的评论《Establishing a Chain of Evidence for AI in Radiology: Sham AI and Randomized Controlled Trials》。评论指出,引入类似药物试验"安慰剂"的 Sham-AI 范式,能在随机、盲法的对照框架下分离心理/情境因素,建立影像AI更严谨的"证据链"。作者建议以嵌入PACS、复用标准化Sham-AI的低成本、可裁剪RCT为路径,加速影像AI的临床与监管采纳。

图片来源 :《Radiology: Artificial Intelligence 》
向真实世界RCT迈进
IDEAL study
在 "Sham-AI" 安慰剂对照策略这一突破性方法学成果得到初步验证后,中国人民解放军东部战区总医院张龙江教授团队与深睿医疗并未止步于现有成绩,而是迅速推动研究向更广阔、更深入的真实世界临床场景延伸 -- 一项覆盖超 6000 例患者的多中心、双盲、安慰剂对照随机对照试验(RCT)已正式发起,将研究视野拓展至医疗 AI 的全链条价值评估,AI是否能真正提高诊断水平、优化治疗决策、改善患者预后。这一举措不仅是对 "Sham-AI" 方法学可靠性的进一步验证,更将医疗 AI 临床价值评估从 "诊断性能层面" 推向 "诊疗全链条与患者预后层面",为行业树立了更高标准的研究范式。
尽管研究试验仍在推进中,但研究的阶段性成果已获得国际医学界的关注与认可 -- 部分成果已被World Stroke Congress 2025(2025 年世界卒中大会) 收录为会议摘要。作为全球卒中领域最具影响力的学术会议之一,World Stroke Congress 的收录认可,不仅证明了该研究在脑血管疾病 AI 应用领域的创新性与重要性,也让 "Sham-AI" 相关研究成果得以在国际舞台上展示,为全球医疗 AI 临床价值验证提供了 "中国思路"。研究主要终点结果将在近期正式发布,进一步推动 "Sham-AI" 策略成为医疗 AI 临床价值验证的主流方法学之一。
"Sham-AI" 策略首创面向医疗 AI 的 "心理安慰对照" 框架,通过构建与真实 AI 交互体验高度一致的 "Sham-AI" 系统,帮助区分AI性能与医生心理效应贡献,推动医疗 AI 临床研究从以往聚焦 "技术准确率比拼" 的单一维度,转向关注 "临床实际价值验证",加速 AI 从技术概念向实用工具的转化;同时,该研究产生的严谨对照数据,为AI医疗器械监管标准、临床指南与支付策略提供循证依据,多维度助力医疗 AI 行业从无序探索迈向规范化发展新阶段。
这份产学研协同孕育的亮眼成果,正是深睿医疗在智慧医疗领域长期深耕的生动缩影。深睿医疗始终以 "技术扎根临床、科研反哺实践" 为核心,在关键领域持续突破:动脉瘤 AI 产品获得国内首个该领域创新 NMPA 三类证,为颅内动脉瘤诊断提供详实的形态学支撑,从核心产品落地到科研方法论创新,深睿医疗在动脉瘤领域真正实现了 "技术研发 - 科研突破 - 临床应用" 的全链条闭环,彰显出产业端与临床端深度协同的硬实力。
深睿医疗颅内动脉瘤在业内屡获殊荣,同时在该领域的深度科研实现多个重大突破,相关成果被《The Lancet Digital Health 》、《Nature Communications》、《Radiology:Artificial Intelligence》等众多国际知名学术期刊收录。截至目前,深睿医疗以14张 NMPA 三类证居于行业前列,是国内目前唯一一家获证产品能够全面覆盖疾病检出、分诊及诊断全流程、全场景的医疗人工智能企业。公司高度重视产学研合作,牵头或参与了13项国家科技部重大专项,16项国家自然科学基金项目及30多个省市级科研重点专项,已发表论文累计影响因子近1800,科研成果获得国家科技进步二等奖,并接连在河南省、山东省、浙江省等地获得多个省级科学技术进步奖。
未来,深睿医疗将始终坚持以 "解决临床真问题、创造真实价值" 为创新导向,推动AI更多疾病领域的临床应用拓展,进一步加强与国内外顶尖医疗机构、科研团队的合作,以技术创新破题、以科研实力赋能、以临床落地扎根,为更多疾病的精准诊疗提供 "深睿方案",为全球医疗 AI 的规范化、高质量发展提供了 "中国方案" 与 "中国经验"。