北京大学肿瘤医院

返回

顶部

网站导航

1111.jpg

常规CT检测胰腺癌 人工智能表现优于放射科医生平均水平

作者: 来源: 发布时间:2026-01-08

荷兰奈梅亨拉德堡德大学Alves等报告,在常规CT扫描检测胰腺导管腺癌(PDAC)方面,人工智能(AI)的表现显著优于放射科医生的平均水平,显示出更早检测出癌症并改善患者预后的潜力。(Lancet Oncol. 2025年11月20日在线版)

PDAC在主要癌症类型中预后最差,主要原因是对比增强CT的诊断延迟。AI可以提高诊断性能,但可靠的基准以及其与放射科医生相比稳健的数据匮乏。该研究建立了一个开源基准,旨在研究用于CT检测PDAC的AI系统,并大规模地将其性能与放射科医生进行比较。

389-390期《全球肿瘤快讯》-26-.jpg

在这项国际、配对、非劣效性、验证性、观察性研究(PANORAMA)中,AI系统在一个国际基准内进行了训练和外部验证。训练队列包括来自荷兰和美国四个三级护理中心的2310例患者(训练2224例,调参86例)。测试使用一个隔离队列,包括来自五个三级护理中心(荷兰、瑞典、挪威)的1130例患者。

在测试队列的一个包含391例患者的子集中,研究者进行了一项包含68位放射科医生(来自12个国家、40个中心;阅片中位年限9.0年,IQR为6.0~14.5年)的多位阅片者、多例病例的观察性研究。参考标准基于组织病理学结果和至少3年的临床随访确定结果。

主要终点是比较AI系统与放射科医生在CT影像上发现PDAC的受试者工作特征曲线下平均面积(AUROC)。研究方案和统计计划预先设定,首先检验非劣效性(设定非劣效界值为0.05),然后检验AI系统的优越性。本研究已在Zenodo注册,且已完成。

389-390期《全球肿瘤快讯》-27.jpg

2004年1月1日至2023年12月31日,该研究纳入的3440例患者(女性1511例,男性1929例;中位年龄67岁,IQR为58~74岁)中,有1103例(32%)确诊为PDAC。在包含1130例患者(其中406例经组织学证实为PDAC)的隔离测试队列中,AI检测的AUROC达到0.92(95%CI 0.90~0.93)。

在用于阅片者研究的391例患者子集(其中144例经组织学证实为PDAC)中,与参与研究的68位放射科医生(AUROC为0.88,95%CI 0.85~0.91)相比,AI的AUROC为0.92(95%CI 0.89~0.94),达到了统计学上的非劣效性(P<0.0001)和优越性(P=0.001)。

(编译 刘恋)