美国纽约大学格罗斯曼医学院 Mavromatis等报告的一项验证队列研究显示,PRIME是一个基于电子健康记录(EHR)的模型,能够有效区分美国不同卫生系统中的胰腺导管腺癌(PDAC)风险,并且在国际上也具有推广性。应进行前瞻性研究,以评估EHR指导的PDAC病例发现及其与基于血液的早期检测方法的整合效果。(JAMA Oncol. 2026年3月26日在线版)
PDAC是美国癌症死亡的主要原因之一。虽然早期检测可改善患者生存,但该疾病的罕见性使得人群筛查成为一种困难的方法。
该研究的目的是利用常规可获得的EHR数据,开发并验证一个简约、可解释且可推广的预测PDAC新发病例的模型——命名为PRIME。
这项队列研究使用了Optum Labs数据库,这是一个纵向、去识别化的美国EHR和理赔数据库。研究纳入了2016年至2018年门诊临床就诊的40岁或以上的成年人。来自23个卫生系统的参与者(4 859 833名)构成了训练队列;另外31个卫生系统的参与者
(5 619 091名)作为验证队列。并在英国生物样本库(498 754名)中进行了国际验证。数据分析时间为2025年7月至2026年1月。研究评估了人口统计学、诊断编号和常规测量的实验室数值。
主要结果是新发PDAC,通过《国际疾病分类》第九版和第十版修订版的代码进行识别。研究使用时间依赖性曲线下面积和校准指标评估模型性能。
总体而言,该研究纳入超过1100万成年人(根据EHR报告,其中亚裔个体占2.1%,黑人个体占8.4%,西班牙裔/拉丁裔个体占4.3%,白人个体占82.7%,其他种族/族裔个体占2.4%)。在训练队列(平均年龄60.4岁±11岁)中,平均随访5.4年±2.5年,
14 405人被诊断为PDAC(55/10万人-年);在验证队列中,平均随访3.9年±2.5年,有11 693人被诊断为PDAC(54/10万人-年)。
PRIME模型最终保留了19个预测因子,包括胰腺炎病史、胃肠道疾病、既往癌症史、2型糖尿病、天冬氨酸氨基转移酶水平升高、吸烟、非O型血和男性。模型在36个月时间点显示出较强的区分度(训练队列和验证队列均AUC=0.75),并且在两个队列中校准良好。在验证队列中,预测风险最高的1%的患者,其PDAC风险显著高于平均风险患者(HR=7.63,95%CI 6.85~8.49)。在英国生物样本库中,PRIME模型在36个月时间点也显示出良好的区分度(AUC=0.71)和校准。
(编译 朱一顺)
