前列腺癌病理学中的人工智能,是朋友还是敌人?
发布日期:2024-03-20医学博士彼得·a·汉弗莱表示,自十多年前首次尝试计算机辅助诊断前列腺癌以来,人们对人工智能在前列腺癌病理学中的应用越来越感兴趣。然而,在这项技术被引入常规临床实践之前,研究人员必须首先证明人工智能可能带来的进步超过了当前的挑战。
在纽约州纽约市医师教育资源(PER)主办的第17届年度跨学科前列腺癌大会和其他泌尿生殖系统恶性肿瘤会议上,汉弗莱讨论了人工智能在前列腺癌中的潜在优势和局限性。汉弗莱是耶鲁大学医学院的病理学教授,也是康涅狄格州纽黑文市耶鲁大学医学院泌尿生殖系病理学主任。
旨在定义人工智能在前列腺癌诊断和分级中的能力的几项研究之一是熊猫挑战。从历史上看,格里森分级(通过对前列腺癌生长模式的光学显微镜解释进行)一直是最有力的预后指标。然而,汉弗莱解释说,这本质上是主观的,容易出错。为了确定人工智能是否优于标准识别方法,研究人员汇编了来自6个地点的12,625张前列腺活检的完整幻灯片图像:10,616张用于模型开发,393张用于竞争阶段的性能评估,545张和1071张分别用于内部和外部验证。
在竞赛阶段,来自65个国家的1290名开发人员提交了算法,其中15个是根据算法的性能选出的。结果显示,在美国和欧盟,所选算法与泌尿病理学家的平均一致性分别为0.862(二次加权κ,95%置信区间为0.840-0.884)和0.868(95%置信区间为0.835-0.900)。此外,癌症检测的灵敏度在97.7%至98.6%之间,特异性在75.2%至84.3%之间。
然而,假阳性率确实很高,Humphrey解释说,主要的算法错误是将良性病例误诊为前列腺癌,导致过度诊断。研究作者得出结论,人工智能前列腺癌分级算法与具有病理学家水平表现的洲际和跨国队列相当,值得在前瞻性临床试验中进一步研究。