如何用自然语言处理并预测癌症扩散
发布日期:2021-11-28皇后大学的研究人员 Amber Simpson 和 Farhana Zulkernine 以及放射科医生 Richard Do(纽约纪念斯隆凯特琳癌症中心),正在开发技术,使用自然语言处理预测癌症将如何在患者体内扩散。
自然语言处理 (NLP) 用于对计算机进行编程,以处理和分析来自人机交互的大量语言数据。Simpson 博士(计算机学院;生物医学和分子科学学院)和 Zulkernine 博士(计算机学院)利用 NLP 的数据抓取能力,将该技术应用于 CT 扫描以预测癌症可能扩散的位置。
“人工智能 (AI) 有可能解决仅靠人类无法解决的癌症基本问题,”加拿大生物医学计算和信息学研究主席辛普森博士说。“例如,我们不了解化疗在一般癌症患者人群中的表现。化疗在临床试验中进行了测试,对患者进行了严格的标准包括和排除。人工智能让我们有机会研究癌症反应、和扩散整个癌症人群。”
为了开发 NLP 模型,三位放射科医生整理了超过 2,200 次 CT 扫描的样本,在 13 个器官中搜索是否存在转移性癌症。然后对三种不同的模型进行了近 400,000 次 CT 扫描测试,性能最佳的模型在检测和标记所有器官的癌症方面的准确率达到了 90-99%。
“我们可以访问的放射学报告只有半结构化文本数据,”Zulkernine 博士说,并解释了为什么他们决定采用跨学科方法使用 NLP 进行研究。“因此,与计算机学院的学生 Karen Batch 和 Kaelan Lupton 一起,我们开发了一个 NLP 管道来预处理数据并提取关键特征,以输入机器学习模型,以根据先验预测预测 13 个不同器官的癌症转移。”
使用人工智能检测癌症转移,意味着每个癌症患者的知识,不仅仅是那些在试验中的患者,可以用于个体患者的诊断和治疗计划。但潜力并不止于此,根据 400,000 次 CT 扫描提供的分析,Simpson 博士和 Zulkernine 博士计划创建一个数字癌症双胞胎,以反映和预测癌症在患者体内的扩散。了解癌症可能扩散的位置和方式意味着局部治疗,而不是全身治疗。