400-900-1233

返回顶部

荣誉资质

联系我们CONTACT US

400-900-1233

北京:北京市朝阳区建国路118号国贸商圈招商局大厦3208单元

深圳:深圳市罗湖区笋岗东路3002号万通大厦2106单元

您的位置:首页 > 爱诺头条 > 新闻动态

使用机器学习,可以识别无法诊断的癌症

发布日期:2022-09-20

麻省理工学院科赫综合癌症研究所和马萨诸塞州总医院 (MGH) 的研究人员开发的一种新的深度学习方法,可以通过仔细研究与早期细胞发育和分化相关的基因表达程序,来帮助对未知原发性癌症进行分类。

在极少数情况下,即使经过广泛的检测,也无法确定癌症的起源。尽管这些原发性未知的癌症往往具有侵袭性,但肿瘤学家必须用非靶向疗法治疗它们,这些疗法通常具有严重的毒性并导致低存活率。

“有时,你可以应用病理学家必须提供的所有工具,但你仍然没有答案,”Salil Garg 说。“像这样的机器学习工具,可以使肿瘤学家选择更有效的治疗方法,并为他们的患者提供更多指导。”

机器学习.jpg

Garg 是一项新研究的资深作者,解析不同类型原发性未知肿瘤的基因表达差异,是机器学习解决的理想问题。癌细胞的外观和行为与正常细胞完全不同,部分原因是它们的基因表达方式发生了广泛的改变。由于单细胞分析的进步和在细胞图谱中对不同细胞表达模式进行分类的努力,有大量的数据——如果对人眼来说是压倒性的——包含不同癌症起源方式和起源的线索。然而,建立一个机器学习模型,利用健康和正常细胞之间以及不同种类癌症之间的差异,将其用于诊断工具是一种平衡行为。

如果一个模型过于复杂,并且考虑了太多癌症基因表达的特征,该模型可能看起来完美地学习了训练数据,但在遇到新数据时会动摇。然而,通过缩小特征数量来简化模型,模型可能会遗漏导致癌症类型准确分类的信息种类。

为了在减少特征数量和提取最相关信息之间取得平衡,该团队将模型重点放在癌细胞发育途径改变的迹象上。研究人员比较了两个大细胞图谱,确定了肿瘤和胚胎细胞之间的相关性:癌症基因组图谱 (TCGA),其中包含 33 种肿瘤类型的基因表达数据,以及小鼠器官发生细胞图谱 (MOCA),其中描述了 56 个独立的肿瘤细胞轨迹,胚胎细胞发育和分化。

“单细胞解析工具极大地改变了我们研究癌症生物学的方式,但我们如何使这场革命对患者产生影响是另一个问题,”Moiso 解释说。“随着发育细胞图谱的出现,特别是那些关注器官发生早期阶段的图谱,如 MOCA,我们可以将我们的工具扩展到组织学和基因组信息之外,并为分析和识别肿瘤以及开发新疗法的新方法打开大门。”