AI模型可以帮助确定患者的癌症起源

来源：编辑：

对于一小部分癌症患者，医生无法确定他们的癌症起源于何处。这使得为这些患者选择治疗方法变得更加困难，因为许多抗癌药物通常是针对特定癌症类型开发的。

麻省理工学院和达纳法伯癌症研究所的研究人员开发的一种新方法可能会让识别这些神秘癌症的起源部位变得更加容易。研究人员利用机器学习创建了一个计算模型，可以分析约400个基因的序列，并利用该信息来预测特定肿瘤在体内的起源位置。

使用该模型，研究人员表明，他们可以在约900名患者的数据集中准确地对至少40%的来源不明的肿瘤进行高置信度分类。这种方法使符合基因组指导、根据癌症起源位置进行靶向治疗的患者数量增加了2.2倍。

“这是我们论文中最重要的发现，即该模型有可能用于辅助治疗决策，指导医生对原发性不明的癌症患者进行个性化治疗，”麻省理工学院电气工程和电气工程研究生IntaeMoon说。计算机科学界人士是这项新研究的主要作者。

哈佛医学院和达纳法伯癌症研究所的医学副教授亚历山大·古谢夫(AlexanderGusev)是这篇论文的资深作者，该论文今天发表在《自然医学》杂志上。

神秘的起源

在3%至5%的癌症患者中，特别是在肿瘤已转移到全身的情况下，肿瘤学家没有一种简单的方法来确定癌症的起源位置。这些肿瘤被归类为原发灶不明的癌症(CUP)。

这种知识的缺乏常常导致医生无法为患者提供“精准”药物，而这些药物通常被批准用于已知有效的特定癌症类型。这些靶向治疗往往比用于广泛癌症的治疗更有效且副作用更少，这些治疗通常用于CUP患者。

古谢夫说：“每年都有相当多的人患上这些原发性不明的癌症，而且由于大多数疗法都是以特定部位的方式批准的，你必须知道原发部位才能部署它们，因此他们的治疗选择非常有限。”。

Moon是计算机科学和人工智能实验室的附属机构，也是Gusev的共同顾问，他决定分析丹娜—法伯癌症研究所常规收集的遗传数据，看看它是否可以用来预测癌症类型。这些数据包含约400个基因的基因序列，这些基因经常在癌症中发生突变。

研究人员利用近30,000名被诊断患有22种已知癌症类型之一的患者的数据来训练机器学习模型。这组数据包括来自纪念斯隆凯特琳癌症中心、范德比尔特-英格拉姆癌症中心以及丹娜法伯癌症中心的患者。

然后，研究人员在约7,000个肿瘤上测试了所得模型，这些肿瘤以前从未见过，但其起源部位已知。研究人员将该模型命名为OncoNPC，能够以约80%的准确度预测它们的起源。对于占总数约65%的高置信度预测肿瘤，其准确率升至约95%。

在获得这些令人鼓舞的结果后，研究人员使用该模型分析了一组约900个CUP患者的肿瘤，这些肿瘤均来自丹娜—法伯癌症研究所。他们发现，对于40%的肿瘤，该模型能够做出高置信度的预测。

然后，研究人员将该模型的预测与对肿瘤子集的种系或遗传突变的分析与现有数据进行比较，这可以揭示患者是否具有发展特定类型癌症的遗传倾向。研究人员发现，与任何其他类型的癌症相比，该模型的预测更有可能与种系突变最强烈预测的癌症类型相匹配。

指导药物决策

为了进一步验证模型的预测，研究人员将CUP患者的生存时间数据与模型预测的癌症类型的典型预后进行了比较。他们发现，被预测患有预后不良癌症(例如胰腺癌)的CUP患者的生存时间相应较短。与此同时，预测患有通常预后较好的癌症(例如神经内分泌肿瘤)的CUP患者的生存时间更长。

该模型的预测可能有用的另一个迹象来自研究中分析的CUP患者接受的治疗类型。根据肿瘤学家对其癌症起源的最佳猜测，这些患者中约10%接受了针对性治疗。在这些患者中，接受与模型预测的癌症类型一致的治疗的患者比接受通常针对与模型预测的癌症类型不同的治疗的患者表现更好。

利用这个模型，研究人员还确定了另外15%的患者(增加了2.2倍)，如果他们的癌症类型已知，他们本可以接受现有的靶向治疗。相反，这些患者最终接受了更多的一般化疗药物。

“这可能使这些发现在临床上更具可操作性，因为我们不需要批准新药。我们所说的是，这个人群现在有资格接受已经存在的精准治疗，”古谢夫说。

研究人员现在希望扩展他们的模型以包含其他类型的数据，例如病理图像和放射图像，以使用多种数据模式提供更全面的预测。这也将为模型提供肿瘤的全面视角，使其不仅能够预测肿瘤类型和患者结果，甚至还可以预测最佳治疗方案。

标签：