人类遗传学的一个主要挑战是了解基因组的哪些部分驱动特定特征或导致疾病风险。对于在不编码蛋白质的98%的基因组中发现的遗传变异,这一挑战甚至更大。
纽约大学和纽约基因组中心的研究人员开发的一种新方法结合了遗传关联研究、基因编辑和单细胞测序,以应对这些挑战并发现血细胞特征的因果变异和遗传机制。
他们的方法被称为STING-seq并发表在《科学》杂志上,解决了将遗传变异与人类特征和健康直接联系起来的挑战,并可以帮助科学家确定具有遗传基础的疾病的药物靶点。
在过去的二十年里,全基因组关联研究(GWAS)已经成为研究人类基因组的重要工具。使用GWAS,科学家们已经确定了与许多疾病相关的数千种基因突变或变异,从精神分裂症到糖尿病,以及身高等特征。这些研究是通过比较大量人群的基因组来进行的,以发现在具有特定疾病或特征的人群中更常发生的变异。
GWAS可以揭示哪些基因组区域和潜在变异与疾病或性状有关。然而,这些关联几乎总是存在于不编码蛋白质的98%的基因组中,这远不如对编码蛋白质的2%的基因组进行深入研究。更复杂的是,在基因组中发现许多变体彼此非常接近,并且世代相传,这一概念称为连锁。这使得很难区分哪个变体与附近的其他变体起着真正的因果作用。即使科学家能够确定哪个变异导致疾病或性状,他们也并不总是知道该变异会影响哪个基因。
“研究人类疾病的一个主要目标是确定致病基因和变异,这可以阐明生物学机制并为这些疾病提供药物靶标,”纽约大学生物学副教授、神经科学和生理学副教授NevilleSanjana说。纽约大学格罗斯曼医学院,纽约基因组中心的核心教员,也是该研究的共同资深作者。
“GWAS的巨大成功凸显了从这些海量数据集中提取疾病生物学见解的挑战。尽管我们在过去10年中付出了所有努力,但玻璃杯充其量仍只是半满。我们需要一种新方法”纽约基因组中心高级副教员、瑞典皇家理工学院基因组学教授、该研究的共同资深作者TuuliLappalainen说。
镰状细胞性贫血的治疗方法
最近在治疗镰状细胞性贫血(一种以剧烈疼痛发作为特征的遗传性疾病)方面取得的科学突破表明,将GWAS与基因编辑等尖端分子工具相结合如何能够识别致病变异并导致创新疗法。使用GWAS,科学家们确定了基因组中对产生胎儿血红蛋白很重要的区域,这是一个基于其逆转镰状细胞性贫血的承诺的目标,但他们不知道是哪个确切的变异驱动了它的产生。
根据Sanjana的说法,研究人员转向CRISPR——一种使用“分子剪刀切割DNA”的基因编辑工具——来编辑GWAS识别的区域。当在称为BCL11A的基因附近的非编码基因组中的特定位置进行CRISPR编辑时,会产生高水平的胎儿血红蛋白。
CRISPR现在已用于临床试验,以编辑数十名镰状细胞性贫血患者的骨髓细胞中的该区域。修改后的细胞被输回患者体内后,它们开始产生胎儿血红蛋白,取代突变的成人形式的血红蛋白,有效治愈他们的镰状细胞病。
“这个治疗镰状细胞病的成功故事是将GWAS的见解与基因编辑相结合的结果,”Sanjana说。“但是只对一种疾病进行了多年的研究。我们如何扩大规模以更好地从GWAS中识别致病变异和目标基因?”
GWAS遇上CRISPR和单细胞测序
研究团队创建了一个名为STING-seq的工作流程——通过单细胞测序对非编码GWAS基因座进行系统靶向和抑制。STING-seq的工作原理是采用生物样本库规模的GWAS,并结合生化特征和监管要素寻找可能的致病变异。然后,研究人员使用CRISPR靶向GWAS涉及的基因组的每个区域,并进行单细胞测序以评估基因和蛋白质表达。
在他们的研究中,研究人员举例说明了使用STING-seq发现血液性状非编码变异的靶基因。血液特征——例如血小板、白细胞和红细胞的百分比——很容易在常规血液测试中测量,并且在GWAS中得到了充分研究。因此,研究人员能够使用代表来自不同背景的近750,000人的GWAS来研究血液特征。
一旦研究人员确定了543个可能在血液特征中起作用的基因组候选区域,他们就使用了一种称为CRISPR抑制的CRISPR版本,它可以沉默基因组的精确区域。
在CRISPR对GWAS识别的区域进行沉默后,研究人员观察了单个细胞中附近基因的表达,以确定特定基因是打开还是关闭。如果他们发现变体沉默和未沉默的细胞之间的基因表达存在差异,他们就可以将特定的非编码区域与目标基因联系起来。通过这样做,研究人员可以确定哪些非编码区域对特定性状至关重要(哪些不是),并且通常还可以确定这些非编码区域发挥作用的细胞通路。
“STING-seq的强大之处在于我们可以将这种方法应用于任何疾病或特征,”纽约基因组中心和纽约大学的博士后助理、该研究的第一作者约翰莫里斯说。
使用STING-seq测试可能的变异簇并查看它们对基因的影响,消除了科学家以前在面对变异或最接近变异的基因之间的联系时遇到的猜测,这些变异通常但不总是目标基因。在称为单核细胞计数的血液特征的情况下,应用CRISPR导致一个基因CD52明显脱颖而出,发生显着变化——虽然CD52接近感兴趣的变异,但它不是最接近的基因,因此可能被忽略了使用以前的方法。
在另一项分析中,研究人员发现了一种名为PTPRC的基因,它与10种血液特征相关,包括与红细胞、白细胞和血小板相关的特征。然而,有几个GWAS识别的非编码变体非常接近,并且很难理解哪些(如果有的话)可以调节PTPRC表达。应用STING-seq使他们能够通过查看哪些变化的PTPRC表达式来隔离哪些变体是因果关系。
STING-seq及以后
虽然STING-seq可以通过沉默变异来识别目标基因和致病变异,但它并不能解释效应的方向——特定的非编码变异是会增加还是减少附近基因的表达。研究人员将他们的方法更进一步,创建了一种称为beeSTING-seq(碱基编辑STING-seq)的互补方法,该方法使用CRISPR精确插入遗传变异,而不是仅仅抑制基因组的该区域。
研究人员设想将STING-seq和beeSTING-seq用于识别多种疾病的致病变异,这些疾病可以通过基因编辑(如镰状细胞性贫血所用)或针对特定基因或细胞的药物进行治疗路径。
“现在我们可以将非编码变体与目标基因联系起来,这为我们提供了证据,证明可以开发小分子或抗体疗法来改变特定基因的表达,”Lappalainen说。
其他研究作者包括纽约大学和纽约基因组中心的ChristinaCaragine、ZharkoDaniloski、LuLu和KyrieDavis;纽约基因组中心的JúliaDomingo、MarcelloZiosi、DafniGlinos、StephanieHao、EleniP.Mimitou和PeterSmibert;卡内基梅隆大学的TimothyBarry和KathrynRoeder;和宾夕法尼亚大学的EugeneKatsevich。
该研究得到了美国国立卫生研究院(DP2HG010099、R01CA279135、R01CA218668、R01AI176601、R01MH106842、UM1HG008901、R01GM122924、K99HG012792、R01MH123184)、美国国家科学基金会(DMS)的支持-2113072),加拿大卫生研究院,欧洲分子生物学组织(ALTF345-2021)、美国心脏协会(20POST35220040)、西蒙斯自闭症研究基金会、麦克米伦非编码癌症基因组研究中心、沃顿商学院数据科学和商业分析基金、纽约大学和纽约基因组中心。