每个人的基因组都是独一无二的特殊存在,是“我”之所以是“我”,而不是其他任何人的独特编码。如果将每个人的基因组都看作一本书,书中的篇章词句就是大大小小的基因片段,它们讲述着生命体从出生、生长发育到死亡的所有故事。当基因片段出现错误,人就会生病。过去,能够无障碍阅读这本“基因书”就是很了不起的事情了,但今天的科学家们已经可以运用各种技术,去纠正“书”中出现的错误。
1、剪除错误并插入正确基因片段
找到“基因书”中错误的片段并将其精准地恢复为正确的片段就是基因“编辑”。CRISPR,是基因编辑技术的一种,相比早前另外两种基因编辑技术TALEN和ZFN,它更灵活易用,同时具有高精度和低成本等优点。这些优点,得益于两个关键“人物”——gRNA和Cas9。gRNA,也叫向导RNA,顾名思义就像GPS导航。在“基因书”里,向导RNA的职责就是在浩如烟海的基因组“文字”中找到出错的地方,然后规划出前进路线;而Cas9,是一种核酸内切酶,它就像剪刀,会沿着向导RNA规划好的路线抵达出错地点,然后剪开错误的基因片段。这就是为什么很多人称CRISPR/Cas9基因编辑技术为“基因魔剪”的原因。
看到这里,大家也许就会产生一个疑问:剪开错误的片段,又怎么把正确的填进去呢?
这就有些类似于编辑文章。根据文字出错方式的不同,使用不同的方法去纠正。如果是有一段错误的文字被放到了不该出现的地方,或者虽然只有一两个错字,但是删掉这些错字和它附近少量的文字反而使句子恢复原意,那就可以直接切掉不需要的文字。这也是目前临床试验中最基础、采用最多的剪切式方案。
如果是只有一个字母错了,可以只将这个字母改回原来正确的样子,这要用到碱基编辑器。但如果是一小段文字都不见了,那就需要提供一份新的文稿补回去。补的方式也有不同,有一种方式叫作引导编辑,针对某个出错的基因片段,科学家会让向导RNA带一段正确的RNA序列到体内,作为标准答案或模板,当“基因魔剪”把错误的基因片段去除后,连在“基因魔剪”上面的分子机器逆转录酶会依样画葫芦,照着答案模板抄一份对的DNA放回原位。另一种方式,则是由科学家在体外合成一段正确的DNA,作为正确答案本身,利用细胞自身的同源重组修复机制填入“基因魔剪”切开的位置。
因此理论上,只要知道出现错误的靶点、正确的答案以及拥有一套编辑工具,数千种由于基因出错导致的疾病都可以找到治愈的办法。但从科学理论到临床实践,是一个复杂的系统性工程,运送编辑工具进入细胞、找到并抵达发生错误的基因片段、切掉和修改错误的片段,这三个步骤所涉及的技术都大有讲究。要在每一步上都精益求精,才能高效、精准地把出错的基因编辑好,完成从基因编辑工具到基因编辑药物的转变。
2、治疗遗传病和癌症前景可期
已经有极少数深受遗传病困扰的人体验过“基因魔剪”。
例如近期对β-地中海贫血和镰刀状贫血症的基因治疗方案。这两种病都是因为编码β-珠蛋白的基因出现了变异,造成血红蛋白减少和贫血。由基因编辑技术发明人、2020年诺贝尔奖化学奖获得者埃曼纽尔·卡彭蒂耶(Emmanuelle Charpentier)开发了一种“曲线救国”的治疗方案:通过使用基因编辑技术降低另一个抑制基因的表达,来恢复γ-珠蛋白的表达,其通常是在胎儿时期才表达的,从而达到恢复红细胞功能的目的。该方法在临床上已获得了初步成效,截至2020年年底已治愈了4名β-地中海贫血和镰刀状贫血症的病患,帮助他们摆脱了长期输血的负担和并发症的困扰。这种疗法需要分离患者的造血干细胞,在体外通过电穿孔将基因编辑药物导入细胞,然后再将造血干细胞植入患者体内进行造血系统重建。类似的方法也可以用于其他造血干细胞相关遗传疾病的治疗。
据英国《自然》网站报道,2020年,一名身患莱伯氏先天性黑蒙症(LCA10)的患者,成为接受CRISPR基因编辑药物人体直接注射试验的第一人。先天性黑蒙症是一种遗传失明症,是导致儿童先天性失明的主要原因。该疗法通过在视网膜下注射含有基因编辑药物的腺相关病毒载体,将突变的基因内含子片段切除或使其形成倒位,从而恢复基因的正常表达。后续更多的临床试验结果表明该疗法对部分患者有积极的效果。
基因编辑技术更激动人心的广泛应用是癌症治疗领域。嵌合型抗原受体T细胞免疫疗法(CAR-T)是通过转基因技术将T细胞改造成针对特定肿瘤的一种新型的杀伤细胞的癌症治疗方法,在白血病、淋巴瘤、骨髓瘤等血液癌症治疗中有良好的疗效。传统CAR-T疗法需要分离患者的T细胞,在体外进行转基因,扩增至治疗需要的数量后再输回患者体内。这是个漫长的过程,有可能错过治疗时机。体弱的幼儿和老年病人也可能没有足够的T细胞供分离。现在通过使用CRISPR技术将T细胞中个体识别的基因敲除,可以实现通用型CAR-T细胞供应,缩短治疗时间并扩大适用人群。
不过这样的好消息,在目前阶段依然是罕见的。从技术到临床,还有很长的一段路要走。基因编辑技术还有许多值得开发和深化的地方,但是随着科学家和创新药物研发工程师的努力,相信在不久的将来,“基因魔剪”会像外科医生手中的手术刀一样,精准、快捷和有效地将病灶清除。
3、“导航防护衣”还需更加优化
还记得前文说过基因编辑的几个步骤吗?科学家和工程师们目前在做的就是“各个击破”这件事。
首先,找到更先进的导航。假设已知某一处基因片段出错需要通过编辑来修正,实际操作时往往需要在一定的坐标范围内选择“一刀切”的下刀位置。如果向导RNA足够优秀,它就可以规划出一条最优路线:比如,选择哪个点下刀,既可以准确切除错误片段,又不会误伤沿途其他的基因;又比如,能够从极其相似的两个或几个目的地中,辨认出真正需要执行编辑任务的那一个。
然后,磨出“快刀利刃”,也就是优化出准确度更高、编辑效率更高,体积更小的基因编辑蛋白。这一点比较容易理解:刀钝,一刀下去拖泥带水,要么没切干净,要么把不该切的也拉扯下来,既不精准也不安全。而如果刀快,一刀下去干脆利落,只切该切的地方,才是基因编辑的理想工具。
此时,如果配上一套动力和安全性都上乘的“递送系统”,就完整了。当导航、手术刀和正确答案都准备就绪,这些执行编辑工作的关键“人物”,需要被护送进入人体并直达目的地。而这看似最平平无奇的一步,反而是整个基因编辑系统里相对较难的一部分。假设我们想要编辑肝脏细胞的基因,就需要将向导RNA和基因编辑剪刀“打包”在一个针剂里,然后通过注射的方式输进人体内。
这团复合物从针头位置开始往肝脏“跑”,如果没有保护,这些外来物在路上难免会遭到免疫系统的攻击,很多时候还会去到不想让它们去的组织器官。此时,可以把“递送系统”,看作给向导RNA和“基因魔剪”穿上了一件“导航防护衣”。只有当它们抵达执行基因编辑任务的目标细胞时,“防护衣”才会自动脱落,释放出一整套基因编辑工具。显然,什么材质适合做这件防护衣,如何避免防护衣提前脱落,这些都是需要优化的技术要点。
4、人工智能加速开发“基因魔剪”
在已知的6000多种遗传病中,目前只有大约几十种被美国食品药品管理局批准的药物,可以对其中一部分疾病进行治疗,绝大部分遗传疾病连有效的治疗方案都没有,治愈更是无从谈起。由于CRISPR可以修改DNA序列,因此对主要由基因突变、缺失等造成的遗传病来说,基因编辑技术可以为患者们带来一线希望。
但仅仅针对某一个疾病基因,去开发一套完整的治疗方案,是一项非常大的系统性工程。结合创新研究范式、基因测序高通量数据和人工智能算法,我们团队正在搭建一个AI助力的基因编辑工具开发平台,全方位优化CRISPR系统,筛选开发出更多的对症基因治疗方案,同时使这项技术可以更精准、更安全地在人体内发挥作用。
就像用不同的导航会有不同的推荐路径,使用不同的向导RNA编辑同一个基因会有不同的编辑效率和脱靶率,而同样的CRISPR系统编辑不同的基因,效率有时候也会有巨大的差异。这些差异是由目标基因序列决定的。而从海量的基因序列—编辑效率所对应的数据中,找出潜在规律并用于预测和设计新的向导RNA,正是人工智能所擅长的。这些问题出现在基因编辑三部曲的每一个大小环节。生物数据的产出能力在目前阶段是有限的,但是实验室正在产出庞大的高质量体内数据集合,为构建人工智能模型提供了更为真实可靠的训练集。将人工智能应用于基因和细胞治疗领域,我们需要以数据为核心,开发适用于此应用场景的人工智能算法,对数据深度学习,建立起一套适合于某种疾病的基因治疗模拟平台。
依靠现代数据连接和人工智能算法所具有的独特能力,可以保持生物事件的实时和动态性。由此对非线性功能关系进行建模,可以有效提高模型与过程的匹配度。例如,美国博德研究所(Broad研究所)的David Liu团队及其他研究人员创建了一种机器学习模型,并已于2018年11月7日在《自然》上发表。该模型可以理解为人工智能,实现了高精度地预测人类和小鼠细胞如何响应CRISPR诱导的DNA断裂。他们证明即使没有模板,Cas9编辑也是可预测的,并且能够精确修复预测的基因型,从而纠正与人类疾病相关的突变。在这些领域,中国的科学家团队也已经逐渐接近世界最好的水平。
这种逐渐兴起的科学研究和药物开发范式,深度结合高通量实验数据与人工智能模型,通过数据特征的提取和模型的不断优化,实现从靶点发现、新编辑工具开发、新靶点基因治疗策略开发到最终成药的一体化技术。最终将打通人工智能结合生物学数据进行CRISPR系统开发的全流程,加快遗传病、癌症等治疗方案的开发速度,让更多期待被救治的病患,能有机会获得更有质量的生活。
作者:马丽佳(西湖大学生命科学学院功能基因组学与生物信息学实验室负责人)