行业资讯

《自然》:科学家联手开发人工智能 准确预测致病基因突变

2021/10/29 17:10:44
来源: 学术经纬 


进入21世纪,基因组测序技术取得了巨大的飞跃,越来越多的人现在可以对其基因组进行测序。由此,我们已经在人群中识别出了数以百万计的基因变异。

对于少数基因变异,人们找出了它们与疾病的关联。比如BRCA1和BRCA2基因上的一些突变与升高乳腺癌和卵巢癌的风险有关,于是人们可以根据基因测序结果采取预防和治疗的手段。

然而,对于绝大部分已识别的基因变异——超过98%,我们还不清楚变异意味着什么:是会影响基因功能,导致疾病?还是不会对健康造成影响,无需担心?

顶尖学术期刊《自然》今日在线发表的一篇研究论文中,来自哈佛医学院和牛津大学的科研人员合作展示了他们开发的一款人工智能(AI)模型。对于人类的基因变异是否意味着疾病,这款AI具有非凡的判断能力。

它不仅预测出了3200多个疾病相关基因中的3600万个致病突变,并且为256000个至今意义不明的基因突变是“致病”还是“良性”做出归类。

这款AI使用一种复杂的机器学习,先检测了数十万来自其他物种的基因变异模式,然后根据自行学习归纳的结果,预测人类基因变异的含义。

研究人员解释说,演化倾向于保留一些对于生存十分重要的特征,这些特征在不同物种中共享,因此重复出现在不同物种中的氨基酸序列是一个重要的生物学标志,表明这种高度保守的序列一旦改变可能与疾病有关。而这款AI通过对这些序列变异在不同物种中的分布进行建模,学会预测哪些序列可能导致疾病。



▲这款AI的建模策略:对于每种蛋白质,都会比较它在多个物种中的序列数据(图片来源:参考资料[1])

由于综合了进化上很多其他物种的线索,研究人员将这款AI命名为Evolutionary model of Variant Effect,简称EVE。

经过2.5亿个蛋白质序列的训练后,EVE开始预测单个氨基酸变异会带来什么后果。为了确定EVE的预测是否准确,研究人员用意义明确的一些人类基因突变进行了检验,发现EVE给出的评分结果与临床数据非常一致。

研究人员将EVE应用于3219个疾病相关的人类基因,这些基因上出现的不同突变有一些是致病性的,还有一些是良性的。

更严格的检验来自于实际临床实验,这是用于评估基因突变如何影响生理功能的金标准。研究团队选择了5个基因,包括BRCA1,TP53,PTEN,MSH2和SCN5A,这些基因经过充分的研究,已知其中一些变异与各种形式的癌症、心律失常等疾病相关。而EVE通过计算得到的预测结果与临床实验中的疾病风险结果有很大的重叠。



▲对几种疾病相关基因的不同变异是否具有致病性,EVE的计算预测结果(左侧)与实际临床实验结果(右侧)接近(图片来源:参考资料[1])

研究人员指出,EVE的预测有一个显著的优势是,对于基因变异它并非给出一个非黑即白的判断结果,而是会显示一个连续的分数。

此外,这款AI在对每个基因变异给出预测分数时,还会提供一个置信度分数,告诉使用者——比如临床医生,在多大程度上可以相信EVE的判断。

注:原文有删减

参考资料:

[1] Jonathan Frazer et al., (2021) Disease variant prediction with deep generative models of evolutionary data. Nature Doi: https://doi.org/10.1038/s41586-021-04043-8

[2] All about Eve. Retrieved Oct. 27, 2021 from https://www.newswise.com/articles/all-about-eve?sc=rsla