基因突变会如何影响人类健康,很大程度上还是个未解之谜。
不过现在,人类可以借AI之力来研究这件事儿了:
谷歌DeepMind在AlphaFold的基础上,训练出了专门预测人类基因组中错义突变致病性的AlphaMissense。
论文今天登上Science。
“错义突变”是DNA序列的一种非同义替换。简单来说,就是DNA原本的字母(碱基对)被替换掉了。
这就意味着,对应生成的蛋白质里的氨基酸也会发生异化,这可能会让蛋白质失去原本的功能,导致疾病的产生。
AlphaMissense出山第一步,就是对全部7100万种可能的错义突变进行了分类。
结果是,这个AI成功将这些变异中的89%,分类为“可能致病”和“可能良性”。相比之下,人类专家目前的成绩是0.1%。
用AI预测基因突变致病性
一句话总结,AlphaMissense的主要能力,就是预测人类基因组中所有可能的错义突变是致病性的还是良性的。
如何做到——
AlphaMissense基于DeepMind的蛋白质结构预测模型AlphaFold打造。
研究人员用人类和灵长类变异频率数据库对AlphaFold进行了微调。具体而言,自然界中的常见变异可以视作对生物无害的变异,而未曾在数据库中出现的变异,则可视作“致病变异”训练数据。
这种训练策略,可以避免人工标注带来的偏见。
值得一提的是,AlphaMissense不能预测突变后蛋白质结构的变化和突变对蛋白质稳定性的其他影响。
在输入一种错义突变之后,AlphaMissense会结合蛋白质结构上下文和蛋白质语言模型,对突变进行一个0-1分的打分,以此大致判定这种突变会不会致病。
那么问题来了,AlphaMissense的这种分类,真的可靠吗?
研究人员对其进行了实验验证。
在遗传学权威数据库ClinVar上,AlphaMissense展现出了比其他计算方法更强大的分类性能。
在18924个变异数据中,AlphaMissense的ROC曲线下面积(auROC)达到0.94。这个数字越接近于1,就代表模型越能正确地区分正样本和负样本。
值得注意的是,上图中,以灰色显示的计算方法是在ClinVar上训练的,可能存在过拟合。
在预测准确率方面,AlphaMissense也达到了SOTA。通过调节分类阈值,AlphaMissense给出的“可能致病”和“可能良性”分类,期望精确度都达到了90%。
DeepMind表示:
我们期待看到AlphaMissense帮助解决基因组学和生物科学中悬而未决的问题。
为此,他们已经把AlphaMissense的预测结果和模型代码开源了出来。
另外,DeepMind还分享了19000多种人类蛋白质中所有可能的2.16亿个单氨基酸序列置换预测数据集。
参考链接:[1]论文地址:https://www.science.org/doi/10.1126/science.adg7492
[2]https://www.deepmind.com/blog/alphamissense-catalogue-of-genetic-mutations-to-help-pinpoint-the-cause-of-diseases
[3]https://github.com/deepmind/alphamissense
本文来源:量子位

今典66W/100W超级快充套装充电器mate70/60/p50p40p30 nova1170/40插头8/9数据线闪充Type-c数据线 套装【max66W充电器+1米6A线】
南卡(NANK)Runner3骨传导蓝牙耳机无线开放挂耳式不入耳防水运动双耳降噪运动耳机适配苹果华为小米 深灰色【运动游泳防水 自带16G】
倍思Eli 1i fit 蓝牙耳机挂耳式开放式不入耳骨传导概念运动通话适用苹果华为手机 黑
绿联适用iQooNeo8钢化膜iqoo11/11s/neo8pro高清全屏 防指纹手汗 无黑边白边无孔 防爆手机保护贴膜2片
达音科(DUNU)DTC 800 解码耳放 手机便携HiFi小尾巴安卓4.4平衡3.5单端DSD256硬解 手机hifi解码耳放线 DTC 800(含Type-C线)
适用苹果防窥钢化膜全屏防偷窥膜
¥8
¥11.8
竹林鸟夜莺Z1入耳睡眠耳塞HiFi有线耳机直播K歌电脑游戏电竞无损音乐微型超小动圈高音质安卓适用手机 曜石黑3.5MM版+竹韵塞 有麦版
vivo iQOO Z10 Turbo Pro 国家补贴 第四代骁龙8s 自研电竞芯片Q1 等效7000mAh超薄蓝海电池 游戏手机 沙漠色 12GB 256GB 官方标配
品胜HDMI线2.0版 4K数字高清线1米 3D视频线工程级 投影仪笔记本电脑电视机机顶盒数据连接线
网友评论