2022年4月23日,星期六

利用机器学习模型鉴别抗体靶标

新方法成功地区分了流感抗体和攻击SARS-CoV-2的抗体,SARS-CoV-2是导致COVID-19的病毒。

从COVID-19大流行开始,全球许多研究小组将注意力转向SARS-CoV-2,特别是对感染和疫苗接种的免疫反应。自2020年以来,已经分离和鉴定了数千种人类SARS-CoV-2单克隆抗体。

一项新的研究表明,利用一个人抗体的基因序列来预测这些抗体将针对哪些病原体是可能的。据《免疫》杂志报道,新方法成功地区分了对抗流感的抗体和攻击SARS-CoV-2的抗体,SARS-CoV-2是导致COVID-19的病毒。

“我们的研究还处于非常早期的阶段,但这项概念验证研究表明,我们可以使用机器学习将抗体序列与其功能联系起来。”生物化学教授Nicholas Wu说伊利诺伊大学Urbana-Champaign和伊利诺伊大学生物化学博士生王益泉共同领导了这项研究;以及加州拉霍亚市斯克里普斯研究所的研究员孟Yuan。

“虽然现在公众可以获得许多人抗SARS-CoV-2单克隆抗体的信息,但很难利用所有可用的信息来调查公众对SARS-CoV-2的抗体反应。一个主要的挑战是,来自不同研究的数据很少采用相同的格式。这种不一致性给数据挖掘带来了巨大的障碍。”

“冠状病毒抗体数据库(CoV-AbDab)的建立,使研究人员能够将抗体数据以标准化格式存储,部分解决了数据格式问题。然而,并不是每一个SARS-CoV-2抗体研究已经将数据存储到CoV-AbDab中。此外,covid - abdab中没有IGHD基因特性、核苷酸序列和供体id,这使得使用covid - abdab研究公共抗体反应具有挑战性。因此,必须作出额外努力,充分协调许多不同的SARS-CoV-2抗体研究的信息,以调查和破译公众抗体反应。”研究报价。

吴说,有了足够的数据,科学家不仅可以预测抗体攻击的病毒,还可以预测抗体结合的病原体的特征。例如,一种抗体可能附着在SARS-CoV-2病毒刺突蛋白的不同部位。了解了这一点,科学家就可以预测人体免疫防御的强度,因为一些病原体的目标比其他目标更脆弱。

吴说,新方法的实现得益于大量与SARS-CoV-2抗体相关的数据。

“20年来,科学家们已经发现了大约5000种对抗流感病毒的抗体。”他说。“但在短短两年时间里,人们已经发现了8000种COVID抗体。这为研究抗体的工作原理和做这种预测提供了一个前所未有的机会。”

一项大规模系统调查揭示了公众抗体对SARS-CoV-2反应的反复出现的分子特征
一项大规模系统调查揭示了公众抗体对SARS-CoV-2反应的反复出现的分子特征

突出了

  • 收集了来自>200名捐赠者的约8000份已发表的SARS-CoV-2 S抗体数据集
  • RBD、NTD和S2抗体具有不同的收敛序列和分子特征
  • 公共抗体克隆型显示重复性亲和成熟途径
  • 为利用深度学习进行抗体特异性预测提供了一个概念证明

该模型旨在区分针对流感病毒或SARS-CoV-2病毒区域的抗体编码序列。然后研究人员检查了这些预测的准确性。

“总体上,准确率接近85%。”王说。

“它的效果如此之好,我其实很惊讶。”吴说。

该团队正在努力改进其模型,以更精确地确定抗体攻击的是病毒的哪些部分。

“如果我们能根据抗体序列做出这些预测,我们或许还能回头设计出与特定病原体结合的抗体。”吴说。“这不是我们现在能做的事情,但这对未来的研究有一些启示。”

本研究的局限性:

我们收集的许多抗体都是从sars - cov -2感染者身上分离出来的。然而,感染病毒变异的序列信息在原始出版物中没有得到。

虽然这些抗体大部分是在早期阶段分离出来的新型冠状病毒肺炎我们收集的一些抗体可能是由SARS-CoV-2变异引起的,而不是祖先的Hu-1毒株。与此相关,这项研究没有检测抗体对不同变异的特异性。未来的分析可以利用已发表的抗体对不同变体的中和活性信息来研究抗体序列特征与中和广度之间的关系。

期刊引用

  1. 王益泉,袁孟,吕慧斌,彭建,Ian A. Wilson, Nicholas C. Wu;一项大规模系统调查揭示了公众抗体对SARS-CoV-2反应反复出现的分子特征,免疫10.1016 / j.immuni.2022.03.019

探索更多的

新发明

趋势

Baidu
map