banner
NEWS LETTER

文献阅读:人类抗体从一般蛋白质语言模型的有效进化

Scroll down
  • 这篇文章的主要研究目的是利用一种称为语言模型的算法,来高效地改进人类抗体的亲和力,即抗体与特定抗原结合的强度。亲和力是抗体治疗的重要指标,因为它影响了抗体对病原体的中和能力和耐受性。
  • 语言模型是一种基于人工智能的算法,可以从大量的自然蛋白质序列中学习氨基酸排列的规律,从而预测哪些突变更有可能发生在自然进化中。作者假设,这些突变也更有可能提高抗体的亲和力,即使算法没有提供任何关于抗原、结合特异性或蛋白质结构的信息。
  • 作者使用了两种通用的语言模型(ESM-1b和ESM-1v),分别在UniRef50和UniRef90这两个包含了数百万种自然蛋白质序列的数据集上训练。这些数据集只包含了少量与抗体相关的序列,并且早于SARS-CoV-2等新型病毒的发现和变异。因此,语言模型不能利用疾病特定的偏差来指导抗体进化,而必须依靠更一般的进化规律。
  • 作者使用这些语言模型来计算所有单个氨基酸替换对抗体变量区(包括重链和轻链)的可能性,并选择了六个语言模型共同认可的比野生型更有可能发生的替换。作者在实验室中进行了两轮定向进化,分别测量了每种抗体8到14个单个替换变体和1到11个组合替换变体与抗原结合的强度。作者使用了生物层干涉仪(BLI)来测量单价片段抗原结合(Fab)区域或双价免疫球蛋白G(IgG)与抗原之间的解离常数(Kd),Kd越小表示亲和力越高。
  • 作者选择了七种人类IgG抗体作为研究对象,它们分别针对冠状病毒、埃博拉病毒和甲型流感病毒等不同的病原体表面蛋白。这些抗体具有不同的成熟度和临床相关性,有些是从患者血清中分离出来的,有些是经过人工进化优化过的。作者使用不同类型的流感A病毒血凝素(HA)、埃博拉病毒糖蛋白(GP)或SARS-CoV-2刺突蛋白(Spike)作为筛选用的抗原。
  • 作者发现,所有七种抗体都在两轮定向进化后获得了亲和力提高的变体,其中四种临床相关、高度成熟的抗体亲和力提高了最多七倍,三种未成熟或低成熟的抗体亲和力提高了最多160倍。许多设计的变体还显示出更好的热稳定性和对埃博拉病毒和SARS-CoV-2伪病毒的中和活性。语言模型推荐的变体中,有一部分是在自然进化或传统的亲和力成熟过程中很少出现的,表明语言模型能够探索出不同的进化路径。
  • 作者还对变体进行了其他方面的表征,包括多特异性、免疫原性、结构稳定性等,发现变体没有显著增加与非目标蛋白的结合或T细胞介导的免疫反应,而且大多数变体保持了高于70°C的熔点。作者还与其他基于序列信息的方法进行了比较,发现通用的语言模型在推荐提高亲和力的变体方面优于专门针对抗体序列训练的语言模型或基于突变频率的方法。
  • 作者最后测试了通用的语言模型是否能够指导其他类型蛋白质的进化,包括抗生素抗性、癌症药物抗性、酶活性或病毒复制适应性等不同的适应性压力。作者使用了高通量扫描突变实验的数据来验证语言模型推荐的变体,并发现在六个数据集中有五个能够显著富集高适应性值的变体。这些结果表明,语言模型能够学习到普遍适用于多种蛋白质家族和选择压力的进化规则。

I'm so cute. Please give me money.

其他文章
请输入关键词进行搜索