本文来自于微信公众号AIGC开放社区(ID:AIGCOPEN),作者:AIGC开放社区。
11月1日,谷歌旗下的AI研究机构DeepMind在官网发布了,蛋白质结构预测模型 AlphaFold的最新技术进展:已显著提升了预测准确性,并将覆盖范围从蛋白质扩展至其他生物分子,包括配体(小分子)。
据悉,AlphaFold可以对蛋白质数据库 (PDB) 中的几乎所有分子进行预测,包括配体、蛋白质、核酸(DNA 和 RNA)以及含有翻译后修饰(PTM) 的分子,达到原子精度实验室级别水准,这对于医药研究至关重要。
Alphafold蛋白质结构数据库:https://alphafold.ebi.ac.uk/
超越蛋白质折叠
自2020年谷歌首次发布AlphaFold以来,彻底改变了蛋白质及其相互作用的理解方式,成功预测了蛋白质的三维结构,帮助生物科学领域实现重大技术突破。
AlphaFold实现了单链蛋白质预测的根本性突破。然后AlphaFold-Multimer 扩展到包含多个蛋白质链的复合物,接着是AlphaFold2.3提高了性能并扩大了对更大复合物的覆盖范围。
在2022年,AlphaFold的结构预测几乎涵盖了科学已知的所有编目蛋白质,这些预测通过与欧洲生物信息学研究所(EMBL-EBI)合作,已在 AlphaFold 蛋白质结构数据库免费提供。
迄今为止,超过190个国家的140万用户已经访问了 AlphaFold 蛋白质结构数据库,世界各地的科学家已经使用 AlphaFold 的预测来帮助推进从加速新的疟疾疫苗研发和推进癌症药物发现,到开发用于解决污染的塑料降解酶的研究。
最新的AlphaFold模型不仅局限于蛋白质折叠,还能够在配体、蛋白质、核酸以及翻译后修饰等方面生成高度精确的结构预测。
加速药物研发
数据分析显示,最新的AlphaFold模型在一些与药物发现相关的蛋白质结构预测问题上,大大优于AlphaFold2.3,如抗体结合。此外,准确预测蛋白质、配体结构对于药物发现是一种重要工具,可以帮助科学家识别和设计新的分子,这些分子可能会成为药物。
当前的医药行业的标准是使用“对接方法”来确定配体和蛋白质之间的相互作用。这些对接方法需要一个刚性的参考蛋白质结构和一个建议的配体结合位置。
最新的AlphaFold模型通过优于最好的报告的对接方法,设定了蛋白质-配体结构预测的新标准,而无需参考蛋白质结构或配体口袋的位置,允许对以前从未在结构上进行过表征的全新蛋白质进行预测。
系列预测结构与最新AlphaFold 模型的真实情况(白色)进行比较
还可以共同建模所有原子的位置,使其能够表示蛋白质和核酸在与其他分子相互作用时的完全固有的灵活性,这是对接方法无法实现的。
例如,以下是最新AlphaFold模型预测的结构(以颜色显示)与实验确定的结构(以灰色显示)紧密匹配的三个最近发布的、具有治疗相关性的案例:
对 PORCN (1)、KRAS (2) 和 PI5P4Kγ (3) 的预测
PORCN:一种临床阶段的抗癌分子与其目标以及另一种蛋白质结合在一起。
KRAS:与一个重要的癌症目标的共价配体(一种分子胶水)形成的三元复合物。
PI5P4Kγ:一种选择性的脂质激酶的变构抑制剂,具有包括癌症和免疫性疾病在内的多种疾病影响。
对生物学全新认识
通过解锁蛋白质和配体结构以及核酸和含有翻译后修饰的结构的建模,最新的AlphaFold模型提供了一种更快速、准确的工具,用于检查基础生物学。
例如,涉及到CasLambda与crRNA和DNA结合的结构,这是CRISPR家族的一部分。
CasLambda与被广泛称为"基因剪刀"的CRISPR-Cas9系统共享基因编辑的能力,研究人员可以使用它来改变动物、植物和微生物的DNA。CasLambda的较小尺寸可能使其在基因编辑中使用更为高效。
与 crRNA 和 DNA(CRISPR 子系统的一部分)结合的 CasLambda (Cas12l) 的预测结构
AlphaFold能够对此类复杂系统进行建模,这表明,AI模型可以帮助医疗生物界更好地理解这些类型的机制,并加速在治疗过程中的应用。
谷歌DeepMind表示,最新的AlphaFold模型能帮助生物医学突破并构建下一个“数字生物学”时代,为基因组学、生物可再生材料、植物免疫、潜在治疗靶点、药物设计等提供详细的非常重要的预测。