全球首创 :分子之心开源新AI算法,攻克蛋白质侧链预测与序列设计难题
golang学习网今天将给大家带来《全球首创 :分子之心开源新AI算法,攻克蛋白质侧链预测与序列设计难题》,感兴趣的朋友请继续看下去吧!以下内容将会涉及到等等知识点,如果你是正在学习科技周边或者已经是大佬级别了,都非常欢迎也希望大家都能给我建议评论哈~希望能帮助到大家!
蛋白质结构和功能的形成,很大程度上取决于侧链原子间的相互作用,因此,精准的蛋白质侧链预测(PSCP)是解决蛋白质结构预测和蛋白质设计难题的关键一环。但此前蛋白质结构预测大多聚焦于主链结构,侧链结构预测始终是一个未被完全解决的难题。
近日,分子之心许锦波团队推出一种新的 PSCP 深度架构 AttnPacker,在速度、内存效率和整体精度方面取得大幅提升,是目前已知的最优侧链结构预测算法,也是全球首创的可同时进行蛋白质侧链预测和序列设计的 AI 算法。
论文发表在《美国科学院院刊》(PNAS)上,其预训练模型、源代码和推理脚本都已在 Github 上开源。
- 论文链接:https://www.pnas.org/doi/10.1073/pnas.2216438120#supplementary-materials
- 开源链接:https://github.com/MattMcPartlon/AttnPacker
背景
蛋白质由数个氨基酸折叠而成,其结构分为主链和侧链。侧链的差异性对蛋白质的结构与功能有巨大影响,尤其是生物活性。基于对侧链结构的清晰认知,科学家们能够更精准地测定蛋白质三维结构,解析蛋白质 - 蛋白质之间的相互作用,并进行理性蛋白设计。应用到药物设计领域,科学家们便能更快、更准确地找到适合药物与受体的结合点位,甚至根据需要优化或设计结合点位;在酶优化领域,科学家们可以通过对序列的优化改造,让多个侧链参与催化反应,实现更高效、特异性更高的催化效果。
当前大多数蛋白质结构预测算法主要针对主链的结构解析,但蛋白质侧链结构预测还是一个未被完全突破的难题。无论是 AlphaFold2 等热门蛋白质结构预测算法,还是 DLPacker、RosettaPacker 等专注侧链结构预测的算法,准确度或速度都不尽如人意。这也为蛋白质设计带来了限制。
传统方法,如 RosettaPacker,主要使用能量优化方法,先对侧链原子的分布进行分组,再针对某个特定氨基酸来搜索侧链的分组,寻找能量最小的组合。这些方法主要区别于研究者对旋转异构体文库、能量函数和能量最小化程序的选择,准确性受限于对搜索启发式方法和离散抽样程序的使用。业界也有基于深度学习的侧链预测方法,如 DLPacker,它将 PSCP 表述为图像到图像的转换问题,并采用了 U-net 模型结构。但预测精度和速度依然不够理想。
方法
AttnPacker 是一种端到端的预测蛋白质侧链坐标的深度学习方法。它联合模拟了侧链相互作用,直接预测的侧链结构在物理上更可行,具有更少的原子碰撞和更理想的键长和角度。
具体而言,AttnPacker 引入了一种利用 PSCP 的几何和关系方面的深度图转换器架构。受 AlphaFold2 启发,分子之心提出了位置感知三角形更新,以使用基于图形的框架来计算三角形注意力和乘法更新,从而优化成对特征。通过这种方法,AttnPacker 的内存显著减少并拥有更高容量的模型。此外,分子之心探索了几种 SE (3) 等变注意力机制,并提出了一种用于从 3D 点学习的等变变换器架构。
AttnPacker 运行流程。以蛋白质主链坐标和序列作为输入,并基于坐标信息导出空间特征图和等变基。特征图由不变量 graph-transformer 模块处理,然后传递给一个等变的 TFN-Transformer 输出预测的侧链坐标、每个残基的置信度分数和可选的设计序列。预测坐标经过后处理,以去除所有空间冲突,并确保理想化的几何结构。
效果
在预测效果上,AttnPacker 对天然和非天然主链结构都显示出准确性和效率上的改进。同时保证了物理上的可行性,与理想键长和角度的偏差可以忽略不计,且产生了最小的原子空间位阻。
分子之心在 CASP13 和 CASP14 天然和非天然蛋白质主链数据集上对 AttnPacker 与目前最先进的方法 ——SCWRL4、FASPR、RosettaPacker 和 DLPacker 进行对比测试。结果显示,AttnPacker 在 CASP13 和 CASP14 天然主链上显著优于传统蛋白质侧链预测方法,平均重建 RMSD 比每个测试集上的次优方法低 18% 以上。AttnPacker 还超越了深度学习方法 DLPacker,平均 RMSD 降低了 11% 以上,同时也显著提高了侧链二面角精度。除了准确性,AttnPacker 的原子碰撞明显少于其他方法。
给出天然主链结构时,各算法在 CASP13 和 CASP14 目标蛋白上的侧链结构预测结果。星号表示平均冲突值低于天然结构 ——CASP13 为 56.0、5.9 和 0.4,CASP14 为 80.4、7.9 和 2.5。
在 CASP13 和 CASP14 非天然主链上,AttnPacker 也明显优于其他方法,原子碰撞也明显少于其他方法。
给出非天然主链结构时,各算法在 CASP13 和 CASP14 目标蛋白上的侧链结构预测结果。星号表示平均冲突值低于相应天然结构 ——CASP13 的 34.6、2.2、0.5 和 CASP14 的 40.0、2.7、0.7。
创新性地摈弃了离散的旋转异构体库以及计算上昂贵的构象搜索和采样步骤,直接结合主链 3D 几何结构来并行计算所有侧链坐标。AttnPacker 与基于深度学习的方法 DLPacker、基于传统计算方法的 RosettaPacker 相比,计算效率显著提高,减少了 100 倍以上的推理时间。
不同 PSCP 方法的时间比较。重建所有 83 个 CASP13 目标蛋白的侧链原子的相对时间。
AttnPacker 在蛋白质设计上的表现同样优秀。分子之心训练了一个 AttnPacker 变体用以协同设计,该变体可实现媲美当下最先进的方法的天然序列恢复率,同时还可生产高度精确的组装。Rosetta 模拟验证显示,AttnPacker 设计的结构通常会产生亚原生(更低的)Rosetta 能量。
用 ESMFold scTM 和 plDDT 指标对比天然蛋白质序列和 AttnPacker 生成的序列,以评估 AttnPacker 的生成质量,结果表现出强相关性。
除了效果和效率惊人之外,AttnPaker 还有一个非常实用的价值 —— 它非常易用。AttnPaker 只需要一个蛋白质的结构文件即可运行。相比之下,OPUS-Rota4 (28) 需要来自 DLPacker 的原子环境的体素表示、来自 trRosetta100 的逻辑、二级结构和来自 OPUS-CM 输出的约束文件。另外,由于 AttnPacker 直接预测侧链坐标,输出是完全可微分的,这有利于下游预测任务,例如优化或蛋白质 - 蛋白质相互作用。“预测效果好、效率高、易用,这些优势有利于 AttnPacker 在研究和工业领域的广泛使用。” 许锦波教授表示。
总结
1、AttnPacker 是一个用于直接预测序列和侧链坐标的 SE(3)等变模型,可以用于蛋白质侧链结构预测,也可用于蛋白质序列设计,是一项开创性的工作。
2、AttnPacker 的准确性优于其他方法,且效率大幅提升,并具备极高的易用性。
到这里,我们也就讲完了《全球首创 :分子之心开源新AI算法,攻克蛋白质侧链预测与序列设计难题》的内容了。个人认为,基础知识的学习和巩固,是为了更好的将其运用到项目中,欢迎关注golang学习网公众号,带你了解更多关于AI,算法的知识点!

- 上一篇
- CNET更新AI政策 员工将对AI内容进行动手审查和测试

- 下一篇
- 人工智能产业布局提速,多地聚焦重点方向出台政策举措
-
- 科技周边 · 人工智能 | 3分钟前 |
- B站必看!DeepSeek视频创作神器超详细使用教程
- 470浏览 收藏
-
- 科技周边 · 人工智能 | 6分钟前 |
- 笔尖AI续写功能体验,三步从写作小白变大神!
- 392浏览 收藏
-
- 科技周边 · 人工智能 | 7分钟前 |
- 豆包AI手把手教你用Hadoop+Spark轻松玩转大数据!
- 276浏览 收藏
-
- 科技周边 · 人工智能 | 15分钟前 |
- 避免AI证件照“翻车”!超简单技巧大放送
- 331浏览 收藏
-
- 科技周边 · 人工智能 | 21分钟前 |
- DeepSeek大模型教程:手把手教你用百度网盘高效管理文件
- 429浏览 收藏
-
- 科技周边 · 人工智能 | 22分钟前 |
- 豆包AI三步教你写出Rust安全代码,远离内存安全烦恼
- 120浏览 收藏
-
- 科技周边 · 人工智能 | 23分钟前 |
- 豆包AI代码运行流程大公开!从零到部署全揭秘
- 480浏览 收藏
-
- 科技周边 · 人工智能 | 25分钟前 |
- 豆包AI手把手教你Python内存分析,快速揪出泄漏bug!
- 417浏览 收藏
-
- 科技周边 · 人工智能 | 25分钟前 |
- 豆包AI神器实战评测!手把手教你用神回复提升评论区互动率
- 131浏览 收藏
-
- 科技周边 · 人工智能 | 26分钟前 |
- 豆包AI手把手教学,用代码轻松玩转OpenCV图像处理!
- 417浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 茅茅虫AIGC检测
- 茅茅虫AIGC检测,湖南茅茅虫科技有限公司倾力打造,运用NLP技术精准识别AI生成文本,提供论文、专著等学术文本的AIGC检测服务。支持多种格式,生成可视化报告,保障您的学术诚信和内容质量。
- 97次使用
-
- 赛林匹克平台(Challympics)
- 探索赛林匹克平台Challympics,一个聚焦人工智能、算力算法、量子计算等前沿技术的赛事聚合平台。连接产学研用,助力科技创新与产业升级。
- 105次使用
-
- 笔格AIPPT
- SEO 笔格AIPPT是135编辑器推出的AI智能PPT制作平台,依托DeepSeek大模型,实现智能大纲生成、一键PPT生成、AI文字优化、图像生成等功能。免费试用,提升PPT制作效率,适用于商务演示、教育培训等多种场景。
- 111次使用
-
- 稿定PPT
- 告别PPT制作难题!稿定PPT提供海量模板、AI智能生成、在线协作,助您轻松制作专业演示文稿。职场办公、教育学习、企业服务全覆盖,降本增效,释放创意!
- 102次使用
-
- Suno苏诺中文版
- 探索Suno苏诺中文版,一款颠覆传统音乐创作的AI平台。无需专业技能,轻松创作个性化音乐。智能词曲生成、风格迁移、海量音效,释放您的音乐灵感!
- 102次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览