本网讯(通讯员 康文斌 )7月2日,国际顶级期刊《自然通讯》(Nature Communications)(5年IF:16.1)在线刊发公共卫生与健康学院鲍磊博士与多个外单位的合作研究成果“Accurate Prediction of Protein StructuralFlexibility by Deep Learning IntegratingIntricate Atomic Structures and Cryo-EMDensity Information”。鲍磊博士为论文共同第一作者,合作者包括山东大学数学与交叉科学研究中心韩仁敏教授、沙特阿卜杜拉国王科技大学计算生物学中心主任高欣教授和北京理工大学医学技术学院张法教授。
蛋白质的动态信息对于了解其机理至关重要。然而,通过计算预测蛋白质动态信息已被证明极具挑战性。本工作提出了一种神经网络模型RMSF-net,它优于以往所有的方法,并在大规模蛋白质动态数据集中取得了最佳结果;该模型只需几秒钟就能准确推断出蛋白质的动态信息。通过有效地学习实验蛋白质结构数据和冷冻电镜(cryo-EM)数据集成,该方法能够准确地识别冷冻电镜图和PDB模型之间的交互双向约束和监督,从而最大限度地提高动态预测效果。数据集上严格的5倍交叉验证表明,RMSF-net在体素水平上的测试相关系数为0.746 ± 0.127,在残基水平上的测试相关系数为0.765 ± 0.109,展示了其提供接近分子动力学模拟的动态预测的能力。此外,它还能提供实时动态推断,并将存储开销降至最低,仅约为兆字节。RMSF-net是一种可免费访问的工具,预计将在蛋白质动力学研究中发挥重要作用。
RMSF-net主要用于预测溶液中纯蛋白质及其复合物的动态特性。对于蛋白质与小分子配体结合或在生物膜环境中的动态性质,这种方法可能会在某些局部区域表现稍弱。虽然我们认为RMSF-net预测仍能保持一定程度的近似准确性,但针对这些情况开发专门的方法非常重要。鉴于精确构建小分子配体力场和模拟生物膜环境蛋白质的成本很高,因此需要积累更多数据。RMSF-net的卓越性能揭示了在这一方向开展进一步研究的可行性。同时,该研究还没有扩展到核酸和蛋白质-核酸复合物。对大分子动力学各方面的综合表征,包括多构型预测和转换分析,还需要今后进一步广泛深入的研究。不过,作为预测蛋白质动力学的工具,RMSF-net凭借其优越的性能和超快的处理速度,在蛋白质结构和动力学研究中仍然大有可为。
|
图1 RMSF-net计算流程概览(a,b)和预测结果展示(c) |
鲍磊博士,自2020年于华中科技大学物理学院博士后出站并入职湖北医药学院以来,一直致力于使用分子模拟方法研究复杂生命体系的结构与动力学特性,并将分子动力学模拟与深度学习方法结合,用于对生命体系中涌现的复杂现象进行精确的预测。近年来,得益于学校和学院给予的政策和硬件支持,鲍磊与数理教研团队稳步前进,接连产出高质量研究成果,例如关于金属离子调控核糖开关施行基因表达的工作发表于《Communications Biology》(中科院一区,5年IF:5.6),并应邀为Springer-Nature出版社旗下著名工具书系列《Methods in Molecular Biology》撰写章节阐述研究代谢配体与核糖开关结合事件的规程细节,等等。总之,他坚信在不断坚持求索、并积极与国际先进研究组织合作的基础上,团队能够在未来取得更多更好的研究成果,为学校升大和高质量发展贡献来自数理人的力量。(审稿:吕红)
论文链接:https://www.nature.com/articles/s41467-024-49858-x