近期,天鹜科技(Matwings)自主创新Mat-FEP结合自由能计算取得重大进展,在保持高精度的情况下,数倍提升计算效率。
FEP的背景
在靶向特定目标蛋白的药物研发过程中,评估配体与靶蛋白的结合亲和力有非常重要的意义。在hit to lead阶段,分子对接(docking)可以对上亿的小分子库进行高效的筛选,基于人工智能数据驱动的蛋白-配体亲和力预测方法也可以对小分子进行大批量筛选。但是,分子对接由于打分函数与实验值误差较大且采样不充分,对蛋白配体结合自由能的预测精度有限;基于人工智能数据驱动的方法非常依赖数据的规模和质量,当没有足够高质量的相关数据时,预测的效果往往达不到预期。因此在先导化合物优化阶段,需要有更高计算精度的方法实现对蛋白配体结合自由能的预测以加快创新药物的发现、降低药物研发的成本、缩短药物研发的周期、提高药物研发的成功率。
自由能微扰(FEP)是一种基于统计力学的计算方法,能以与实验精度相当的计算精度预测配体与靶蛋白的结合自由能。对于两个待测的小分子A和B,可以设计如下图所示的热力学循环,当比较小分子A和B与同一靶蛋白的结合自由能差异时,一种方法是直接计算小分子与靶蛋白的结合自由能ΔGA(bind)和ΔGB(bind),称为绝对结合自由能(AFEP),从而得到自由能差ΔΔG=ΔGA(bind)-ΔGB(bind),但是直接计算绝对结合自由能需要庞大的采样且计算精度不高;另一种方法是通过分别计算它们与靶蛋白形成的复合物以及小分子自身在水溶剂体系中的结合自由能变化ΔGA-B(complex)和ΔGA-B(water),进而依据热力学循环,同样可以得到结合自由能差ΔΔG=ΔGA(bind)-ΔGB(bind)=ΔGA-B(complex)-ΔGA-B(water),称为相对结合自由能(RFEP)。此时由于同一系列的小分子往往具有一定的相似性,两种物理学状态之间的差异相对较小,所以可以快速充分完成采样。为了进一步提高计算精度,往往在由小分子A微扰为B的过程中插入更多的中间状态,以进一步减少相邻状态的差异,提高相邻状态分布的重叠度。
FEP计算中的热力学循环
FEP计算方法可以达到实验精度的结合能计算,且不需要将所有的分子进行合成和活性测试,有助于大幅降低成本,提高小分子优化效率。
Mat-FEP计算方法
在精度方面,Mat-FEP采用自定义参数的软核势能,动态优化分子A和分子B中间状态个数,保证微扰过程的充分采样;Mat-FEP采用更灵活的双拓扑结构方法,支持处理骨架跃迁、开环闭环等复杂的微扰体系,无须定义复杂的原子对和参数,便可得到高精度的计算结果;在速度方面,Mat-FEP有机结合天鹜科技自主专利的RBE算法与其他增强采样算法,可以在较短的时间内实现更充分的采样;在易用性方面,Mat-FEP实现流程自动化,可同时对多个分子进行并行高效计算,灵活分配计算资源。
目前,Mat-FEP已达到与实验精度相当的结合自由能预测值(1 kcal/mol)。通过选择「薛定谔公司」论文中发表的数据集进行测试,其中包括8个靶蛋白和199个小分子,同时保证扰动的分子配对设置与文章保持一致。结果表明,Mat-FEP在大多数测试体系的结合自由能预测值与实验值的RMSE都达到了与薛定谔相当甚至更好的计算精度。(测试体系的结合自由能预测值与实验值之间的RMSE越小,说明与实验值更加接近。)
Schrödinger FEP+和mat-FEP在8个测试体系上的表现
Mat-FEP计算由IRBE驱动
2021年,天鹜科技创始人洪亮教授与天鹜科技专家顾问委员会金石教授、徐振礼教授共同构造了Random Batch Ewald(RBE)随机分批算法,通过随机选取Fourier空间上的部分模式代替整体相互作用(严格证明收敛)来计算分子间的长程静电力,成功克服了困扰业界50多年的困难,将计算复杂度降到了N的量级,同时解决了扩展问题。(专利号:202110095324.8)
RBE算法的示意图(A)和高性能实现流程图(B)
2022年,在成功加速分子动力学模拟中长程静电相互作用计算的基础上,天鹜科技团队提出Random Batch List(RBL)算法,将随机分批算法现应用在短程静电和范德华相互作用的计算中。将RBE和RBL加速算法有机结合得到的IRBE算法(Improved RBE),可以直接应用在上述FEP自由能计算的模拟中。对于FEP测试中相对较小的蛋白体系,IRBE的计算速度相比主流算法PPPM(Particle-Particle Particle-Mesh)提升50%,并且在持续优化后速度将会成倍提升;而对于超大规模的纯水体系,IRBE的模拟计算速度已提高数倍。
FEP测试中蛋白体系的算法速度比较
超大规模纯水体系的算法速度比较
下一步,天鹜科技将持续进行RBE算法和其他分子动力学模拟底层算法的优化,以及在GPU上的适配,同时也将继续优化FEP的计算流程,实现Mat-FEP在精度和速度上的不断精进。
未来,天鹜科技将构建增强采样模型(RBE-facilitated),完善基于结构及动力学的药物开发模块,结合自有AI算法、选择性高通量分子合成技术(砌块式点击化学)以及自有湿实验平台(重庆金凤实验室),实现高通量干-湿实验自产数据与 AI 闭环迭代,为中国医药研发争分夺秒。
相关文献:
[1] Shi Jin, Lei Li and Jian-Guo Liu, Random Batch Methods (RBM) for interacting particle systems, J. Comp. Phys. 400, 108877, 2020.
[2] S. Jin, L. Li, Z. Xu and Y. Zhao, A random batch Ewald method for particle systems with Coulomb interactions, SIAM J. Sci. Comput., 43 (2021), B937-B960.
[3] J. Liang, P. Tan, Y. Zhao, L. Li, S. Jin, L. Hong and Z. Xu, Superscalability of the random batch Ewald method, J. Chem. Phys., 156 (2022), 014114.
[4] J. Liang, Z. Xu and Y. Zhao, Random-batch list algorithm for short-range molecular dynamics simulations, J. Chem. Phys., 155 (2021), 044108.
[5] J. Liang, P. Tan, L. Hong, S. Jin, Z. Xu and L. Li, A random batch Ewald method for charged particles in the isothermal-isobaric ensemble, arXiv: 2110.14362.
[6] Wang, L.; Wu, Y.; Deng, Y. et al. Accurate and reliable prediction of relative ligand binding potency in prospective drug discovery by way of a modern free-energy calculation protocol and force field. J Am Chem Soc (2015), 137, 2695-703.