来源:中国科学报
信息化时代的到来让我们无法想象没有计算机的生活和工作。计算机的发展为各行各业带去了发展的生机,计算生物学也应运而生。中国科学院计算数学与科学工程计算研究所“百人计划”研究员卢本卓,作为新一代进入计算生物学研究领域的科研工作者,对计算生物学的强烈兴趣和热爱,让他迅速在该领域崭露头角。近日,本报专访了卢本卓,走近他的计算生物学人生。
计算生物学应需而生
上世纪50年代,Waston和Crick发现了DNA双螺旋结构,开启了以分子层次为对象的结构生物学时代,自此分子生物学成为生物学的前沿与生长点,生物学也进入了“分析”和定量化研究的时代。进入21世纪,以人类基因组计划的完成为标志,人类迎来了生命科学的时代。从对结构生物学中复杂的蛋白质和DNA数据的分析,到对海量基因组数据库分析提取信息,这些研究吸引了全世界不同学科的精英,包括数学、分子生物学、物理、化学、计算机等领域专家的参与。
“人体的一个细胞内就可有上百亿个蛋白质分子。一个大的蛋白质分子可包含上百万个原子。蛋白质内每两个原子间都有相互作用,这些原子处于不停的运动中,其情形就像北京城内同一时刻有两百万辆机动车行驶一样。计算和跟踪一个蛋白质的原子运动就像记录和监控北京的车辆一样。所以如果要通过人手工来计算这些原子的行踪并从中分析蛋白质的性质和规律是不可能的。如此巨大的分析计算量必须借助计算机技术来存储和分析。”卢本卓在谈起计算结构生物学的应用状况时告诉记者。
计算生物学是指通过建立物理、数学、统计等模型,应用计算机和计算技术对生物系统进行模拟计算和数据分析的学科。当前,生物学数据量和复杂性不断增长,基因数据每14个月会翻一番,生物分子的相互作用和运动特征也越来越需要多尺度的精确描述,单单依靠观察和实验已难以应付。因此,必须依靠大规模计算模拟技术,从海量信息中提取最有用的数据。于是在生物技术、计算机技术等迅猛发展的背景下,应运产生了由计算机、物理、数学、化学、分子生物学等多学科相互渗透、融合而成的新兴交叉学科——计算生物学。计算结构生物学是其中较早发展起来的一个方向,关注点是对分子的模拟和计算。
然而,新兴学科的发展并非一帆风顺。计算结构生物学的发展始于上世纪70年代末,不久后制药工业界看到了它的应用前景,大量投资涌入这一领域的研发中。尽管计算结构生物学在国际上经历了“快热”的过程,社会和市场对它的期望值也很高,但由于计算设备和计算方法的先天不足,计算结构生物学并没有在短时间内回馈给投资者所期望的利益,工业界对它的信心大打折扣。同时由于计算方法和效率上的瓶颈,上世纪90年代,计算结构生物学整体上进入停滞,或者说缓慢发展的时期。但学术界的努力从未减缓,实际上这一领域面临的挑战激发了更多研究热情和来自更多学科领域的交叉参与。值得一提的是,随着基因组等数据的大量涌现,生物信息学与系统生物学也随之迅速发展起来。“尽管前期计算结构生物学的发展因为设备和方法的落后遭遇了低谷,但近几年随着计算机技术的快速发展以及新的计算与模拟方法的提出,计算结构生物学展现出了越来越强大的理论预测和实际应用能力(比如对生物分子结构功能关系的定量研究以及药物设计等),并从微观的个别分子向更高层次的复杂系统研究拓展。近年来,我国已经迎来了新一轮的计算结构生物学的稳健发展时期,国家对该领域的研究也越来越重视。国外相关学科起步较早、发展较快,相比来说,我国的计算结构生物学起步稍晚,各个时期的发展节奏也相对迟滞些,但作为后起之秀,随着国内研究资源和环境改善,已经显示出了蓬勃发展的势头。”面对我国计算生物学发展的现状,卢本卓信心满满地说。
结缘计算生物学
最初,计算生物学对于卢本卓来说也是极其陌生的领域。1993年,卢本卓从华东师范大学物理系毕业后,走上了工作岗位,而对自然世界深入了解的欲望一直驱使着他,1997年他考取了中国科技大学天文与应用物理系的研究生,开始接触到分子模拟领域,2002年获得生物化学与分子生物学博士学位。同年,他得到了一个前往美国加州大学圣地亚哥分校攻读博士后的机会,然而出国签证却多次遭拒,几经周折,在他几乎要放弃的时候拿到了签证,终于在2003年前往美国,师从生物分子计算模拟领域的先驱之一——Andrew J.McCammon教授作博士后研究,2006年转入美国霍华德休斯医学研究所。
在美国,起初的两年中,卢本卓的主要工作是进行分子生物性质的计算模拟研究,数学、物理和算法的成分很少。后来偶然尝试了一个计算方法的课题,却解决了一个没有预料到的难题。此后,卢本卓的研究工作重心逐渐转移到了以计算方法为主题的方向上,他的合作者中也陆续增添了数学和计算科学家们。整个计算结构生物学是当前的热门交叉学科,但卢本卓所从事的方向却相对偏僻些。“结缘目前的计算结构生物学研究方向对我来说有一定偶然性,我也非常感谢这些偶然,让我在工作中找到依然能激发兴趣的东西。”卢本卓说。
卢本卓主要从事计算结构生物学模拟方法的研究,近年来他在生物分子连续模型的数值模拟方法及应用程序实现上取得了一些有国际影响甚至是领先性的成果。
30多年来,为提高生物分子静电计算的准确性、效率和处理大体系能力,求解PBE的数值方法在不断发展,从最早的有限差分方法,到后来的边界元、有限元、多重网格,并结合了各种其他精致的计算和优化技术以提高速度,如快速傅立叶变换、小波分析、快速多极距方法、Krylov subspace方法等。但这些进展仍不能满足处理生物大分子或超大分子体系的计算内存和效率的需要。
面对这个难题,经过卢本卓和他的合作者们的不懈努力,在生物分子静电计算的研究中系统发展和丰富了求解线性Poisson-Boltzmann方程的边界元方法(BEM),使PB静电计算达到几乎最优的计算复杂度,并编制和发布了高效求解PBE的应用程序包AFMPB。这些工作是近年来国际上在边界元方法计算PB静电方面的最主要的进展之一。
在该项研究中,卢本卓率先与国外合作者在边界元中发展并结合了针对Yukawa势函数(PBE的基本解)的新版快速多极矩方法(FMM)及自适应FMM(AFMM),发布了本领域唯一一个实现了与Yukawa势函数的新版FMM及AFMM结合的BEM程序。其中,新版FMM最早是由美国Courant数学研究所发展的一个高效算法,被评为上个世纪十个最优秀的算法之一,以高度的精巧和复杂性著称。同时,他还给出了几种严格有效的计算分子间静电作用力的方程和数值计算技巧,解决了在BEM框架下计算整体分子间静电作用力的问题,他还提出了一种简单高效的并且不损失精度的新颖边界元方法(“node patch”BEM)。这一方法简单、易于构造,适用于一般的边界元方法,在解三维问题时显示出了比通常的低阶边界元方法高几倍的效率。
尽管该方法在计算效率上取得了巨大的改善,但凡事追求卓越的卢本卓并不满足,“我们和合作者将结合最近计算机领域涌现的高性能并行结构体系,进一步将其发展成为高效实用软件,用于生物分子的溶剂化能计算、分子相互作用机理研究、药物设计等,希望能服务于计算生物和计算化学界”。
专注科研 崭露头角
随着科研的进展,现在已经是中国科学院计算数学与科学工程计算研究所研究员的卢本卓在自己研究的领域已经开始崭露头角。除了在生物分子静电计算方面,卢本卓在电扩散反应的连续模型、数值计算及其应用实践上也取得了一些探索性的成果。
电扩散模型是一个比PB模型更复杂的多物理耦合连续模型,可描述带电粒子体系在非平衡状态下的分布、扩散和电场变化。它可以应用于一大类生物分子现象或过程的研究中,如离子通道中的输运现象。但目前仍存在很多困难,比如探索提出准确模型并实现对其导致的非线性耦合偏微分方程组的数值求解、对高度不规则的分子表面的网格产生等,因而实际应用时受到极大限制,尤其是针对真实分子几何的数值模拟工具极少。
针对一系列难题,卢本卓用杂交有限元/边界元方法或完全有限元方法实现了数值求Poisson-Nernst-Planck(PNP)耦合方程组,建立了目前国际上极少数能用连续模型实时实形(生物分子)研究分子水平上的电扩散反应过程的完整工具链,预测了若干新的物理化学效应。
在研究和使用边界元、有限元等现代数值方法在生物分子的计算模拟中不可避免地面临着另一个难题:根据分子的几何形状生成数值计算所需要的网格。卢本卓深知分子网格不仅在传统的分子可视化、化学信息学、分子模拟等有广泛应用,而且在近年来兴起的分子系统的数学模拟中也成为一个必需的要素。但传统的分子网格生成方法和工具主要是为可视化和结构计算服务的,其质量不能满足数学模拟方法,比如有限元和边界元模拟的要求。卢本卓与苏州大学陈旻昕合作,面对生物大分子的表面网格这一公开难题迎难而上。他们发展了用表面求迹法对生物分子的Gaussian Surface生成表面网格的新方法及其应用软件。“据我们所知,这是该领域唯一能对百万原子量级以上的生物大分子稳定、高效地产生出比较高质量的表面网格的软件,它计算测试过的病毒分子比通常程序能处理的分子大一个量级以上。这在一定程度上克服了生物大分子表面产生的一个瓶颈问题,扫除了生物大分子数学模拟中的一个障碍。”卢本卓欣慰地说。
同时,卢本卓还与国外合作者首次在原子尺度上建立并应用了一个蛋白和膜相互作用的电弹性耦合连续模型,实现了有限元计算,得到有趣的生物物理结果。
在我们看来一个生僻难懂的学科,在卢本卓眼里,却是一门无比活泼和充满生机的高度交叉学科。卢本卓认为,计算生物学在分子水平上对理解生命过程、进行药物设计开发,及工农业领域中蛋白基因工程等方面的应用有广阔的前景,但这一新兴学科目前的应用和预测能力还相当有限,其中一个挑战就是在处理具有多尺度特征的生物过程时所需要的大量采样对计算提出极高的要求,因而提高准确性和效率是发展计算方法的一个中心任务。
计算生物学将计算机科学发展的成熟知识、技术和方法应用到生物学的前沿,利用其卓越的数值计算能力来进行生物学研究。它处理的是极大量的生物学资料、数据及对其复杂的计算。要达到这个目标,不仅需要先进的计算机硬件,适合而有效的软件和演算方法更是计算生物学所必需的重要条件。发展有自主知识产权的、真正有效的实用软件系统,也是我国目前急需发展、建设和增强的软实力的一个重要内容。“我们近期的一个目标是建立一个高效准确的并行有限元离子通道模拟平台,解决其中一系列的算法、模型和软件上的困难,实现在原子分子尺度上有效模拟完整的离子通道结构及其控制的离子输运过程,改变这一重要领域缺少有效应用软件但又迫切需要的局面。”卢本卓对未来的工作已经搭建了一个蓝图。不管是当初的误打误撞,还是后来的痴迷喜爱,计算生物学都是卢本卓人生道路上美好的相伴,而他未来的计算生物学之路必将在他的执著和热爱下越来越宽阔。