旧版 English

前沿工程讲堂|第52讲:朱怀球教授主讲“生物医学大数据与AI赋能的探索”

    2025年10月18日晚,“前沿工程讲堂”第52讲在第二教学楼205举行。北京大学未来技术学院朱怀球教授讲授“生物医学大数据与AI赋能的探索”专题课程。

朱怀球教授主讲“前沿工程讲堂”

    课程伊始,朱怀球教授介绍了自己的学术科研历程,他求学期间攻读计算流体力学专业并获得博士学位,博士后期间受人类基因组计划的启发,将算法思维引入生命科学研究,跨学科转到了新兴的生物信息学领域。随机信号分析到基因组DNA序列分析,再到算法在生命系统中的应用,他逐步构建起以生命信息学算法和工具为核心的研究特色,将定量分析生物医学问题深度融合。随后,他从科学史与哲学的角度引出确定性与不确定性的思考,指出AI正是在复杂与随机的生命体系中发现确定的关键工具,为理解生命规律提供了新的认知框架。

    接着,朱怀球教授分析了生命系统的复杂性与大数据的关系,生物复杂性首先从多方面驱动了生物医学大数据的产生,与此同时,生物医学大数据又服务于人们对生物复杂性的理解,而AI正在成为这一方向的重要引擎。作为数据存储的载体,生物医学信息数据库也是通向科学发现、临床应用和社会发展,构成支撑生命科学研究和生物技术产业的关键基础设施。他进一步系统地梳理了生物医学数据库发展的历史与变革。他将数据库的演进分为三个阶段:1.0时代的静态档案库、2.0时代的集成知识库、3.0时代的智能知识平台。进入3.0时代后,数据库已从简单的数据仓库演变为集存储、分析、可视化、计算于一体的综合性、智能型的知识平台,其主要特征是大数据、云计算、AI驱动、互联互通。他指出,这种深刻变化主要体现在数据规模的指数级增长和多元化、多源大数据的深度整合、数据云存储与云计算的融合、人工智能与机器学习深度融入数据库功能、临床与表型数据的深度融合、以及界面和使用的智能化。

 

课程现场

    在此基础上,朱怀球教授进一步讨论了深度学习给生物信息算法设计带来的机遇,介绍了深度学习在生物多组学研究中的应用。他以自主研发的PPRMeta算法为例,展示了深度学习在高通量DNA测序数据中对细菌、噬菌体及质粒的短读序实现了高精度识别,显著提升了数据分析效率与可靠性。同时,他也指出,深度学习在临床应用仍面临数据质量与标注困难、模型可解释性不足、生物医学知识与算法模型的融合不足、计算资源与算法效率瓶颈等问题。此外,他还分享了团队在大规模队列分析和AI赋能临床诊疗研究的探索。

    课程最后,朱怀球教授介绍了依托北京大学未来技术学院、人工智能研究院建设的人工智能数字生命科研平台。他表示,当前团队正围绕国家重大需求,构建多组学、多模态、跨尺度的大数据分析体系,推进数字细胞、数字器官、数字灵长类模型等研究工作,并探索AI在创新药物发现与疫苗设计中的应用。

 

互动交流

    在互动交流环节,师生们围绕数据自主安全、数据库标准化及AI在数据整合中的潜能展开深入讨论。朱怀球教授指出,生物医学领域亟需构建安全可控的国家级数据库体系,并强调标准化关乎行业话语权与科研共识的形成。他鼓励青年学者以跨界视野和科学思维投身生命科学与人工智能融合的前沿探索,重视规范与安全体系的基础建设。课程在热烈的掌声中圆满结束,本次课程不仅深化了同学们对AI赋能生命科学的认识,也激发了对自主科研体系建设的深入思考。

返回