2025年9月13日(周六),基于学科需求的人工智能技术系列培训第三讲在医学部逸夫楼816机房顺利举办。
本次培训邀请到北京大学前沿交叉学科研究院定量生物学中心特聘研究员裴剑锋,北京大学-云南白药国际医学中心、北京大学国际癌症研究院研究员谢正伟,北京大学公共卫生学院流行病与卫生统计学系研究员韩西坤,北京大学公共卫生学院生物统计系、北京国际数学中心双聘研究员刘默雷四位专家,围绕“人工智能融合医学基础研究”主题,从不同专业角度开展为期一天的集中授课。培训以线上、线下相结合的方式进行,累计近300人次参与学习和互动。
药物设计与人工智能药物研发
裴剑锋研究员系统梳理了AI在药物设计全链条中的应用与挑战。他从AI的基础概念切入,指出AI for Science的核心是“机器学习+物理模型”融合。随后结合实例展示三类机器学习策略,监督式用于ADMET性质预测、非监督式预训练化学大模型、强化学习优化合成路线与虚拟筛选。裴剑锋研究员重点介绍了团队在多模态靶点可药性评估、序列-结构-网络三维验证以及基于扩散模型的分子生成平台等领域的研究与发现,并为大家推荐了AI药物设计系统的实用工具。裴剑锋研究员认为当前AI制药仍受限于数据稀缺、模型泛化弱、实验验证成本高等瓶颈,并提醒避免“刷榜式”研究,要真正把AI效率转化为创新突破。
人工智能在药物研发中的应用
谢正伟研究员系统阐述了人工智能在药物研发中的前沿进展与实际挑战,AI技术的应用正推动医学基础研究范式的革新。团队开发基于深度学习和基因指纹的药效预测系统——AI灵素系统(DLEPS)。区别于传统基于靶点的药物研发思路,该系统基于疾病差异表达基因,通过AI预测反推靶点发现,将分子结构直接映射至疾病表型。谢正伟研究员展示了该药效预测系统在肥胖、脱发、免疫治疗、抗衰老等多临床场景的应用案例,如通过基因标志物预测免疫治疗响应、发现延长寿命小分子等。谢教授带领参会师生共同试用DLEPS平台功能,平台输入差异基因即可进行分子、靶点预测,推动“数据-模型-实验”闭环共享。同时,针对目前系统在不同基因拟合相关性不同、分子构效关系不清晰、天然新颖分子筛选、靶点依据不足方面的问题,团队也正推动升级版DLEPS系统构建,并通过药物设计智能体推动后续原始创新药物设计的突破。
基于统计遗传、多组学及人工智能技术解析人类复杂疾病
韩西坤研究员系统阐述了整合统计遗传学、多组学数据与人工智能技术,深入解析人类复杂疾病的遗传机制与潜在干预策略。他指出,尽管基因组医学在疾病风险预测、靶点发现等方面取得重要进展,但当前研究仍面临人群多样性不足、非编码区功能解析困难等挑战。通过多组学整合(如基因组、转录组、蛋白组)与QTL分析,可揭示基因型与表型间的调控关系。目前,AI与深度学习被广泛应用于疾病预测、生物标志物筛选及药物反应建模,显著提升了分析效率与准确性。韩西坤研究员团队通过运用大型队列、遗传流行病学、统计基因组学、实验生物学和深度学习等多学科方法,整合单细胞多组学及功能基因组学,解析人类疾病(包括眼科疾病、神经精神类疾病、呼吸系统疾病等)的遗传基础和分子机制,揭示疾病发生、发展、转化的复杂过程,识别关键生物标志物,发掘潜在药物干预靶点,为疾病的早期筛查、风险预测、治疗及预后评估等多方面提供精准化方案。
可解释AI赋能生物医学大数据研究
刘默雷研究员系统阐述了可解释AI在生物医学大数据中的价值与挑战。他先以足球战术优化为例,说明黑箱模型虽预测力强,却难以回答“变量为何重要”这一科学疑问。随后引入逐一变量剔除(LOCO)、沙普利加和解释(SHAP)等方法,在保持复杂模型性能的同时量化每个特征贡献,通过肠道微生物与糖尿病的关联研究案例,展示了可解释人工智能在医学领域的落地应用。最后,刘默雷研究员指出高维数据、跨人群可推广性、因果推断与(精准)个性化决策仍是可解释机器学习方法学的挑战,并介绍了高维和复杂模型统计推断、半参理论、迁移学习、多来源数据融合,以及分布鲁棒学习等前沿理论方法。团队也在积极开展基于电子健康与生物样本库大数据的风险预测、药物安全性研究、多人群基因组学研究等方面的交叉应用研究,通过数学与医学的深度交叉,真正让AI成为可信的生物医学研究的发现工具及临床医疗决策的支持工具。
培训结束后,老师同学们纷纷围绕如何提升AI药物设计的准确率、如何缩小AI预测与临床验证间的差距以及软件平台试用等问题与讲者进行了深度互动。
基于学科需求的人工智能应用技术专题培训是2025年科技创新年“人工智能与医学发展”学科布局的重要举措,是响应2025年北京大学医学部教代会及工代会提案要求服务师生的创新实践,旨在基于学科需求推动AI技术与临床诊疗、医学研究的深度融合,助力“北大医学+AI”创新生态圈构建。培训工作将常态化开展,敬请持续关注!
医学部学科建设办公室
2025年9月16日