1、封面页(待分享)卷首语 近年来,随着云计算技术的普及与深度应用,生命科学行业在基因科技、AI 辅助药物研发等方向取得了新的突破。特别是高性能计算(High Performance Computing)在辅助药物设计、研发、基因测序、产前筛查等具有明显的高数据量、大计算量的场景应用中扮演了十分重要的角色。2022 阿里云生命科学与智能计算峰会邀请了多位来自学术界、产业界的专家学者、创新企业高管等发表主题演讲、开展圆桌讨论,旨在探讨生命科学领域高性能计算技术的应用场景与发展方向,促进生命科学与云计算技术的深度融合与创新。此外,此次峰会还发布了天池大赛全球冷冻电镜蛋白质结构建模大赛的决赛结果。大赛由
2、阿里云与国家蛋白质科学中心(上海)在 2021 年共同发起,探索基于冷冻电镜在 AI 技术加持下获取蛋白质结构模型的潜力,吸引了全球近 2000 支队伍参赛,得到了广泛的关注。目录 阿里云大计算加速 HPC 与 AI 融合.5 多元科学计算系统在药物研发管线中的搭建与实践.20 AI+分子模拟,赋能药物发现新源头.34 AI 制药工业落地的痛点与前进方向.39 高通量基因测序在药物研发和靶向治疗中的应用.56 阿里云大计算加速 HPC 与 AI 融合 5 阿里云大计算加速 HPC 与 AI 融合 作者:何万青,阿里云高性能计算负责人 摘要:2022 年 8 月 5 日,2022 阿里云生命科学
3、与智能计算峰会在北京望京昆泰酒店举行,阿里云高性能计算负责人何万青博士,带来了题为阿里云大计算加速HPC 与 AI 融合的分享,以下是他的演讲内容整理,供阅览。阿里云高性能计算负责人何万青 人类历史上各种广谱药的发现,是一个漫长且靠运气的过程。新药的发现和制造往往需要十多年的时间,每年 FDA 能够批准上市的新药少之又少。阿里云大计算加速 HPC 与 AI 融合 6 而新冠的爆发带来了一个重要契机,我们通过整合云上计算资源,第一时间帮到科研机构开展新冠研究,从而发现了云计算具备的独特优势。据报道,世界上前 20 大药厂 70%的算力和研发都在往云上迁移。在新冠疫情爆发初期,阿里云第一时间免费开
4、放 AI 算力支持抗疫研发,支持科研人员围绕新冠病毒进行药物研究;其次,通过大数据进行公共医疗政策的研究,助力大数据系统、追踪系统以及决策系统;另外,向全世界开放阿里的科研抗疫平台,对接了来自 50 个国家&地的 33 个需求。阿里云大计算加速 HPC 与 AI 融合 7 而这个契机也让我们意识到,AI 是一种即将爆发的新的 IT 技术、新的计算平台。过去,高性能计算支持生命科学的发展,主要着力于科研和科研团队的培养,但并不明确会导向何种药物、何种结果。而现如今,此类需求非常明显,我们面对大量的数据库和化合物,需要对疾病和样本做分析、基因测序。过去的应用分为两大类:第一类是基于第一性原理的分子
5、动力学、量子色动力学等,比如分析细胞组成的分子之间的作用力、化合物之间的作用;第二类是面向精准治疗时的基因测序,同样需要非常大的算力,科学家需要解决的是机理和算法问题,但大规模的实现需要工程人员来解决,比如高通量测序。最近几年发展最快的是 AI 算法,通过 AI 对大量数据进行筛查。而此过程需要解决的问题有:如何将 AI 算法和技术放在云超算平台上?大量的数据如何在云上进行传输?总结来说,高性能计算在云上进行服务,需要解决以下线下超算的痛点:阿里云大计算加速 HPC 与 AI 融合 8 弹性扩展难:实际业务中,往往难以预测突发情况的需求,因此,弹性伸缩十分必要;可靠性不高:计算中心或物理集群规
6、模扩大之后,无法保证百分百的稳定性,因此必然会出现重新计算的需求,针对此需求,云计算稳定的 SLA 之外,还实现了断点续算技术;性能瓶颈:云上计算突破了海量数据进行机器学习或筛查的 GPU 瓶颈,过去花费数周数月才能够完成的计算,如今可缩短为几天;成本挑战:过去,成本和算力难以兼得,自建超算中心往往 CAPEX 不低,且后续运维成本 OPEX 更大,难以实现。阿里云大计算加速 HPC 与 AI 融合 9 借助云平台,科学家和科研人员能够专心于自己专业内的工作,聚焦于应用。而应用这一层,科研人员将它作为软件放至云上,让更多的科研人员实现科研合作和服务共享。阿里云最基本的能力是提供弹性的伸缩算力,