《2025AI制药市场规模、产业链构成、应用现状及AI制药公司分析报告(27页).pdf》由会员分享,可在线阅读,更多相关《2025AI制药市场规模、产业链构成、应用现状及AI制药公司分析报告(27页).pdf(27页珍藏版)》请在三个皮匠报告上搜索。
1、 2025 年深度行业分析研究报告 1 AI 制药行业介绍制药行业介绍.4 1.1 AI 制药的发展历程制药的发展历程.4 1.2 市场规模市场规模.5 2 AI 制药的产业链构成与政策制药的产业链构成与政策.6 2.1 AI 制药的产业链构成制药的产业链构成.6 2.2 AI 制药相关政策制药相关政策.7 3 AI 制药技术原理制药技术原理.10 3.1 算力算力.10 3.2 数据数据.11 3.3 算法算法.12 4 AI 在制药行业中的应用在制药行业中的应用.13 4.1 AI 技术在药物发现中的应用技术在药物发现中的应用.14 4.1.1 靶点发现与验证靶点发现与验证.14 4.1.
2、2 药物分子的设计和优化药物分子的设计和优化.15 4.1.3 AI 辅助药物分子筛选辅助药物分子筛选.17 4.2 AI 技术在临床前研究中的应用技术在临床前研究中的应用.19 4.2.1 ADMET 预测预测.19 4.2.2 晶型预测晶型预测.19 5 AI 制药公司介绍制药公司介绍.20 5.1 薛定谔(薛定谔(Schrdinger).20 5.2 BenevolentAI.22 5.3 英矽智能(英矽智能(Insilico Medicine).23 5.4 晶泰科技(晶泰科技(XtalPi).25 图图 1.AI 制药发展历程制药发展历程.4 图图 2.AI 在药物研发中的投资动态(
3、单位:十亿美金)在药物研发中的投资动态(单位:十亿美金).5 图图 3.AI 药物研发初创公司相关数据药物研发初创公司相关数据.6 内容目录 图表目录 zXjVoOsNwOuNnQrP8OaObRsQoOnPqNfQnNtQfQpOoP8OrRzQwMnOtNNZtQxP 图图 4.2010-2021 制药公司管线分布情况制药公司管线分布情况.6 图图 5.AI 制药产业链分布制药产业链分布.7 图图 6.人工智能三要素人工智能三要素.10 图图 7.CPU、GPU 和和 TPU 的特性与用途的特性与用途.11 图图 8.主要主要 AI 生成模型框架示意生成模型框架示意.13 图图 9.AI
4、制药主要优化环节制药主要优化环节.13 图图 10.AI 技术通过三方面驱动靶点发现技术通过三方面驱动靶点发现.14 图图 11.简单简单 RNN 分子生成器的工作流程分子生成器的工作流程.15 图图 12.VAE 模型的核心架构模型的核心架构.16 图图 13.GAN 模型的核心架构模型的核心架构.16 图图 14.AAE 模型的核心架构模型的核心架构.17 图图 15.基于配体的虚拟筛选基于配体的虚拟筛选.17 图图 16.基于结构的虚拟筛选基于结构的虚拟筛选.18 图图 17.ADMET 预测流程预测流程.19 图图 18.晶型预测流程晶型预测流程.20 图图 19.Schrdinger
5、 公司管线情况公司管线情况.20 图图 20.Schrdinger 2019-2023 收入情况(单位:万美元)收入情况(单位:万美元).21 图图 21.BenevolentAI 公司管线情况公司管线情况.22 图图 22.英矽智能的核心技术平台英矽智能的核心技术平台 PHARMA.AI.23 图图 23.英矽智能公司管线情况英矽智能公司管线情况.24 图图 24.晶泰科技的小分子药物发现系统晶泰科技的小分子药物发现系统.26 图图 25.晶泰科技的晶泰科技的 AI 驱动的下一代抗体药物发现平台驱动的下一代抗体药物发现平台.26 图图 26.晶泰科技的药物固体形态研发平台晶泰科技的药物固体形
6、态研发平台.27 表表 1.国外国外 AI 制药相关政策制药相关政策.8 表表 2.国内国内 AI 制药相关宏观政策制药相关宏观政策.8 表表 3.上海市上海市 AI 制药相关政策制药相关政策.9 1 AI 制药行业介绍制药行业介绍 1.1 AI 制药的发展历程制药的发展历程 药物发现众所周知是一项昂贵、耗时且成功率低的过程。平均而言,开发一种新药的成本为 26 亿美元,并可能需要超过 10 年的时间。此外,从 I 期临床试验到药物上市的成功率低于 10%,令人望而却步。鉴于以上痛点,制药行业亟需改变传统的研发模式,而 AI 技术的引入正好为制药行业带来了全新的可能性。AI 凭借其强大的计算能
7、力、学习能力和数据处理能力,能够大幅提升药物研发的效率,降低研发成本,并有望提高成功率。从 1981 年被Discovery杂志首次报道以来,AI 应用于制药领域已经有超过 40年的历史。纵观 AI 制药的发展,可以分为 3 个时期:(1)1956 年-1980 年,该阶段是 AI 制药的雏形,许多理论和技术并未完善,仍处在积累当中。(2)1981 年-2011 年,计算机辅助药物设计(CADD)蓬勃发展,它大大加快了新药设计的速度,节省了创制新药工作的人力和物力,使药物学家能够以理论为指导,有目的地开发新药。(3)2012 年至今,AI 制药快速成长,资本投入加大,新公司相继成立,相关论文、
8、专利、技术等不断突破新高。图1.AI 制药发展历程 数据来源:deep pharma intelligence,财通证券研究所 1.2 市场规模市场规模 自 2015 年以来,人工智能驱动的制药公司投资率显著增长。根据 deep pharma intelligence 的估计,在过去9 年中,对 800家公司的年度投资总额增长了 27 倍,截至 2023 年 8 月,总额达到 603 亿美元。2021 年是增长最快的一年,达到 136.8亿美元,新冠疫情是这一快速增长的催化剂。然而,由于全球经济衰退等原因,2022 年 AI 在药物研发领域的投资未能延续之前几年的增长势头,2022 年的投资总
9、额为 102 亿美元,相比 2021 年的 136.8 亿美元有所下降。图2.AI 在药物研发中的投资动态(单位:十亿美金)数据来源:deep pharma intelligence,财通证券研究所 对全球 AI 药物研发初创公司在不同区域的分布情况进行分析,2023 年美国以 55.10%的公司占比遥遥领先,说明其在 AI 技术和药物研发领域的主导地位。这一优势得益于美国强大的科研基础、丰富的风险资本支持以及先进的生物技术生态系统。欧洲和英国分别占 19.90%和 9.95%,展现出它们在技术转化和政策支持方面的竞争力,尤其是欧盟的创新计划和英国的工业战略提供了强有力的支撑。亚洲虽然当前占比
10、相对较低,但中国等国家凭借政策引导和资本投入,正在快速崛起,未来可能在全球分布中占据更大比重。在融资金额分布中,美国占据了全球 AI 药物研发融资的绝对领先地位,其风险投资活跃度和市场规模为初创公司提供了坚实的支持。欧洲和英国尽管公司数量较少,但融资金额集中,表明资本主要流向少数具备技术突破或明确商业模式的企业。相比之下,亚洲地区增长速度较快。亚洲市场的快速崛起预示着这一地区将在未来的 AI 药物研发融资中扮演更重要的角色。010203040506070201220132014201520162017201820192020202120222023累计投资额年度投资额 图3.AI 药物研发初创
11、公司相关数据 数据来源:AI in drug discovery and its clinical relevanceQureshi,R.,Irfan,M.,Gondal,T.M.,Khan,S.,Wu,J.,Hadi,M.U.,Heymach,J.,Le,X.,Yan,H.&Alam,T.,财通证券研究所 从管线分布情况来看,AI 制药目前的增长趋势也非常明显。从 2010 年至 2021年,AI 制药公司展示出显著的管线增长趋势,年均增长率达到 36%,2018 年后的增长尤为明显。这一增长主要集中在药物发现和临床前研究的项目。截至 2021 年,这些管线包括约 160 个药物发现和临床前
12、研究项目,以及约 15 个处于临床开发阶段的项目,相比之下,前 20 大制药公司在同一时期内的内部管线规模更大,包括约 330 个药物发现和临床前研究以及约 430 个处于一期临床研究的项目。尽管2021 年以来 AI 制药公司的管线规模仅相当于前 20 大制药公司的 50%,但 AI 制药公司的快速增长趋势和专注于早期研发的特点凸显了其技术在制药领域的潜力和未来广阔的发展空间。图4.2010-2021 制药公司管线分布情况 数据来源:AI in small-molecule drug discovery:a coming wave?Jayatunga,M.K.P.,Xie,W.,Ruder,
13、L.,Schulze,U.&Meier,C.,财通证券研究所 注:a:AI 制药管线分布 b:TOP20 药企研发管线整体分布 2 AI 制药的产业链构成与政策制药的产业链构成与政策 2.1 AI 制药的产业链构成制药的产业链构成 AI 制药产业链上游涉及算力、算法和数据,主要分两大类:提供 AI 技术的企业和提供生物技术的企业。提供 AI 技术的企业中,辅助制药的人工智能硬件设 备包括服务器和芯片等。软件包括各类机器学习、深度学习以及其他人工智能算法,还有数据收集和处理平台、开源软件包以及云计算平台等辅助类软件。提供生物技术的企业包括提供 CRO 服务的企业和提供先进设备的企业。提供 CRO
14、 服务的企业为提供制药流程中不同阶段辅助服务的传统 CRO 企业。提供先进设备的企业,则拥有制造冷冻电镜、自动化实验室等设备的高端技术。AI 制药产业链中游是主体部分,主要分为四大类:AI+biotech、AI+CRO、AI+SaaS 以及 IT 头部企业在 AI 制药产业中的布局。AI+biotech:从药物本身的性质或治疗手段分类,从细分领域看,又可以分为三大类,即小分子药物、大分子药物、细胞和基因编辑疗法。AI+CRO:通过人工智能的辅助,为客户更好地交付先导化合物或者 PCC,再由药企进行后续的开发,或者合作推进药物管线。AI+SaaS:为客户提供 AI 辅助药物开发平台,通过平台为企
15、业赋能,帮助企业加速研发流程,节省成本与时间。IT 头部企业:借助对外投资、打造自有相关平台、提供算力及计算框架服务。AI制药产业链下游分为传统药企和CRO企业。传统药企主要通过自建团队、对外投资、CRO 及技术合作等方式进入 AI 制药赛道。传统 CRO 们主要通过风险投资、建立内部算法团队、采用外部 AI 技术、与 AI 制药公司进行合作等方式切入该领域。图5.AI 制药产业链分布 数据来源:智药局,财通证券研究所 2.2 AI 制药相关政策制药相关政策 尽管 AI 制药行业发展迅速,但相关的配套政策相对较少。由于 AI 技术的复杂性和涉及的伦理、法律等问题,政府和监管机构需要时间来理解和
16、评估其潜在 影响,以制定相应的政策和法规。美国、欧洲等国家及地区,行业起步较早,经过多年的发展及规划初版的监管政策于近年才推出。表1.国外 AI 制药相关政策 时间时间 部门部门 政策名称政策名称 主要内容主要内容 2023 年 5 月 美国 FDA Using Artificial Intelligence Machine Learning in the Development of Drug Biological Products-讨论文件 涵盖 AI 和 ML 的当前和潜在用途,包括药物发现、临床和非临床研究、上市后安全性监测和高级药品上市。2023 年 7 月 欧洲 EMA Refle
17、ction paper on the use of Artificial Intelligence(AI)in the medicinal product lifecycle-草案 概述在整个药品生命周期和基于风险的背景下使用AI/ML开发与生产药物的考量,并针对 AI/ML何时可以安全有效地开发、监管药物以及药物上市后使用等方面提供了建议。数据来源:FDA、EMA 官网,财通证券研究所 近年来,为了促进 AI 制药行业的发展,探索人工智能在新药研发方面的应用,我国同样陆续发布了许多相关政策。表2.国内 AI 制药相关宏观政策 时间 部门 政策名称 主要内容 2021 年 12 月 工业和信息
18、化部“十四五”医药工业发展规划 探索人工智能技术在研发领域的应用,通过对生物学数据挖掘分析、模拟计算,提升新靶点和新药物的发现效率。2022 年 5 月 国家发改委“十四五”生物经济发展规划 利用云计算、大数据、人工智能等信息技术,对治疗适应症与新靶点验证、临床前与临床试验、产品设计优化与产业化等新药研制过程进行全程监管,实现药物产业的精准化研制与规模化发展。2022 年 8 月 科技部等六部门 关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见 推动人工智能技术成为解决数学、化学、地学、材料、生物和空间科学等领域的重大科学问题的新范式,充分发挥人工智能技术在文献数据获取、实验预
19、测、结果分析等方面作用,重点围绕新药创制、基因研究、生物育种研发、新材料研发、深空深海等领域,以需求为牵引谋划人工智能技术应用场景,融合人工智能模型算法和领域数据知识,实现重大科学问题和发现的研究突破。2023 年 1 月 国家药监局 关于进一步加强中药科学监管促进中药传承创新发展的若干措施 推动医疗机构采用大数据、人工智能、真实世界研究等技术手段,围绕临床定位、适用人群、用法用量、疗程以及体现中药作用特点和优势的评价指标等对医疗机构中药制剂开展研究。发挥人用经验对医疗机构中药制剂的安全性、有效性的支持作用,支持将疗效确切、特色优势明显,不良反应少的医疗机构中药制剂品种向新药转化。数据来源:各
20、部委官网,财通证券研究所 随着国家政策的出台,各省市都紧跟国家政策的方向,因地制宜出台了各地的特色政策。以 AI 制药产业布局最为密集的上海为例:表3.上海市 AI 制药相关政策 时间时间 部门部门 政策名称政策名称 主要内容主要内容 2022年 7月 上海市人民政府办公厅 上海市数字经济发展“十四五”规划 加快人工智能制药布局,引导生物医药龙头企业和人工智能企业加强联合创新,围绕蛋白质结构预测、药物靶点寻找、药物分子设计,重点突破目标蛋白选取、静态蛋白结构测定、动态蛋白结构模拟、候选药物分子设计与合成等技术,提升药物研发效率。2022年 11月 上海市人民政府办公厅 上海市加快打造全球生物医
21、药研发经济和产业化高地的若干政策措施 瞄准合成生物学、基因编辑、干细胞与再生医学、细胞治疗与基因治疗、人工智能辅助药物设计等重点领域,布局若干市级科技重大专项和战略性新兴产业重大项目。支持以龙头企业联合高校、科研院所等建设若干市级工程研究中心,进一步强化产学研合作。2023年 6月 上海市科学技术委员会 上海市计算生物学创新发展行动计划(20232025 年)面向多尺度生物大数据解析的共性问题,发展生物医学大数据挖掘与解读的共性算法,开发面向跨尺度、多模态组学数据和真实人群多维组学数据的算法与模型,建立生物分子网络逆向工程模型和生物系统数字模型。发展人工智能助力的分子动力学和增强采样算法,开发
22、我国独立自主的大分子结构预测与设计的算法和软件,构建大分子结构解析及其互作的分析计算流程和预测模型,构建大分子工程 AI 设计平台,指导大分子改造实验和结构优化。发展 AI 药物研发的原创性算法、模型与计算平台,开发小分子药物大模型和生成算法,建立人工智能增强的抗体药物和肽类药物大模型与设计平台,发展中药复方药理药效预测模型,研发具有协同药效的现代复方。2023年 7月 上海市经济和信息化委员会、上海市药品监督管理局 上海市生物医药产业数字化转型实施方案(2023 年-2025年)围绕蛋白质结构预测与设计、药物靶点发现、药物分子及合成路线设计与优化、化合物虚拟筛选、晶型预测等场景,不断推进人工
23、智能技术深入赋能医药研发。支持干湿结合的多模态大模型等平台建设与运用,推进机器深度学习和生成式人工智能平台软件迭代升级,在难成药靶点、罕见病等复杂领域探索更大成药空间。在临床试验设计、患者招募、临床数据采集与分析等临床阶段加强数据分析建模等人工智能技术的应用,提升临床试验效率。2024年 7月 上海市人民政府办公厅 关于支持生物医药产业全链条创新发展的若干意见 充分利用生成式人工智能、深度学习等技术,聚焦新药靶点挖掘与验证、药物发现与设计、新型药物筛选、用药安全分析等环节,加快模型、算法、专业软件等攻关突破和共性平台建设,开展智能化场景应用示范。2024年 12月 上海市人民政府办公厅 上海市
24、发展医学人工智能工作方案 建设小分子创新药物筛选和优化平台,实现基于靶点动态结构的先导化合物发现、药效评估和老药新用等。建设大分子生物医药大模型干湿迭代设计平台,发展大模型与低通量湿实验一体自动化技术,实现蛋白质粒构建、表达、纯化、性能检测等低通量湿实验的全过程自动化,加速产品研发。推进人工智能技术在难成药靶点、罕见病、复杂疾病抗药性、创新药检验检测等复杂领域的应用。支持蛋白结构预测与从头设计、药靶预测、药物设计与智能优化、虚拟筛选、晶型剂量、器官芯片等关键技术研究。数据来源:上海市政府官网,财通证券研究所 大量政策的集中出台,充分反映了人工智能制药领域的快速发展和广阔前景。这些政策的发布体现
25、了对 AI 制药技术的高度关注和支持,为行业发展奠定了坚实基础,推动其在医药产业中持续深化应用 3 AI 制药技术原理制药技术原理 AI 组成的三大要素为:数据、算力和算法。AI 制药数据的来源,包括了公开数据集、商业数据集、与药企合作获得的研发数据、企业自身研发积累的数据集、挖掘数据集、实验数据库、物理模拟生成的数据等。算力方面,GPU、云计算资源等基础设施的完善,为 AI 制药企业提供了重要的计算支撑。算法方面,包括机器学习(Machine Learning,简称 ML)、深度学习(Deep Learning,简称 DL)等多种类别,在不同的领域中各有优势。图6.人工智能三要素 数据来源:
26、RaveyAI、财通证券研究所 3.1 算力算力 算力是 AI 驱动药物研发的重要支撑,其效率和性能直接影响药物筛选、分子模拟和数据分析的速度与准确性。人工智能中常用的算力有:CPU(Central Processing Unit):CPU 是计算机中的中央处理器,负责执行计算机程序的指令和逻辑运算。在人工智能中,CPU 常用于处理一般的计算任务和控制计算机系统的运行。本报告来源于三个皮匠报告站(),由用户Id:93117下载,文档Id:616941,下载日期:2025-03-12 GPU(Graphics Processing Unit):GPU 是专门用于图形处理的处理器,它具有高度并行的
27、计算能力。在人工智能中,GPU 被广泛应用于深度学习任务,因为深度学习模型中的矩阵运算和神经网络计算可以并行地在 GPU 上进行,提供了大幅加速计算的能力。TPU(Tensor Processing Unit):TPU 是由谷歌开发的专门用于加速机器学习任务的处理器。TPU 针对机器学习任务的需求进行了优化,特别适用于大规模和高效的张量计算,如神经网络的前向和反向传播。分布式计算:在一些需要处理大规模数据和复杂任务的场景中,人工智能系统可以利用分布式计算资源,将计算任务分配给多个计算节点进行并行处理。分布式计算可以提高计算效率和处理能力,加快训练和推理速度。云计算:云计算平台提供了弹性和可扩展
28、的计算资源,使用户可以按需获取所需的算力。通过云计算,人工智能开发者可以根据需求动态调整计算资源的规模和配置,以适应不同的任务和工作负载。图7.CPU、GPU 和 TPU 的特性与用途 数据来源:medium,财通证券研究所 3.2 数据数据 在当前的大数据时代,庞大的生物和临床数据为 AI 在医药研究领域的应用奠定了基础。尽管 AI 已经在药物研发过程的多个方面取得了成功和有效的应用,但医药数据的数量和质量已成为制约 AI 在药学中发展的主要阻碍之一。迄今为止,由全球的药物研究人员构建的包含详细和结构化大数据的药物数据库在促进AI 在医药研究中的应用方面起着关键作用。基于公开数据库在药物发现
29、不同阶段的应用和相关性,可将其分为 6 类:1)全面化学分子库,如 Enamine、PubChem 和 ChEMBL;2)药物/类药化合物库,如 DrugBank、AICD 和 e-Drug3D;3)收集药物靶标,包括基因组学和蛋白组学数据的数据库,如 BindingDB、Supertarget 和 Ligand Expo;4)存储通过筛选、代谢和功效研究获得的生物学数据的数据库,如 HMDB、TTD、WOMBAT 和PKPB_DB;5)药物毒性数据库,如 DrugMatrix、SIDER 和 LTKB 基准数据集;6)临床数据库,如 ClinicalTrials.gov、EORTC 和 Ph
30、armaGKB。非公开数据主要是各制药公司内部项目积累所得,此类数据的精度高,更适合用来做模型的训练和计算,但由于数据属于医药公司的核心资产,保密性强,极难获得。3.3 算法算法 与传统的计算机编程计算不同,机器学习和深度学习可以从输入数据中学习潜在的模式,而无需显式编程。它们不受输入数据格式的限制,可以包括文本、图像、声音等各种类型的数据(所有可以进行编码的数据类型)。类似于人类学习模式,ML 和 DL 可以逐渐识别数据的不同特征,推断其中的模式,并通过不断迭代更新模型参数,直到形成有效的模型。根据应用场景,模型可以分为回归模型和分类模型。分类和回归任务的区别主要在于输出变量的类型是连续还是
31、离散。根据解决问题所需的学习算法类型,模型可以概念化为三类:监督学习、无监督学习和强化学习。监督学习是一个基于标记数据的过程,通过训练模型来学习输入与预先确定的输出之间的关系,以预测未来输入的类别或连续变量。相比之下,无监督方法用于识别无标签数据集中的模式,并探索数据集的潜在结构,以便对数据进行进一步的聚类分析等。强化学习通过持续的交互式学习进行模型构建,依赖失败的惩罚或成功的奖励来指导模型的构建。AI 生成模型在全新药物设计领域具有巨大的优势,因为它们在生成分子时不需要先验的化学知识。这些模型可以在更广阔的未知化学空间中进行搜索,超越现有分子结构的限制,自动设计新的分子结构。在新药设计中,广
32、泛使用的深度生成模型包括基于循环神经网络(RNN)的生成模型、变分自编码器(VAE)和生成对抗网络(GAN)等。利用生成模型设计分子的过程具有高度的随机性,生成的分子在结构上呈现千变万化,质量也参差不齐。强化学习可以通过微调模型参数进行有针对性的优化,使生成的分子具备特定的药物分子特性。这种结合生成模型和强化学习的方法为全新药物设计提供了新的途径和可能性。图8.主要 AI 生成模型框架示意 数据来源:Deep generative molecular design reshapes drug discoveryZeng,X.,Wang,F.,Luo,Y.,Kang,S.,Tang,J.,Lig
33、htstone,F.C.,Fang,E.F.,Cornell,W.,Nussinov,R.&Cheng,F,财通证券研究所 4 AI 在制药行业中的应用在制药行业中的应用 目前来讲,AI 制药与传统的制药流程基本上是一致的,通常包括:药物发现、临床前研究、临床研究以及审批与上市四个阶段。其中,药物发现阶段主要涉及靶点发现及验证、先导化合物发现、药物从头设计等。而临床前研究阶段则以晶型预测、化合物验证为主,包括稳定性分析、安全性评价和 ADMET 分析等。目前,AI 主要在药物发现和临床前研究两个阶段发挥作用。图9.AI 制药主要优化环节 数据来源:pharnexcloud,财通证券研究所 4.
34、1 AI 技术在药物发现中的应用技术在药物发现中的应用 4.1.1 靶点发现与验证靶点发现与验证 药物靶点是指药物在生物体内的作用结合位点,包括基因位点、受体、酶、离子通道、核酸等。药物研发可通过研究疾病的发生机制、信号传导途径等过程,识别出疾病相关的靶点,进而通过干预靶点调控疾病的进程。能否找到创新性的药物靶点,将在很大程度上决定药物的创新性与可治愈疾病的范围。AI 通过学习组学数据、功能实验数据、文献、专利、临床报告等海量、多来源、甚至异构的数据,对比疾病与非疾病差异,分析 RNA 或/和蛋白质表达,找出潜在的信号通路、蛋白质相互作用等与疾病的相关性,输出机体细胞上药物能够发挥作用的候选受
35、体结合点(靶点)。药物靶点发现策略包括实验方法、多组学分析方法和 AI 计算方法。实验方法受限于通量和成本,而基于 AI 技术的多组学分析方法和 AI 计算方法能够高效、有效地发掘具有潜力成为药物靶点的分子。多组学分析方法整合生物学数据,揭示疾病关键靶点,而 AI 计算方法利用机器学习和数据挖掘技术筛选化合物库,加速药物靶点发现。这些方法在药物研究和开发中具有重要作用,并在未来发展中将变得更加关键。图10.AI 技术通过三方面驱动靶点发现 数据来源:AI-powered therapeutic target discoveryPun,F.W.,Ozerov,I.V.&Zhavoronkov,A
36、.,财通证券研究所 4.1.2 药物分子的设计和优化药物分子的设计和优化 药物设计的目标是开发出具有特定性质、符合特定标准的药物,包括疗效、安全性、合理的化学和生物特性以及结构的新颖性。近年来,利用深度生成模型和强化学习算法进行新药设计被认为是一种有效的药物发现方法。这种方法能够绕过传统基于经验的药物设计模式的限制,让计算机通过自主学习药物靶点和分子特征,以更快的速度和更低的成本生成符合特定要求的化合物。这种新方法为药物设计领域带来了更多的创新和可能性。简单生成模型:基于循环神经网络(简单生成模型:基于循环神经网络(RNN)的生成模型的先导化合物优化)的生成模型的先导化合物优化 基于 RNN
37、的生成模型药物在先导化合物的优化方面发挥着作用。Generative AI models for drug discovery中,研究者提出了一种名为“Scaffold-constrained molecular generation(SAMOA)”的新分子生成算法,用于解决先导化合物优化问题中的支架约束问题:使用 RNN 生成模型生成新分子的 SMILES 序列,然后使用精细采样程序实现支架约束并生成分子。此外,还应用了一种基于策略的强化学习算法来探索相关的化学空间,并生成与预期相匹配的新分子。图11.简单 RNN 分子生成器的工作流程 数据来源:Generative AI models f
38、or drug discoveryTang,B.,Ewalt,J.,&Ng,H.,财通证券研究所 进阶进阶 AI 生成模型:基于变分自动编码器(生成模型:基于变分自动编码器(VAE)的生成模型)的生成模型 VAE 已成为复杂数据分布的无监督学习最流行的方法之一。VAE 模型能够完成小分子的全新设计和肽序列的生成。VAE 有许多不同的变体,但其核心架构始终不变。VAE 的变体主要可以分为 SMILES-VAE、Graph-VAE 和 3Dgrid-VAE 三种类型。SMILES-VAE 是应用最为广泛,因为其容易实现,例如英矽智能构建的GENTRL 算法。尽管 GENTRL 生成的分子顺利通过实
39、验验证,但仍难以保证生成100%验证的 SMILES。Graph-VAE 和 3Dgrid-VAE 能够解决这些问题,由于 3D 结 构训练数据有限,目前商业化应用较少。3D 技术将对未来的 AIDD 项目具有巨大价值。图12.VAE 模型的核心架构 数据来源:Deep generative molecular design reshapes drug discoveryZeng,X.,Wang,F.,Luo,Y.,Kang,S.,Tang,J.,Lightstone,F.C.,Fang,E.F.,Cornell,W.,Nussinov,R.&Cheng,F.,财通证券研究所 进阶进阶 AI
40、生成模型:基于通用对抗性网络(生成模型:基于通用对抗性网络(GAN)的生成模型)的生成模型 GAN 主要由生成器和鉴别器组成,它们相互博弈,互相对抗,通过对抗生成高质量的数据。GAN 能够生成与真实数据分布相似的新样本,并能够使用网络来辨别网络,删除不需要的内容。在 AIDD 领域,GAN 通常与特征学习和强化学习等技术相结合,在蛋白质功能预测、小分子生成等方面发挥了重要作用。基于 GAN 已经构建多种分子生成模型,如 Mol-CycleGAN、ORGANIC、RANC。图13.GAN 模型的核心架构 数据来源:Generative AI models for drug discoveryTa
41、ng,B.,Ewalt,J.,&Ng,H.,财通证券研究所 进阶进阶 AI 生成模型:基于对抗性自动编码器(生成模型:基于对抗性自动编码器(AAE)的生成模型设计药物分子)的生成模型设计药物分子 AAE 在 VAE 基础上增加了判别模型,对采样分子和真实样本进行区分,基于对抗的思想训练生成模型和判别模型,扩展了分子的生成空间,一定程度上弥补了VAE 在生成分子时结构新颖性方面的缺陷。图14.AAE 模型的核心架构 数据来源:In Topics in medicinal chemistryTang,B.,Ewalt,J.,&Ng,H.,财通证券研究所 4.1.3 AI 辅助药物分子筛选辅助药物分
42、子筛选 基于配体的虚拟筛选基于配体的虚拟筛选 基于配体的虚拟筛选(Ligand-Based Virtual Screening,LBVS)是一种通过已知活性配体的化学结构和物理化学属性筛选潜在活性化合物的方法。该方法以化学相似性原则为基础,通过提取已知活性配体的分子描述符(例如分子指纹、分子形状和电荷分布等),对化合物库中的其他分子进行相似性匹配和预测,从而识别出可能具有高活性的候选化合物。LBVS 利用已知活性化合物的实验数据和经验,结合建模技术生成预测模型,从而无需依赖目标蛋白的结构信息即可进行筛选。这种方法广泛用于发现具有特定生物活性的化合物,并加速药物开发过程。图15.基于配体的虚拟筛
43、选 数据来源:Artificial intelligence to deep learning:machine intelligence approach for drug discoveryGupta,R.,Srivastava,D.,Sahu,M.,Tiwari,S.,Ambasta,R.K.&Kumar,P,财通证券研究所 基于基于结构结构的虚拟筛选的虚拟筛选 基于结构的虚拟筛选(Structure-Based Virtual Screening,SBVS)是一种基于目标蛋白三维结构信息筛选潜在活性化合物的方法。SBVS 通过对目标蛋白的结合位点进行建模,结合分子对接(molecular
44、 docking)技术预测化合物与靶点的结合能力。筛选过程中,利用目标蛋白的三维结构数据和化合物库中的分子进行对接模拟,从而计算化合物与靶点之间的结合能及结合模式,评估其作为先导化合物的潜力。SBVS 的核心步骤包括蛋白结合位点的识别、对接评分函数的优化以及结合能计算等。多种人工智能和机器学习技术被引入 SBVS 流程,例如深度神经网络(DNN)、支持向量机(SVM)和随机森林(RF),以提高对接评分的准确性并减少虚假阳性结果。此外,SBVS 能够通过模拟化合物与靶点的相互作用,预测参与结合的关键氨基酸残基,指导先导化合物的进一步优化和修饰。图16.基于结构的虚拟筛选 数据来源:Artific
45、ial intelligence to deep learning:machine intelligence approach for drug discoveryGupta,R.,Srivastava,D.,Sahu,M.,Tiwari,S.,Ambasta,R.K.&Kumar,P.,财通证券研究所 4.2 AI 技术在临床前研究中的应用技术在临床前研究中的应用 4.2.1 ADMET 预测预测 药物的吸收、分布、代谢、排泄和毒性(ADMET)是衡量药物有效性和安全性的重要指标之一。涵盖了药物能否被人体有效吸收、到达目标组织等药代动力学和毒理学问题。众多的临床试验失败归因于候选药物 ADM
46、ET 特性的缺陷,在药物研发早期进行 ADMET 性质评价研究,能够有效解决候选药物的安全性、有效性问题,提高药物研发成功率。然而,用于 ADMET 性质评价的实验方法昂贵而耗时,限制了人们对早期活性化合物的理解,也影响了进一步的生物验证。随着计算机技术和化学信息学的发展,药物实验数据不断积累,以机器学习、深度学习为代表的 ADMET 预测模型可以提取化合物相关结构特征,评估多个ADMET 参数间的关系和趋势,有效提升 ADMET 性质预测的准确性。具体来说,这些模型利用药物分子的结构、电荷、溶解度、亲水性、脂溶性、代谢途径等特征作为输入数据,同时也考虑药物与蛋白质的相互作用、药物的代谢途径等
47、因素对 ADMET 的影响,最终输出药物的 ADMET 预测结果。图17.ADMET 预测流程 数据来源:Receptor.AI 官网,财通证券研究所 4.2.2 晶型预测晶型预测 晶型预测是对目标分子及其他可选组分在指定晶体空间进行全局搜索,预测该空间内热力学稳定的晶体结构(包括实验结构)及其稳定性排序。AI 通过结合物理模型和机器学习算法,可以更准确地预测晶体结构。其主要应用场景包括:晶体结构比对,确定实验晶体能量排序;转晶风险评估;指导实验制备新晶型以及药物发现早期晶型性质(溶解度、晶习、力学性质等)预测等。图18.晶型预测流程 数据来源:晶泰科技官网,财通证券研究所 5 AI 制药公司
48、介绍制药公司介绍 5.1 薛定谔(薛定谔(Schrdinger)薛定谔公司(Schrdinger)成立于 1990 年,是一家专注于开发和应用先进计算平台的企业,旨在加速药物发现和材料科学研究。其核心技术基于物理学原理,结合人工智能(AI)和机器学习,为制药、生物技术和材料科学领域的客户提供高精度的分子模拟和预测工具。薛定谔目前的主要项目涵盖多个领域,包括肿瘤学、免疫学和神经学,显示出其在新药研发中的全面布局。薛定谔的自主研发管线中,SGR-1505 是一种针对MALT1(黏膜相关淋巴组织淋巴瘤转位蛋白 1)的抑制剂,主要用于治疗血液系统恶性肿瘤,目前已进入临床研究阶段。SGR-2921 则是
49、一种针对 CDC7(细胞分裂周期 7 相关蛋白激酶)的抑制剂,目标适应症为急性髓系白血病(AML)和骨髓增生异常综合征(MDS),同样已推进至临床阶段。此外,SGR-3515(Wee1/Myt1抑制剂)主要针对实体瘤,正处于临床前研究阶段,展现了对难治性癌症治疗的潜力。除了临床阶段的药物,薛定谔还在肿瘤学领域布局了多个靶点,如 SOS1 和PRMT5-MTA,以及针对 EGFR C797S 突变的靶向疗法,处于药物发现阶段。在免疫学领域,薛定谔正在开发针对 NLRP3 的免疫调节剂;在神经学领域,则推进了与 LRRK2 相关的项目,这些靶点均为其创新研发提供了广阔前景。图19.Schrding
50、er 公司管线情况 数据来源:Schrdinger 公司官网,财通证券研究所 薛定谔的研发不仅限于自研管线,还通过与大型制药公司的合作进一步巩固其行业地位。例如,2024 年 11 月,薛定谔宣布与诺华公司(Novartis)达成重大合作,推进多个候选药物进入诺华的投资组合,并签署了一项为期三年的软件协议,扩展诺华对其计算预测建模技术的使用。根据协议,薛定谔获得 1.5 亿美元的预付款,并有资格获得高达 22.7 亿美元的里程碑付款和版税。此外,薛定谔与礼来公司(Eli Lilly)的合作也备受瞩目,双方签署了一项价值 4.25 亿美元的协议,共同开发针对指定靶点的小分子化合物。2019 年至
51、 2023 年,薛定谔公司的总收入从 8550 万美元增长至 2 亿 1670 万美元,其中软件业务收入从 2390 万美元增长至 1 亿 5910 万美元,年均增长率超过 20%。软件业务作为收入的核心驱动,持续扩大在总收入中的比重。尤其是 2022年和 2023 年,软件业务收入分别达到 1.40 亿美元和 1.59 亿美元,展现出市场需求的强劲增长和公司技术的竞争力。图20.Schrdinger 2019-2023 收入情况(单位:万美元)数据来源:wind,财通证券研究所 5.2 BenevolentAI BenevolentAI 是一家领先的人工智能药物发现公司,致力于将 AI 技术
52、与生物制药开发相结合,加速新药的发现和开发。公司总部位于英国伦敦,在剑桥设有湿实验室。其核心技术平台 Benevolent Platform整合了多种数据类型和 AI 模型,旨在揭示新的生物学机制,预测新的药物靶点,并开发首创或最佳疗法,特别针对复杂疾病。公司研发管线覆盖多个治疗领域。自主研发的 BEN-8744 是一种用于治疗溃疡性结肠炎的 PDE10 抑制剂,目前已进入 I 期临床研究,并在健康志愿者中展示了良好的安全性和药代动力学特性。针对肌萎缩性侧索硬化症(ALS)的 RAR抑制剂 BEN-34712 和 CHK1 抑制剂 BEN-28010(用于治疗胶质母细胞瘤及其他实体瘤)均处于临
53、床前开发阶段。此外,公司还在开发针对帕金森病、纤维化、慢性肾病、心力衰竭及系统性红斑狼疮等疾病的新型靶点药物。BenevolentAI 与多家大型制药公司建立了战略合作伙伴关系。2023 年 9 月,公司与默克(Merck)签署合作协议,利用其端到端 AI 平台协助默克完成从靶点识别到临床前阶段的药物发现工作。此外,与阿斯利康(AstraZeneca)的合作集中于慢性肾病、心力衰竭和系统性红斑狼疮领域,充分利用 AI 技术推动药物研发进程。图21.BenevolentAI 公司管线情况 0%5%10%15%20%25%30%35%02000400060008000100001200014000
54、160001800020192020202120222023软件业务收入其他收入总收入同比增长 数据来源:BenevolentAI 公司官网,财通证券研究所 5.3 英矽智能(英矽智能(Insilico Medicine)英矽智能(Insilico Medicine)是一家领先的人工智能驱动药物研发公司,成立于 2014 年,总部位于中国香港,并在多个国家和地区设有分支机构。英矽智能的核心技术平台 PHARMA.AI 由 PandaOmics、Chemistry42 和InClinico 三部分组成,这三大模块覆盖了药物研发的关键阶段,充分整合人工智能技术,显著提升了研发效率和成功率。Pand
55、aOmics 专注于发现和优先化新型靶点,是一个基于多组学分析的深度生物学引擎。通过分析基因组、转录组和蛋白组等多组学数据,PandaOmics 能够快速筛选和优先化潜在的疾病靶点,显著缩短传统靶点发现所需的时间,同时帮助识别疾病关键驱动因子,为精确治疗策略的制定提供支持。Chemistry42 则是一个生成性人工智能驱动平台,专注于从头药物设计和优化小分子。通过机器学习技术,Chemistry42 可以生成具有高新颖性、合成可行性、亲和性和代谢稳定性的新型药物分子,为化合物筛选和优化带来了革命性的效率提升。此外,该平台的可扩展分子工程解决方案还支持药物分子的多维度优化,助力发现更高质量的先导
56、分子。InClinico 平台则聚焦于临床试验的设计和预测。通过分析历史数据和利用人工智能模型,InClinico 能够预测临床试验的成功率,识别试验设计中的薄弱环节,并采用行业最佳实践优化试验方案。这一平台在帮助制药公司和研究机构减少试验失败风险、优化资源配置以及加速临床试验推进方面发挥了重要作用。图22.英矽智能的核心技术平台 PHARMA.AI 数据来源:英矽智能公司官网,财通证券研究所 目前,英矽智能拥有 31 个正在进行的研发项目,涵盖纤维化疾病、肿瘤和免疫相关疾病等多个治疗领域。从 2021 年至今,公司共提名了 21 个临床前候选药物,其中 2022 年提名了 9 个候选药物,充
57、分展示了其靶点发现与验证的能力和效率。同时,公司已有 10 条管线获得 IND 批准。在纤维化疾病领域,以 TNIK 为靶点的候选药物已进入全球多国的临床阶段,尤其是针对特发性肺纤维化(IPF)的吸入疗法表现出了良好的安全性和有效性。在肿瘤治疗方面,英矽智能的研发管线覆盖了 BRCA 突变癌症、实体瘤和免疫肿瘤领域,部分项目已进入临床开发阶段或与国际合作伙伴展开联合开发。同时,公司在免疫相关疾病如炎症性肠病(IBD)和贫血领域的研发中,也展示了创新分子设计和治疗策略的显著潜力。图23.英矽智能公司管线情况 数据来源:英矽智能公司官网,财通证券研究所 5.4 晶泰科技晶泰科技(XtalPi)晶泰
58、科技(XtalPi)是一家以人工智能驱动药物研发的全球化企业,致力于将量子物理、高性能计算和自动化实验技术与人工智能相结合,推动从小分子药物、抗体药物到固体药物晶型的全流程创新。在小分子药物研发领域,晶泰科技构建了 ID4(Intelligent Digital Drug Discovery and Development)系统,整合了 AI 药物发现平台 ID4Idea、高精度计算化学平台 ID4Gibbs和智能制药平台 ID4Inno。通过 ID4 系统,公司能够运用超过 200 个 AI 模型实现小分子化合物的设计与优化,预测药物与靶点之间的活性作用,并借助闭环数据反馈和实验室自动化技术
59、优化药物研发流程。图24.晶泰科技的小分子药物发现系统 数据来源:晶泰科技公司官网,财通证券研究所 在抗体药物开发方面,晶泰科技推出了 XupremAb平台,这是一个 AI 驱动的抗体药物发现系统,涵盖免疫交互分析、抗体筛选、从头设计以及双抗和 ADC设计等功能模块。XupremAb平台结合了多个子平台的能力,从免疫点筛选到候选抗体开发的全流程均由 AI 赋能,大幅提高了抗体药物开发的效率与成功率。图25.晶泰科技的 AI 驱动的下一代抗体药物发现平台 数据来源:晶泰科技公司官网,财通证券研究所 在固体药物晶型研究方面,晶泰科技开发了 XtalGazer平台,为药物晶型的优化与研究提供了一站式解决方案。该平台通过智能结晶技术和晶体结构解析工具(如 SCXRD 与 MicroED),结合晶型预测与毒理临床研究,提升药物晶型的稳定性和筛选效率,同时加速药物开发决策。图26.晶泰科技的药物固体形态研发平台 数据来源:晶泰科技公司官网,财通证券研究所