1、计算生物学深度产业报告COMPUTATIONAL BIOLOGYqbitai insdustry insights 量子位硬科技深度产业报告计算生物引言 感谢以下机构及相关从业者参与深度访谈(按照首字母排序):微软亚洲研究院、深势科技、黄晶教授(西湖大学)、西湖欧米、百图生科在计算生物学领域,最为代表性的事件即为AlphaFold2。2020年,AlphaFold2上所提交的预测结果与实验室测定结果间误差不超过一个原子精度,成为生物界的里程碑事件。据业内人士评价,这一水平已达到“可直接采用”水平。2021年,AlphaFold和Rosettafold双双开源。前者更是开源了其预测的98.5%人
2、类蛋白质结构数据。而此前,科学家们数十年的努力,只覆盖了人类蛋白质序列中17%的氨基酸碱基。然而,无论是从AlphaFold的角度,还是从计算生物学整体来看,现在我们还处于大航海时代的开端。由于无法体现真实的细胞和体液环境、难以体现蛋白质的翻译后修饰等问题,AlphaFold在蛋白质预测领域还有很大的进步空间。而对计算生物学而言,蛋白质结构预测问题还仅仅是海量问题之一。此外,由于需要面临计算复杂度和充分还原现实生物问题之间的矛盾,现有技术尚无法充分还原现实生物现象。在还原之后,也还有大量的医学设计和临床验证等工作需要完成。但我们也看到,随着精度提升,计算生物学正通过达到过往生物实验的通量与精度
3、创造价值。与此同时,AlphaFold2已经被用于新药靶点发现、修正过往生物假设、加速病毒研究等。无论是效率更高的AI制药、范围更广的疾病诊断、还是基因治疗、合成生物、脑机接口等调控治疗技术,乃至于最终的个性化诊治与保健,都离不开计算生物学所提供的更快更准的模拟计算与底层机制推演。在我们看来,其实不仅是AlphaFold本身,整个计算生物学领域的发展,已经进入了应用前夕。作为大量生物应用的底层学科,计算生物学未来的应用潜力和市场价值不可低估。在这份报告中,我们会阐述计算生物学对各类生物产业应用的推动效果,帮助读者在大潮到来之前,对计算生物学有更加清晰的认知。AlphaFold在CASP14的“
4、准确性”(GDT)均分达到92.4/100,此前数年的最优方案均在40/100徘徊AlphaFold的预测结果已基本达到实验精度,实现了“可直接采用”水平量子位硬科技深度产业报告计算生物目录 技术篇 价值篇04 科研相关价值 06 应用相关价值 产业篇12 行业发展阶段 13 行业发展关键趋势 14 商业化分析 16 未来产业链分析 18 国内外代表玩家21 驱动因素及发展瓶颈 量子位硬科技深度产业报告计算生物1.计算生物学是根据不同类型的生物数据来构建算法与模型,从而理解生物系统本身,并推进相关研究及应用的学科。鉴于传统的实验和分析手段已难以充分开发海量生物数据,且生物医药领域对跨学科,同时
5、兼顾多个细分领域的综合性工具未来有明确需求,计算生物学已成为生物领域的发展定势。2.计算生物学的价值可以分为科研相关和应用相关。目前主要集中在科研领域,以提升生物实验效率及精度,补充实验依据等为主要体现。应用领域国内最为突出的则是AI小分子制药。4.以商业化为核心,计算生物学的行业发展阶段可划分为三段:2025年前的基础积淀期,2025-2030年的普遍验证期,以及2030年后的全面发展期。场景完成变现、组学数据积累、软件平台增长、系统化复杂化成为重要趋势。5.目前计算生物行业同时涉及2B和2C的商业模式。主要为算法授权、生物资产和软件使用。我国目前主要为前两种。但鉴于软件平台和先锋项目能够形
6、成技术及业务迭代闭环,我们认为,在出现大量优势自研算法后,软件平台所占的比重将有明显上升。6.在计算生物学的底层支撑中,生物数据和AI模型具有特殊含义。智能实验室和特有算法成为关键。大多从业者以核心业务为定位。7.国内外计算生物学从业者在数量、发展程度、性质、布局场景上差异明显,约有5年差距。8.行业发展瓶颈包括底层生物机制及知识、统一的计算生物学软件及数据框架、消费级的数据获取、具体的工程能力、行业信任及数据隐私问题。关键结论4量子位硬科技深度产业报告计算生物技术篇计算生物学是根据不同类型的生物数据(如浓度、序列、图像等)来构建算法与模型,从而理解生物系统本身(如分子、细胞、组织、器官等),