当前位置:首页 > 报告详情

3-3 分子与自然语言之间的翻译.pdf

上传人: 云闲 编号:102288 2021-01-01 53页 9.43MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了分子与自然语言之间的翻译问题。首先,作者指出每年有超过500,000篇论文在PubMed上发表,而2016年就有超过120万篇新论文,使得论文总数超过2600万篇。然而,人类的阅读能力几乎保持不变,平均每年只能阅读264篇论文。因此,如何有效地处理和理解这些大量的科学文献成为一个重要问题。 作者提出了一种基于多模态定义的实体表示方法,将分子以2D图像、基于文本的分子描述符、化学图结构、自然语言定义和描述以及外部数据库中的结构化属性等多种方式进行表示。此外,作者还提出了一种基于生成对抗网络的数据增强和远程监督方法,以及一种基于图神经网络的联合实体/关系/事件提取和本体构建方法。 在分子描述方面,作者提出了一种基于图神经网络的分子编码方法,该方法可以保留化学反应等价性,即在分子嵌入空间中保持物理量(如质量、能量、电荷等)的等价性。此外,作者还提出了一种基于多模态预训练的方法,将分子与自然语言进行转换,以帮助加速药物发现等过程。 总的来说,本文提出了一系列方法,旨在将无结构的科学数据转换为结构化的知识,以帮助科学家更有效地处理和理解大量的科学文献。
如何将分子与自然语言相互转换? 分子描述面临哪些挑战? 如何利用外部知识增强抽象语义表示?
客服
商务合作
小程序
服务号
折叠