1、 i 目录目录 引言 . 1 一、百度大脑进化到 5.0 . 2 二、基础层 . 3 2.1 算法 . 3 2.2 算力 . 5 2.3 数据 . 10 三、感知层 . 11 3.1 语音 . 11 3.2 视觉 . 13 3.3 增强现实/虚拟现实 . 17 四、认知层 . 19 4.1 知识图谱 . 20 4.2 自然语言处理 . 22 五、平台层 . 27 5.1 飞桨(PaddlePaddle)深度学习平台 . 28 5.2 UNIT 智能对话训练与服务平台 . 32 5.3 开放数据集 . 33 六、AI 安全 . 35 结语与展望 . 40 1 引言引言 回顾过去的一年,科技与商业
2、发展的一个关键词就是“人工智能”。在近一年的时间 里,百度科学家和工程师们不仅在人工智能算法、核心框架、芯片、计算平台、量子计算、 语音技术、计算机视觉、增强现实与虚拟现实、语言与知识、开放平台、开放数据等诸多 方面取得了令人瞩目的技术成果,还将这些技术成果与行业相结合,成功应用于众多产品 之中,取得了丰硕的人工智能应用成果。 2019 年 2 月,世界知识产权组织(World Intellectual Property Organization,简称 WIPO) 发布了首份技术趋势报告,聚焦人工智能领域专利申请及发展状况。报告显示,百度在深 度学习领域的专利申请量位居全球第二,超越 Alph
3、abet、微软、IBM 等企业和国外学术机 构,在全球企业中居于首位。 过去的一年,百度基础技术体系、智能云事业群组和 AI 技术平台体系进行了重大组织 机构调整,三个体系统一向集团 CTO 汇报,这为技术中台建设和人工智能技术落地提供了 良好的组织保障。 本报告总结了百度大脑在 2018-2019 年度取得的部分技术成果:第一章主要概述百度 大脑 5.0,第二至六章分别介绍百度大脑在基础层、感知层、认知层、平台层和安全方面 的技术成果。 面向未来,百度将继续打造领先的 AI 技术能力,构建更加繁荣的人工智能生态系统, 助力各行各业进入智能化的工业大生产阶段,在智能时代创造更广泛的社会经济价值
4、。 2 一、百度大脑进化到一、百度大脑进化到5.0 百度大脑是百度AI集大成者。百度大脑自2010年起开始积累基础能力,后逐步完善。 2016 年,百度大脑 1.0 完成了部分基础能力和核心技术对外开放;2017 年,2.0 版形成了 较为完整的技术体系,开放 60 多项 AI 能力;2018 年,3.0 版在“多模态深度语义理解” 上取得重大突破,同时开放 110 多项核心 AI 技术能力;2019 年,百度大脑升级为 5.0,核 心技术再获重大突破,实现了 AI 算法、计算架构与应用场景的创新融合,成为软硬件一体 的 AI 大生产平台。 如图 1 所示,百度大脑如今已形成了包括基础层、感知
5、层、认知层、平台层以及 AI 安 全五大核心架构在内的技术布局。同时,安全一直都贯穿 AI 技术研发的始终,已经融合在 百度大脑的所有模块中。基于数据、算法和算力强大的基础能力支持,百度大脑拥有包括 语音、视觉、增强现实(AR)/虚拟现实(VR)以及语言与知识等技术能力,并通过 AI 平 台对外开放,形成以百度大脑为核心的技术和产业生态。 多年来,百度大脑支持百度几乎所有业务,并面向行业和社会全方位开放,助力合作 伙伴和开发者,加速 AI 技术落地应用,赋能各行各业转型升级,其核心技术及开放平台荣 获 2018 年度中国电子学会科技进步一等奖。 图 1 百度大脑 3 二、二、基础层基础层 2.
6、1 算法算法 百度持续在算法和理论方面深入研究,在语音、图像、语言与知识等多个领域取得重 大突破。 在语音识别方面,百度将注意力机制的建模技术用于在线语音识别,提出了流式多层 截断注意力模型 SMLTA,实现了流式的基于注意力机制的声学语言一体化建模,并在 2019 年初实现了基于该技术的大规模产品上线,大幅提升了语音识别产品在线识别准确率和用 户体验,相对准确率提升 15%至 20%。该算法使用 CTC(Connectionist Temporal Classification)的尖峰信息对连续语音流进行截断,然后在每一个截断的语音小段上进行当 前建模单元的注意力建模。通过该方法把原来的全局