1、 1 11全体大会 2 圆桌论坛:人工智能产业的下一个十年整理:智源社区 常政、王炜强、贾伟2020 年 6 月 22 日晚,在第二届北京智源大会晚间圆桌论坛上,智源研究院四位理事单位的相关负责人“云上相聚”,围绕“人工智能产业的下一个十年这个主题发表了独到的见解,他们分别是:百度 CTO 王海峰、小米副总裁崔宝秋、旷视科技首席科学家孙剑、美团首席科学家夏华夏。智源研究院运营副院长刘江担任主持人。在圆桌讨论中,嘉宾们盘点了过去 10 年里 AI 产业中的重要进展,梳理了可能影响未来 10 年发展的几个重要变量,如小数据、AIoT、客户侧训练等,并结合自己在工业界的实践体会,对高校老师、学生们的
2、 AI 研究,提供了一些参考建议。下面,是嘉宾们的精彩观点摘要。图 1:上排从左至右:孙剑、刘江、崔宝秋下排从左至右:王海峰、夏华夏一、过去十年:人工智能从“实验”走向“实用”问题:回顾过去十年,你对 AI 产业印象最深刻的事情是什么?王海峰:如果总结一下过去 10 年,那便是人工智能真正从实验室走向实用、走向工业大生产的 10 年。百度做人工智能,首先是用 AI 来改造搜索引擎,并对它有一个全面的布局,包括语音技术、视觉技术、自然语言、知识图谱等。就我个人经历而言,我在百度已经工作了 10 年。记得我在 2010 年刚加入百度时,接手了一个机器翻译的项目,一年后上线。当时机器翻译虽然主要基于
3、统计和规则,还没有采用深度学习,但借助于互联网大数据和强大的计算平台,翻译系统仍旧实现了比较迅速的提升。2015 年,我们上线了首个基于神经网络的机器翻译系统,这使得翻译系统取得了突破性的进展,迄今为止这个系统已经实现了全球 200 种语言的互译,每天的翻译体量已经达到千亿字符。我从事机器翻译工作已有 20、30 年,这种现象在早些年是完全不可想象的,它已经真正实现了大规模产业化。孙剑:有两个 Moments 对我影响很大。第一个是于 2012 年,Hinton 和他的学生 Alex Krizhevsky 设计、推出了 AlexNet。对于 AlexNet 当时的训练结果,包括我在内的很多做计
4、算机视觉的人,都不太敢相信,怀疑可能是数据集出了什么问题。到了 2013 年,Google 宣布将它的深度学习放到 Google Photo(当时叫 Google Picasa)上,我便将自己的几百张单反照片传上去进行了检测,发现识别结果居然大多是正确的。这给了我非常大的震撼,之前我做过一些包括 Sparse Coding 等方法在内的非深度学习的图像识别,根本没有想到深度学习 3 居然会有这么好的效果。这颠覆了我对图像识别的认识,也让我萌生了非常大的信心,我就立刻组织了一支团队来加大这方面的研究。夏华夏:的确,这 10 年来人工智能的发展非常快。记得我 2013 年加入美团时,它还没有算法团
5、队,直到2013 年下半年才开始有了第一个与人工智能相关的项目用户画像,此项目希望通过对用户的理解来完成更好的用户推荐和搜索。现在七年过去了,人工智能几乎已经渗透进了美团的每一个业务中(现在约 200 多个),除了做推荐搜索,我们还做智能配送调度、人脸认证和识别、文字识别、智能语音交互、智能语音客服,以及无人车、无人机等等。这种变化真的让人非常兴奋。崔宝秋:我想补充一点的是,20 多年前当我还在读博士的时候,其实是很羞于讲自己是研究人工智能的。时至如今,尤其是 AlphaGo 问世之后,最大的一个改变就是大家都可以非常骄傲地讲“我做的是 AI”。刘江:之前孙剑、海峰都谈到了,过去 10 年 A
6、I 为什么兴起,最重要的就是深度学习。我们现在来看 Gartner的一个总结深度学习的时间线:图 2:深度学习发展时间线深度学习算法最早可以追溯到 1958 年、1986 年,但这波浪潮真正能起来,是 2010 年是 DeepMind 创立,以及 2011 年之后,如孙剑所谈到的,在 ImgNet 等比赛里突然有人用深度学习处理视觉、语音等产生了非常大的突破,包括之后一些深度学习框架、以及 GAN 的诞生等。当然了 Gartner 这张图还有很多真正内行的信息没有包容进去。我曾经跟崔宝秋交流过,他说印象最深的是 Google 实现让机器自己会识别猫了。这让我意识到,这次人工智能在公众视野中的全