1、从视觉感知智能到视觉认知智能2019.10.31 成都2019年第七届输电技术年会提纲 OUTLINES1、人工智能产业生态2、视觉感知智能成为通用赋能工具与研究范式3、数据驱动的视觉感知智能面临的主要挑战4、探索结合数据与知识驱动的视觉认知智能提纲 OUTLINES1、人工智能产业生态2、视觉感知智能成为通用赋能工具与研究范式3、数据驱动的视觉感知智能面临的主要挑战4、探索结合数据与知识驱动的视觉认知智能涉及四个维度:大数据,大计算,算法和应用场景1、人工智能产业生态上游/基础层:大数据,AI芯片,AI基础算法,开源代码框架,AI基础设施(云-边-端,5G等)中游/技术层:视觉引擎,语音引擎
2、,知识引擎下游/应用层:AI+行业或行业+AI人工智能产业链划分:公开评测数据集:视觉物体检测、识别与分割-ImageNet,MS COCO,PASCAL VOC-2007/VOC-2012,Caltech-101,Caltech-256,CIFAR-10,CIFAR-100,MNIST,US-PS,SVHN等;人脸识别人脸识别-LFW,PubFig,MTFL,Caltech人脸数据库,FDDB,CelebA,CK+,FER-2013,JAFFE等;交通标识识别交通标识识别-GTSRB,TRoM等-开放的大数据资源:公开评测数据集是完备大数据,算法性能仅反映了深度神经网络本身达到甚至超过人类水
3、平的感知能力1、人工智能产业生态产业上游:开放的大数据资源大数据:真实条件下有标签的巨量数据其重要性如同原油一样,巨头企业视之为AI时代的战略资源!-落地应用中,开放环境下不存在完备大数据。对大多数长尾应用场景,需要使用尽可能多的高质量大数据(数据“暴力”)。1、人工智能产业生态产业上游:专有的大数据资源-离线训练;-基于云平台的在线推断应用;-基于边缘平台的在线推断应用;-终端在线推断应用产业上游:AI加速芯片1、人工智能产业生态-计算能力的大幅度提升,有力地推动新一轮人工智能的发展。大数据深度学习直接得益于计算“暴力”。算法:深度监督学习(如深度卷积神经网络,LSTM)产业上游:AI基础算
4、法1、人工智能产业生态 算法:深度强化学习 算法:对抗性神经网络 算法:图卷积神经网络,无监督学习深度学习的开源代码框架:-谷歌的TensorFlow;-Chollet的Keras;-Facebook的Pytorch;-微软的CNTK;-Amazon的MXNet;-加州伯克利的Caffe;-Bengio的Theano;-百度的PaddlePaddle;-华为的MindSpore产业上游:开源代码框架1、人工智能产业生态产业中游:视觉、语音、知识引擎/OS+1、人工智能产业生态平台核心技术渗透更多垂直应用领域:智能制造,智能安防,智能交通,智能物流,智能金融,智能医疗,智能教育,智能写作,无人零
5、售,智能家居,智能司法,智能农业,智慧城市,智能政务,智能流程自动化/RPA,5G,产业物联网,产业互联网,自动驾驶,智能机器人,无人自主系统,生命科学,AI产业生态:应用场景产业下游:AI+1、人工智能产业生态提纲 OUTLINES1、人工智能产业生态2、视觉感知智能成为通用赋能工具与研究范式3、数据驱动的视觉感知智能面临的主要挑战4、探索结合数据与知识驱动的视觉认知智能Deep Learning=Learning Hierachical Feature Representation自2013以来,大数据和大计算驱动的深度学习已成为计算机视觉、语音识别与合成、自然语言处理、大数据分析等的主流
6、方法以深度卷积神经网络为基础的新一代人工智能,确实带来了更加接近于人类的视听觉感知能力,带来了超越人类的棋类动态博弈能力传统方法深度学习方法2、视觉感知智能成为通用赋能工具与研究范式数据驱动方法已被视为继实验科学、理论模型、模拟仿真之后的第四科学研究范式!如同网络技术,已逐渐变革为一种通用赋能工具虽来源于计算机科学与技术,目前却已远远超越计算机科学与技虽来源于计算机科学与技术,目前却已远远超越计算机科学与技术的范畴术的范畴2、视觉感知智能成为通用赋能工具与研究范式数据智能成为一种有别于动物与人类感知智能的新物种!对特定细分问题,大计算、大数据驱动的数据智能,具有接近乃至超过动物与人类视听觉等感