1、数据驱动下的人工智能在医疗行业的应用实践 CHIMA 2019CHIMA 2019CHIMA 2019 1 2 3 3 4 目录Contents CHIMA 2019CHIMA 2019CHIMA 2019(1)计算机视觉(模式识别,图像处理)(2)自然语言理解与交流(语音识别、合成、对话)(3)认知与推理(各种物理和社会常识)(4)机器人学(机械、控制、设计、运动规划、任务规划等)(5)博弈与伦理(多代理人agents的交互、对抗与合作,机器人与社会融合等议题)。(6)机器学习(各种统计的建模、分析工具和计算的方法)人工智能的应用领域 CHIMA 2019CHIMA 2019CHIMA 20
2、19其一、它是一个完全自主的智能。感知、认知、推理、学习、和执行,其一、它是一个完全自主的智能。感知、认知、推理、学习、和执行,它都有。它都有。其二、它自己把这个事通过少量数据想清楚,没人教它。其二、它自己把这个事通过少量数据想清楚,没人教它。其三、乌鸦头有多大?不到人脑的其三、乌鸦头有多大?不到人脑的1%大小。大小。人脑功耗大约是人脑功耗大约是10-20瓦瓦,它就只有,它就只有0.1-0.2瓦,就实现功能,根本不需要核动力发电。瓦,就实现功能,根本不需要核动力发电。这给硬件芯片设计者也提出了这给硬件芯片设计者也提出了挑战和思路。视觉芯片挑战和思路。视觉芯片VPU,应该比后来的,应该比后来的G
3、PU更超前。更超前。一只乌鸦给我们的启示 CHIMA 2019CHIMA 2019CHIMA 2019其一、同样是在概率统计的框架下,当前的很多深度学其一、同样是在概率统计的框架下,当前的很多深度学习方法,属于一个被称作“大数据、小任务范式(习方法,属于一个被称作“大数据、小任务范式(big data for small task)”(走一步走一步)其二、人工智能的发展,需要进入一个“小数据、大任其二、人工智能的发展,需要进入一个“小数据、大任务范式(务范式(small data for big tasks)”吗)”吗?(看一步看一步)其三、假设前提是智能系统已经有了前面讲的基本的设其三、假设
4、前提是智能系统已经有了前面讲的基本的设置,这个系统设置置,这个系统设置是千万年进化是千万年进化得来得来的么,的么,是不是通过是不是通过大量数据了打磨(淘汰)出来的大量数据了打磨(淘汰)出来的?(想一步想一步)任务塑造智能任务塑造智能 CHIMA 2019CHIMA 2019CHIMA 2019 Part1 数据驱动的医疗人工智能数据驱动的医疗人工智能 CHIMA 2019CHIMA 2019CHIMA 2019医疗大数据迎来爆发式增长医疗大数据迎来爆发式增长 医疗行业在智能产业中占比显著,达30%医疗数据量每年以48%的速度增长,是增速最快的行业之一,从2009年到2020年医疗数据增长将达4
5、4倍 医疗行业在智能产业中占比高医疗行业在智能产业中占比高 医疗行业 其他行业 70%70%医疗大数据市场发展迅猛医疗大数据市场发展迅猛 2014-2018年我国的医疗大数据市场规模呈飞跃增长趋势 预计到2020年,中国医疗大数据应用市场规模将达到79.05亿元 6.06 9.4 13.1 19 32.1 49.6 79.05 0 0.2 0.4 0.6 0.8 0 20 40 60 80 100 2014 2015 2016 2017 2018 2019 2020 亿元RMB 2014年年-2018年医疗大数据市场规模、增长率及年医疗大数据市场规模、增长率及未来预测未来预测 市场规模 增长率
6、 资料来源:资料来源:IDC、贵阳大数据交易所、贵阳大数据交易所、NCG 30%30%CHIMA 2019CHIMA 2019CHIMA 2019Velocity 增长与处理速度快增长与处理速度快 医疗大数据每年以45%的速度增长;诊疗过程中,检查检验结果需第一时间呈现 Variety 数据结构多样数据结构多样 非结构化数据 结构化数据 医疗影像数据 Volume 数据体量巨大数据体量巨大 2018年全国诊疗人次达到84.2亿人次,产生诊疗数据30000TB 每个CT图像含有150M数据,每个标准病理图片接近5GB 人体基因组测序数据量超过100GB,转录组测序数量超过30GB Value 价