1、空白演示空白演示单击输入您的封面副标题演讲人王尚广(北京邮电大学)面向分布式机器学习的边缘网络协同技术面向分布式机器学习的边缘网络协同技术研究背景研究背景n 网络承载 AI 应用剧增网络承载 AI 应用剧增:全球数据总量不断持续增长,预计2020年达到47ZB,2025年达到163ZB,年复合增长率为20%20%,分布式机器学习产生的数据进一步加剧了增长n 网络传送带宽压力巨大网络传送带宽压力巨大:全球数据中心网络安装服务器数量年增长仅约 4%4%迫切需要对面向大规模分布式人工智能应用的网络技术展开研究!迫切需要对面向大规模分布式人工智能应用的网络技术展开研究!n 网络与通信技术已成为世界大国
2、博弈的焦点网络与通信技术已成为世界大国博弈的焦点n AI在网络中的大规模应用导致竞争进一步加剧AI在网络中的大规模应用导致竞争进一步加剧研究背景研究背景n 面向大规模分布式人工智能应用的网络技术国内外研究现状面向大规模分布式人工智能应用的网络技术国内外研究现状 分布式机器学习算法框架:谷歌(TensorFlow)、微众(FATE)、CMU等 边缘计算与网络资源协同:微软、阿里巴巴、CMU、北邮等 数据中心网络与智能网卡:迈络思(智能网卡)、浪潮、阿里、微软等位置相对集中网络相对封闭数据直接处理资源相对同构边缘网络跨域传输异构计算隐私保护位置碎片分布跨域传输频繁加密数据剧增资源异构多样网络资源、
3、存储资源、计算资源如CPU、GPU、FPGA等金融、社交、银行、医疗、政务等敏感数据大规模分布式人工智能应用导致跨广域网数据传输需求剧增5G、车联网、AR/VR等应用需要边缘数据中心广泛分布式部署过去现状过去现状()()()()研究背景研究背景n 面向大规模分布式人工智能应用的网络技术面临的挑战面向大规模分布式人工智能应用的网络技术面临的挑战位置碎片分布跨域传输频繁加密数据剧增资源异构多样加密导致数据量激增,传输压力增大模型同步引发海量数据传输压力剧增CPU+GPU+FPGA混合异构环境调度复杂跨域计算与网络资源协同困难,造成瓶颈AI应用与网络拓扑缺乏感知严重制约网络传输效率挑战一:数据隐私与
4、通信效率难兼顾挑战一:数据隐私与通信效率难兼顾挑战二:跨域计算资源与网络资源难协同挑战二:跨域计算资源与网络资源难协同挑战三:数据处理能力与网络传输效率难提升挑战三:数据处理能力与网络传输效率难提升研究背景研究背景n 国家重点研发计划项目国家重点研发计划项目面向大规模分布式人工智能应用的关键网络技术研究面向大规模分布式人工智能应用的关键网络技术研究挑战一:数据隐私与通信效率难兼顾挑战一:数据隐私与通信效率难兼顾挑战二:跨域计算资源与网络资源难协同挑战二:跨域计算资源与网络资源难协同挑战三:数据处理能力与网络传输效率难提升挑战三:数据处理能力与网络传输效率难提升研究背景研究背景n 国家重点研发计
5、划项目国家重点研发计划项目内容五:分布式机器学习加速技术与实验验证内容五:分布式机器学习加速技术与实验验证内容一:面向网络感知的大规模分布式机器学习机理内容一:面向网络感知的大规模分布式机器学习机理内容四:意图驱动的路由控制与负载均衡内容四:意图驱动的路由控制与负载均衡内容三:跨域网络的低时延传输技术内容三:跨域网络的低时延传输技术算力感知 网络传输能力支撑网络能力保障机器学习能力加速算力感知 网络传输能力支撑网络能力保障机器学习能力加速AI应用底层资源服务化AI应用底层资源服务化网络感知网络感知 AI需求感知 算力供应AI需求感知 算力供应新新准准快快稳稳狠狠内容二:面向分布式机器学习的边缘
6、网络协同技术内容二:面向分布式机器学习的边缘网络协同技术研究内容研究内容面向分布式机器学习的边缘网络协同技术:基于服务计算理论与方法将算力进行封装与抽象,面向分布式机器学习的边缘网络协同技术:基于服务计算理论与方法将算力进行封装与抽象,通过算力发现、构建算力路由和拓扑,实现算力共享与高效协同通过算力发现、构建算力路由和拓扑,实现算力共享与高效协同,解决边缘网络能力不足、算力有限、协同缺乏导致的分布式机器学习效率低下问题,解决边缘网络能力不足、算力有限、协同缺乏导致的分布式机器学习效率低下问题跨广域网的分布式边缘智能网络跨广域网的分布式边缘智能网络协同协同分布式机器学习的资源联合优化分布式机器学