《4.AliGraph(24页).pdf》由会员分享,可在线阅读,更多相关《4.AliGraph(24页).pdf(24页珍藏版)》请在三个皮匠报告上搜索。
1、AliGraphAliGraph:大规模图神经网络平台李永(九丰)阿里巴巴资深技术专家计算平台事业部PAIPAI机器学习平台介绍https:/ G=(V,(V,E)E)同构图异构图有向图无向图V=VertexE=Edge常见的图计算离线图处理Pregel,PowerGraph,Spark GraphX图数据库Neo4J,Titan实时图分析查询Aliyun GraphCompute,Amazon Neptune图+深度学习=图神经网络非规则化的数据Graph Embedding图神经网络的应用领域社交领域推荐领域知识图谱生命科学反作弊线上支付GNNGNN的应用 分类GNNGNN的应用 关系预测
2、GNNGNN大规模应用的四大挑战规模庞大点边异构属性丰富动态变化数百亿甚至数千亿点,数千亿甚至数万亿的边同构、异构、多边、多属性点属性,边属性节点、边的增删更新AliGraphAliGraph:大规模GNNGNN平台采样&建模&训练一体化的GNNGNN平台AliGraphAliGraph系统架构AliGraphAliGraph编程范式AliGraphAliGraph编程范式samplesampleaggregateaggregatecombinecombineAliGraphAliGraph五大特点大规模图存储分布式采样稀疏内核优化自创SGCN线性扩展基于内存的图存储分布式的图存储支持百亿点的规模,可伸缩基于Vertex Cut的分片Worker基于出入度的缓存优化缓存效果缓存加速:比随机方法快40%-50%,比LRU方法快50%-60%缓存加速:比随机方法快40%-50%,比LRU方法快50%-60%分布式采样支持丰富的采样策略支持多跳的采样功能毫秒级的采样性能模块化的采样设计本地/全局的负采样稀疏内核优化加速原始版本GCN达3x!自创SGCNSGCN分布式扩展去中心化Distribute Negative Sampling多机异步训练AliGraphAliGraph APIAPI以点为中心边表混合采样&建模&训练一体