1、图数据库构建长城汽车数据一元化OneID数据底座长城汽车-产业数智化中心(IDC)陈晓 数据中台大数据工程师OneID项目中的图挖掘技术2CONTENTS目录图数据库在OneID项目中的应用1未来技术方向思考3图数据库在OneID项目中的应用Part1OneID实现数据一元化身份证号device id手机号bean id车架号车牌号驾照号微信号E-mail经纬度face id地址union idopen idcookie idsession idQQ号OneID用户标签 数据孤岛问题;例如:PC端、APP端、微信小程序、相关系统单元等.统一用户识别;用ID-mapping技术将多ID归一管理,
2、解决作为用户的唯一身份识别.图数据库本身就是基于事物关联关系的模型表达工具,与OneID的拉通数据的理念相契合;图数据库在解决大规模数据实体间复杂关系的查询问题上,具备天然优势,查询效率提升显著;图数据库过去10年增长趋势最快,验证了图数据库成为一种趋势;NebulaGraph 在处理超大数据集(千亿节点万亿条边)的查询上保持毫秒级查询延时.图数据库OneID平台架构数据源客户管理系统整车销售系统订单管理系统二手车系统售后系统APP系统埋点系统FlinkDatahubSparkHDFSMaxCompute技术层OneID数据平台数据加工智能分析应用层HologresNebulaRedis 线索
3、个人视图 活动精准邀约 内容智能推荐 来电客户视图 呼出客户视图 通话信息视图 到店客户视图 流失客户视图 线索评级 战败线索激活 车险客户精准邀约 车贷客户视图 内容智能推荐 车主个人视图 车主出行报告 车辆信息月报 会员个人视图 来电客户视图 进站客户视图 关怀客户视图 维修预约精确推送 二手车 赠换购ES数据融合复用实体和关系识别数据清洗去重数据规整标签加工数据管理客户360全生命周期ID-Mapping用户拉通多渠道多触点数据打通元数据管理全生命周期的精细化运营360统一用户视图行为标签人群划分自动化智能分析报表潜客集客保客dorisOneID标签图谱赋能用户增长和个性化运营APP微信
4、小程序官网车机门店呼叫中心社区数据采集数据打通用户全生命周期OneID图谱推荐引擎自动化运营用户运营有用再购/转介绍售后服务用车有利有趣意向有朋友拉新激活购车转化裂变兴趣增长运营各大推荐场景:首页个性化推荐 频道首页信息流推荐 相关推荐 搜索推荐 热门推荐 猜你喜欢 社交推荐 商品图谱推荐(精细化运营)(个性化运营)OneID赋能业务场景OneID为客服人员、销售顾问、运营人员,在流量、线索、场景等价值流转化上提供落地服务.知晓探索用车潜客(流量转化)集客(线索转化)保客(场景转化)价值流呼叫中心 来电弹屏页车辆查询页登录明细页用户增长模型页客服人员销售顾问运营人员OneID实现了用户360视
5、图,应该将OneID的建设经验和能力复用到车辆360、零部件360、供应商360上,为更多领域业务提供数据服务.OneID项目中的图挖掘技术Part2什么是图图就是二元关系,它利用一系列由线(称为边)或箭头(称为弧)连接的点(称为节点)提供了强大的视觉效果.图的本质是由二元关系组构成,实体-关系-实体模型:实体a实体b关系signsbelongs to图有多种形式:无向图、有向图加权、未加权同构、异构单边、多重边静态图、动态图OneID图库中不同形态的图形态各异的图网络:如何进行图建模左:欧氏空间中的图像右:非欧氏空间中的图CNN在非欧氏空间这里不适用.因此,不是所有的事情可以表示为序列或网格
6、。我们将如何应用神经网络?图像和拓扑图对比:如何进行图建模图表示:G=(V,E)邻域矩阵Aij:图卷积神经网络卷积层的基本传播规则:度矩阵D:V:Node featureE:Edge featureG图卷积的应用:基于不同的传播规则和采样技术:基于谱分解的方法:GCN、ChebNet、Spectral Network 基于空间结构的方法:GraphSAGE、GAT 还有基于递归运算和跳链接的其他传播模块Aij=1 If vi,vj E and ij 0 otherwiseDii=d(vi)图算法在OneID项目中的应用基础硬件CPUGPU(cuda)计算框架PytorchTensorflowP