《InfoQ:知识图谱打破人工智能的认知天花板(23页).pdf》由会员分享,可在线阅读,更多相关《InfoQ:知识图谱打破人工智能的认知天花板(23页).pdf(23页珍藏版)》请在三个皮匠报告上搜索。
知识图谱的产业链结构总体看来,知识图谱上游产业涉及数据采集标注、云服务、硬件资源、数据库等支撑;中游从事知识图谱的设计与构建,包括提供用于知识图谱分析、应用的各类套件工具及解决方案;下游知识图谱主要与AI技术结合,深度应用于垂直领域。数据采集、标注旨在为构建知识图谱提供规范、丰富、持续更新的原始数据资源池。当前,数据采集标注仍属于劳动密集型领域,人力成本较高,采购第三方数据服务商完善前期数据库成为普遍选择。一般来说,京东众智、云测数据、文思海辉等数据服务商基于自研的可支持图片、语音、文本、视频、点云等多品类的智能标注平台,提供丰富的标注工具,并采用众包等方式,根据特定业务需要进行数据采集、清洗、标注,从而实现各类数据的一站式处理服务。此外,开放链接数据库也是构建知识图谱的重要数据来源,如 Freebase 、 Wikidata 、 Yage ,以及面向中文的开放域知识图谱社区项目 OpenKG ,都是直接获取结构化、半结构化数据的有效路径。在软硬件技术支持层面,云服务、硬件资源高度集中于云厂商、 IT 巨头。近年来,具备优质潜力的新玩家在图数据库领域集中涌现,包括费马科技 TuGraph 、欧若数网 Nebula Graph 、星环科技 StellarDB ,图数据库的云化成为主流发展方向。