当前位置:首页 > 报告详情

MaxCompute半结构化数据思考与创新.pdf

上传人: 2*** 编号:149635 2023-12-18 19页 8.45MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了半结构化数据模型及其在MaxCompute中的思考与实践。半结构化数据是一种树状模型,具有多层级、嵌套结构,数据自包含schema,但schema灵活,没有强约束。典型的半结构化数据包括JSON和XML。半结构化数据的优势在于其结构灵活通用,适用场景广泛,且终端原始数据信息丰富。同时,生态完备,多平台协同。文章对比了Schema-on-Write和Schema-on-Read两种方式,指出Schema-on-Read在写入时不校验,读取时动态解析,适用于场景灵活的情况;而Schema-on-Write在写入时确定数据结构,性能更好,但数仓半结构化场景核心需求是高性能高效分析查询,低成本存储,免运维业务自由演进。最后,文章以MaxCompute和Hologres为例,说明了半结构化数据在存储性能和查询性能上的收益。
"半结构化数据如何优化存储性能?" "半结构化数据在查询性能上有何优势?" "如何实现半结构化数据的列存化?"
客服
商务合作
小程序
服务号
折叠