当前位置:首页 > 报告详情

王浩宇-贝壳大数据质量保证实战‍.pdf

上传人: 2*** 编号:153853 2024-02-05 43页 3.45MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了贝壳大数据质量保证的实战经验。王浩宇,前贝壳找房资深测试开发工程师,分享了他在大数据质量保证方面的专业知识和实践经验。王浩宇曾负责搜狗和百度的搜索核心模块的质量保证工作,后在贝壳找房从事大数据和人工智能产品质量建设。 文章首先介绍了贝壳大数据的使用场景,包括To C和To B的业务,以及大数据智能产品的业务数据和埋点数据。然后,文章详细阐述了贝壳大数据的质量保证工作,包括批处理生产质量建设、报表查询质量建设和流式处理质量建设三个方面。 在批处理生产质量建设方面,王浩宇指出,数据质量评估标准应包括及时性、完整性、准确性和一致性。他提出了批量处理生产质量建设的问题分析,包括基础架构类问题和数仓类问题,并给出了解决思路和2.0版本的特性,如任务提交方式优化、健康检查、任务重试机制和数据量回调等。 在报表查询质量建设方面,王浩宇讨论了数据源的多样性和报表呈现的复杂性,提出了报表查询质量建设的关键点,包括数据源报告创建展示、数据对比链路监控平台化、自主配置数据地图一键生成等。 在流式处理质量建设方面,王浩宇强调了流式处理质量建设的及时性和容量要求,并提出了引流Diff测试的举措,以提升覆盖率和效率。 总之,王浩宇的分享为大数据质量保证工作提供了实用的方法和工具,对于提升数据质量和工作效率具有重要意义。
"贝壳大数据质量保证实战"如何提升效率? 贝壳报表查询质量建设中有哪些创新点? 贝壳流式处理质量建设与传统处理有何不同?
客服
商务合作
小程序
服务号
折叠