当前位置:首页 > 报告详情

Skyscanner 实现实用数据和人工智能治理的旅程.pdf

上传人: 张** 编号:167524 2024-06-15 62页 4.94MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
Skyscanner是一家全球领先的旅游和技术公司,每天连接数百万人与值得信赖的旅行提供商。公司使用分析数据优化业务和用户体验,运用机器学习模型对旅行选项进行排名和推荐,并通过AI搜索回答旅行者的问题,激发新的体验。数据是Skyscanner的核心动力。过去,数据治理工作像是救火,只修复了症状而未解决根本问题。面对复杂的数据管道、晚到的数据、不一致的数据质量和不满意的客户,公司采取了多项措施,如将所有数据落地到Bronze层,使用PySpark/Databricks进行数据转换,从Medallion层消费数据,实现了从ETL到ELT的转变。同时,公司通过简化数据技术栈、投资Medallion架构的改进等措施,促进了数据治理的规模化。此外,Skyscanner实施数据治理的策略包括明确数据的所有权、测量数据治理的采用情况、实施数据质量检查等,并通过Unity Catalog实现了数据的可发现性、数据域、血缘关系、访问控制等。在技术架构上,公司采用统一的数据存储基础设施,创建了UC目录,并使其与hive并存,实现了自我服务的域创建和数据访问。通过一系列的数据治理实践,Skyscanner提高了数据的可靠性和信任度,加速了智能决策的速度,推动数据和AI的飞轮转动。
"Skyscanner如何使用数据和AI治理实践?" "数据治理中,Skyscanner如何定义和识别关键业务数据?" "Skyscanner如何通过Unity Catalog优化数据架构和治理?"
客服
商务合作
小程序
服务号
折叠