当前位置:首页 > 报告详情

Nubank 如何利用 Unity Catalog 改善治理、安全性和用户体验.pdf

上传人: Fl****zo 编号:718708 2025-06-22 25页 774.71KB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文介绍了数字金融服务平台Nubank如何通过使用Databricks的Unity Catalog改善数据治理安全性和用户体验。关键点如下: 1. **Nubank概况**:Nubank是拉美最大的金融机构之一,服务超过1.18亿客户,自2016年起使用Databricks作为核心数据工具。 2. **数据使用**:每月有3,900活跃用户,创建25,000个笔记本和120,000张表,执行50,000个作业。 3. **数据治理挑战**:在采用Unity Catalog之前,主要使用Hive Metastore,面临个人信息的控制限制等问题。 4. **Unity Catalog特点**:提供多目录、成本跟踪、审计日志和血统功能,以及强大的API支持。 5. **迁移影响**:Nubank执行了大量迁移,涉及7000用户,迁移了2K集群、1.1M张表和50PB数据。 6. **用户体验和技术变化**:用户负责权限管理,引入Spark Connect和Volumes作为主要接口。 7. **挑战和学习**:代码迁移中遇到Scala不兼容问题,强调了了解环境以避免惊喜的重要性。 8. **Unity Catalog的日常价值**:实现资源访问的团队级别定义,提高用户自主管理资产的能力,简化存储管理,符合行业标准和监管要求。 核心数据引用: - 3,900月活跃用户 - 25,000月笔记本创建 - 120,000月表创建 - 50,000月作业执行 - 2K集群创建 - 1.1M表迁移 - 50PB数据迁移 - 7000用户受影响 - 4000笔记本需迁移
"Nubank如何提升数据治理安全?" "Unity Catalog怎样优化用户体验?" "迁移至Unity Catalog的难点与挑战?"
客服
商务合作
小程序
服务号
折叠