王天庆-贝壳找房-多租户下的算力分配和调度实践.pdf

编号:186912 PDF 35页 7.64MB 下载积分:VIP专享
下载报告请您先登录!

王天庆-贝壳找房-多租户下的算力分配和调度实践.pdf

1、探索多租户下的算力分配与调度优化落地实践演讲人:王天庆计算存储/容器引擎 技术负责人自我介绍高性能存储快速、可靠、大容量数据处理机器学习平台支持模型全生命周期管理云原生基础设施弹性、自动化、混合云架构主要负责的技术方向:贝壳找房容器引擎团队负责人,目前工作聚焦于云原生和AI基础设施的架构设计和建设实施,提供高效可靠的基础设施并帮助大模型在企业内部快速落地。王天庆01010202030304040505目录贝壳算力的发展与难题统一存储底座统一资源池调度大模型流量调度QA贝壳算力的发展与难点贝壳算力的发展统一资源池调度算力的分布形式组织壁垒混合多云跨地域成本意识算力资源四处分散如何进行高效管理?算

2、力供给分布发散导致的存储瓶颈如何缓解?如何对存量的算力吃干榨尽?统一存储底座统一资源池调度算力能否被调度?资源出借流量调度算力能否被精细化管理?算力架构的升级单机房单机房多集群多集群跨机房跨机房跨云跨云混合混合多云多云统一存储底座统一存储底座大模型数据流转训练数据集模型文件Checkpoint原始文件整个数据流转涉及到跨地域、跨云怎么办??跨云访问数据慢-加数据缓存跨云复制数据慢-跨区增加数据副本统一存储底座统一存储底座基础设施的变化训练任务多模态数据数据编排缓存加速目录隔离分布式跨地域高吞吐低延时高容量地域亲和混合云架构多级缓存加速对AI场景更友好低硬件成本 满足数据多种接入协议,支持模型训

3、练、多模态数据处理等。支持云原生、支持数据的动态编排和跨地域、地区的缓存加速。底层文件系统要保证高性能、高容量等。依赖便宜、高容量的对象存储作为最终的数据载体。统一存储底座统一存储底座基础设施的变化基于JuiceFS的能力,建立统一的跨地域文件系统底座,对于物理位置离数据中心比较远的算力中心,提供数据缓存、数据镜像的能力。数据持久化层统一存储底座统一存储底座-JuiceFS元数据引擎基础设施的变化AI算力机房-北京AI算力机房-天津腾讯云-北京区腾讯云-上海区读写副本读写副本QBServer读写副本读写副本读写副本读写副本读写副本读写副本云MYSQL云MYSQL云MYSQL云MYSQLOBPr

4、oxyOBProxyOBProxyQBServerQBServerQBServer云MYSQL租户A租户B云MYSQL云MYSQL云MYSQL云MYSQLOMS同步OMS同步DTS同步IDC腾讯云以腾讯云为例,数据写入同地域依赖于Oceanbase的多AZ的能力同地域依赖于Oceanbase的多AZ的能力统一存储底座统一存储底座-对象存储基础设施的变化KOS-ProxyKOS-Proxy协议代理层协议代理层该组件主要用于实现S3接口协议,该组件是完全无状态服务,元数据主要从KOS控制面中获取。KOS-CacheKOS-Cache数据缓存层数据缓存层该组件主要功能是从底层真实的对象存储中缓存数据

5、到本地磁盘中,并且可以分布式部署形成缓存集群来提高对象存储的吞吐能力。KOS-MetaKOS-Meta元数据层元数据层该组件主要对对象存储服务提供元数据能力,以OceanBase为底层元数据引擎,提供就近获取到对象存储元数据信息的能力。控制面桶权限管理复制管理控制台可观测性事件订阅生命周期管理Region-北京算力中心机房PodJuicsFS卷服务器Pod服务器IDC主机房Pod服务器Pod服务器KosCacheKos-proxyKos-proxyKos-proxyKOS-MetaCubeFS腾讯云COSRegion 上海算力中心机房Pod服务器Pod服务器IDC主机房Pod服务器Pod服务器

6、Kos-proxyKos-proxyKos-proxyKOS-Meta腾讯云COS腾讯云COS跨区同步Kos-syncer跨区复制KosCacheKosCacheKosCacheJuicsFS卷JuicsFS卷JuicsFS卷JuicsFS卷JuicsFS卷JuicsFS卷JuicsFS卷KosCacheKosCacheKosCacheKosCache统一存储底座统一存储底座-对象存储访问加速原理访问加速原理对于文件的读取,会优先判断文件是否在启用了数据缓存,如果存在缓存的话就会优先从缓存节点KOS-Cache读取数据,否则降级到远端的对象存储读取。数据一致性数据一致性所有归属于同一组的缓存节

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(王天庆-贝壳找房-多租户下的算力分配和调度实践.pdf)为本站 (learning) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
折叠