当前位置:首页 > 报告详情

【蚂蚁】蚂蚁集团AI大规模存储加速实践.pdf

上传人: 张** 编号:153273 2024-01-15 20页 1.63MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了蚂蚁集团在AI大规模存储加速实践方面的探索和挑战。面临的问题包括:1)文件类型多,缓存加速需求不同;2)元数据规模急速增长;3)和训练混部时的性能问题。蚂蚁集团的解决方案包括:1)多类型+多语言API;2)自动预取优化;3)小文件折叠;4)基于联邦集群的元数据横向扩展;5)云原生存储;6)分布式预热系统和弹性决策系统。目前,蚂蚁缓存加速已支持多模态、NLP、传统机器学习、大数据离线处理等场景,文件数达130亿,存储量2.6PB。未来,蚂蚁集团将继续优化存储资源利用率,提高系统的自动弹性能力,支持更大规模的元数据管理,并适配训练混部场景下的性能需求。
"蚂蚁集团如何应对大规模存储加速问题?" "如何通过联邦集群和云原生技术提高存储效率?" "如何解决训练混部时的性能问题及长尾和毛刺问题?"
客服
商务合作
小程序
服务号
折叠