当前位置:首页 > 报告详情

ZOMI酱-多模态大模型加速算法与开发实践.pdf

上传人: le****ng 编号:186897 2024-12-17 26页 5.07MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了通明湖人工智能开发与应用大会上的多模态大模型加速算法与开发实践。文章提到了业界主要的视频生成模型,如Sora、海螺AI、可灵等,并指出这些模型将带动更多行业变革。文章还讨论了多模态算力趋势、多模态算法结构、加速算法及套件等话题。 核心数据包括: 1. EFLOPS-day:1EFLOPS(约3千张A100卡)集群运行1天所提供的算力。 2. 多模态模型参数持续增长,以Movie Gen 30B的模型为例,数据量为100M视频文本对和1B级图片文本对,集群规模为6144 H100。 3. 加速算法及套件的发展,如ZeRO、Ring Attention、Ulysses等。 关键点概括: 1. 多模态大模型成为AI算力消耗的新增点。 2. 多模态模型结构复杂,但在快速创新和演进中。 3. 加速算法及套件技术快速发展,以充分挖掘算力价值。 4. 业界主要的研究现状和挑战,如内存优化、MoE负载均衡、自动并行等。 5. MindSpeed-MM架构设计、模型开发和加速方法,以及典型多模态模型性能。 6. TOP客户商业案例和原生支持案例,如北大OpenSoraPlan、360 qihoo T2X等。 综上所述,本文主要探讨了多模态大模型在人工智能领域的应用和发展,以及相关的加速算法和技术挑战。
"通明湖AI大会揭示了哪些多模态大模型趋势?" "如何通过MindSpeed-MM加速算法提升多模态大模型性能?" "北大OpenSoraPlan与昇腾MindSpeed-MM结合的原生案例有哪些亮点?"
客服
商务合作
小程序
服务号
折叠