当前位置:首页 > 报告详情

李龙飞-性能驱动的大模型架构探索——网络架构及推理架构.pdf

上传人: 哆哆 编号:631136 2025-04-19 33页 12.71MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了蚂蚁集团资深算法专家李龙飞在ML-Summit会议上的演讲内容。李龙飞分享了在大模型训练、推理性能、混合线性模型探索以及高效离线推理框架Flood等方面的研究成果和应用实践。 关键点如下: 1. 李龙飞在蚂蚁工作十年,主要研究方向包括逻辑学习、因果学习、自动学习、大模型等方向,并在顶级会议上发表了70余篇论文。 2. 提出了性能驱动的大模型架构探索,包括网络架构及推理架构。 3. 介绍了混合线性大模型,将传统Attention的计算复杂度优化至线性级,将KVCache的空间复杂度优化至常数级,提高大模型训练和推理效率。 4. 分享了高效离线推理框架Flood的开发和应用,该框架具有训练速度快、耗时加速比随着训练长度增加而增大等特点。 5. 提出了高效率流水线并行、高效率调度、高效率kvcache管理等方面的解决方案,以提高大模型训练和推理的效率。 6. 给出了混合线性大模型在不同数据集上的性能表现和加速比,展示了其在数学和代码等相关推理数据上的优势。 以上内容根据报告的内容概括而成,数据来源于文章中的表格和文本。
"大模型训练中的架构选择和框架对齐有哪些挑战?" "如何实现更高效的 attention 机制探索?" "混合线性大模型在推理效率上有什么优势?"
客服
商务合作
小程序
服务号
折叠