当前位置:首页 > 报告详情

10 段石石Rethinking Large Language Models efficiency and performance.pdf

上传人: 张** 编号:158373 2024-03-31 29页 5.88MB

1、Rethinking Large Language Models Efficiency and PerformanceShangHaiShangHaiOutline1.Trends of Large Models2.History and problem overview3.Parallelism Strategies&Tricks4.Kernels and Compiler5.FutureOutline1.Trends of Large Models2.History and problem overview3.Parallelism Strategies&Tricks4.New Appli

2、cationsTrends of Large ModelsShangHaiPowering computing industry for decadesDennards Scalingif the transistor density doubles,power consumption(with twice the number of transistors)stays the sameHuangs law states that the performance of GPUs will more than double every two years.Between 2006 and 202

3、1,GPU price performance(in terms of FLOPS/$)has tended to double approximately every 2.5 yearsML Models demands biuSevilla,Jaime,et al.Compute trends across three eras of machine learning.2022 International Joint Conference on Neural Networks(IJCNN).IEEE,2022.Larger model,Larger Corpus,better accura

4、cycorpus increasecorpus increase#parameter#parameter increaseincreaseKaplan,Jared,et al.Scaling laws for neural language models.arXiv preprint arXiv:2001.08361(2020).Emergence of LLMshttps:/ and problem overviewShangHaiBrief Histroy Of Large Model 20122016DistBelief;Parameter Server;Bosen;GeePS;2018

5、TF allreduce baidu;Horovod;DDP;Compute Graph and PlacementTransformer及其变种;流水线并行;大规模模型并行;2020Large language model wit FSL;PaLM:PathWayGoogle;CLIPOpenAI,连接图与文;Large Model:Sparse ModelsLarge Model:Deep ModelsLarge Model:Foundation ModelsProblem Overview:LLMs Need Huge FLOPSTransformer FLOPs Equation:C=

6、T6NDN:the number of parameters;D:the number of tokens that model is train on;LLM#Parameters(billion)#Tokens(billion)Model-FLOPSGPT31753003.15E+23LLaMa-65B6514005.46E+23LLaMa2-70B7020008.4E+23PaLM5407802.5272E+24Problem Overview:Gap between LLMs and Acceleratorhttps:/ Overview:Gap between LLMs and Ac

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了大型语言模型(Large Language Models,LLMs)的效率和性能问题,并提出了相应的解决方案。 关键点如下: 1. 大型模型趋势:随着模型规模的扩大,模型对计算资源的需求也在增加。例如,GPT-3拥有1750亿个参数,训练数据为3000亿个词,其FLOPS(每秒浮点运算次数)需求达到了3.15E+23。 2. 历史与问题概述:从2012年到2021年,GPU价格性能(以FLOPS/$为单位)大约每2.5年翻倍。然而,LLMs与加速器之间的性能差距仍然存在。 3. 并行主义策略与技巧:为了提高LLMs的训练效率,研究者们提出了多种并行训练策略,如数据并行、模型并行、流水线并行等。 4. 稀疏模型与深度模型:为了降低模型的内存占用,研究者们提出了稀疏模型和深度模型等方法。 5. 未来展望:文章提出了未来的研究方向,包括实时调度器/人类友好的性能分析工具、自动并行策略、不同加速器之间的协同等。 综上所述,文章针对LLMs的效率和性能问题进行了深入探讨,并提出了一系列解决方案。同时,文章也展望了未来的研究方向,以期为LLMs的进一步发展提供指导。
"大型语言模型如何提高效率和性能?" "大型模型训练中的并行策略和技巧有哪些?" "未来大型语言模型发展趋势和可能的应用场景是什么?"
客服
商务合作
小程序
服务号
折叠