计算机行业华为系列深度之十八暨GenAI系列深度之四十九:算力新变局训练范式、架构创新、工程优化-250207(24页).pdf

上传人: s****e 编号:603718 2025-02-08 24页 2.16MB

下载:
word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。

相关图表

本文主要分析了AI大模型训练范式、模型架构创新、工程优化对算力需求的影响,以及国内外大厂资本开支趋势和国产算力性能与生态的突破。文中提到,AI大模型训练范式正在转向多阶段,强化学习算力投入仍需提升;模型架构创新,如MoE混合专家模型、注意力机制的改进,正在降低训推成本;工程优化,如Deepseek的Infra工程优化,也在提升模型性价比。同时,国内外大厂加码资本开支趋势延续,国产算力性能和生态有突破,如海光信息兼容CUDA路线,华为昇腾自成体系路线。总体来看,AI模型智能平权开启,算力总需求仍可能增加。
训练范式和推理Scaling Law如何影响AI模型发展? 模型架构创新如何降低AI训练和推理成本? 国产AI芯片性能和生态有何突破,对行业有何影响?
客服
商务合作
小程序
服务号