当前位置:首页 > 报告详情

宋晓辉-模型轻量化技术与端侧落地.pdf

上传人: p****n 编号:614071 2025-02-19 43页 4.88MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了模型轻量化技术在端侧落地中的应用。首先,作者阐述了模型端侧化的背景,包括端侧算力的高速发展和模型端/云部署的优势和劣势。接着,作者详细介绍了模型轻量化技术,包括模型剪枝、知识蒸馏、权重稀疏化和量化压缩技术。其中,作者特别强调了知识蒸馏技术的重要性,并提出了基于logits的知识蒸馏方法。此外,作者还介绍了目标结构化剪枝、量化感知训练等技术,并给出了具体的案例分析。最后,作者对端侧模型的发展趋势进行了展望,认为端云协同、隐私和个性化服务、基础模型标配服务、量化位宽降低和端侧部署将成为未来的研究热点。
模型轻量化技术如何实现? 量化感知训练如何提升模型效果? 端侧模型发展趋势有哪些?
客服
商务合作
小程序
服务号
折叠