当前位置:首页 > 报告详情

1-5 预训练语言模型压缩及美团落地实践.pdf

上传人: 云闲 编号:102325 2021-01-01 35页 24.94MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了预训练语言模型压缩及其在美团的具体应用实践。关键点如下: 1. **模型压缩技术**:为了解决大模型在部署时遇到的推理时间长和资源消耗问题,文中提到了模型压缩技术,如知识蒸馏、模型剪枝和量化,这些技术可以平衡模型的效果和推理性能。 2. **多尺寸多结构模型**:美团预训练平台支持多任务、多模态,并且能够提供通用型预训练模型,这些模型在不同业务场景中都有应用,如社区搜索、推荐、广告理解等。 3. **压缩比实验效果**:文中提供了压缩比的实验数据,如BERT-base压缩15%后,GLUE Score仅下降2%,证明了压缩模型的有效性。 4. **迭代式多教师蒸馏**:通过多教师策略和迭代蒸馏,可以进一步提升模型效果。实验显示,迭代式多教师蒸馏在语义匹配场景中效果显著。 5. **VIRT模型**:介绍了VIRT模型,这是一种通过虚拟交互提升文本匹配模型效果的方法,它可以显著减少推理时间,同时保持模型效果。 6. **实际应用效果**:在搜索广告、酒店智能助理等业务场景中,压缩后的模型不仅提升了推理速度,还保持了高在线效果。 综上所述,美团通过AutoDisc、迭代式多教师蒸馏和VIRT等技术,成功将大模型压缩并应用于多个业务场景,实现了模型效果和推理性能的平衡,显著提升了用户体验和业务效率。
"大模型压缩如何突破技术难题?" "双塔蒸馏技术在语义匹配中的应用有哪些优势?" "美团如何利用预训练模型提升业务效果?"
客服
商务合作
小程序
服务号
折叠