当前位置:首页 > 报告详情

达摩院:2022连续语义增强机器翻译及魔搭社区应用实践(53页).pdf

上传人: 彩旗 编号:109091 2022-12-12 53页 17.85MB

下载:
word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了基于连续语义增强的神经机器翻译技术。文章指出,神经机器翻译技术严重依赖于大规模、高质量的双语平行语料,但在实际应用场景中,平行语料的规模往往非常有限。为缓解这一问题,业界通常采用数据增强技术自动产生大规模伪语料,用于优化翻译质量。然而,常用的数据增强技术(如回译和对抗样本)存在局限性,容易发生语义偏移。 为解决这一问题,文章提出了一种基于连续语义增强的神经机器翻译技术。该技术通过构建连续语义分布,突破离散空间限制,以优化翻译质量。文章详细介绍了技术方案,包括优化语义编码器(Tangential Contrastive Learning)和基于邻域进行采样(Mixed Gaussian Recurrent Chain Sampling)。 此外,文章还介绍了魔搭社区(ModelScope)的应用实践,包括模型推理、定制微调、在线体验等功能。魔搭社区通过开源的Python Package,统一封装了数百个模型使用的接口,有效降低了AI模型的使用、定制、评估和部署门槛。
连续语义增强技术如何优化神经机器翻译? 魔搭社区如何降低AI模型使用门槛? 如何通过魔搭社区快速体验高质量翻译服务?
客服
商务合作
小程序
服务号
折叠