当前位置:首页 > 报告详情

大语言模型的价值对齐:多元性、可转移性和可控性.pdf

上传人: 哆哆 编号:186297 2024-11-01 26页 15.41MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文探讨了大型语言模型(LLMs)中的价值对齐问题,涉及多元主义、可转移性和可控性。作者指出,人类价值是信念与情感的紧密联系,是推动行动的愿望,超越特定行动和情境,并作为标准和准则。价值对齐面临挑战,如理解定义人类价值或意图的困难,人类价值的细粒度维度,文化社会的绑定,以及如何桥接人类价值与可度量的优化目标之间的差距。 文章提出多元主义价值对齐,讨论了数据、采样、模型架构、偏好建模、推理、可控性和评估等方面。研究还涉及多语种人类价值概念,展示了跨语言的人类价值向量转移性,并探索了跨语言控制价值对齐的方法。 主要发现包括:人类价值在不同语言、文化和社会群体中是多元的;在多语种LLMs中,价值对齐通常由主导语言实现;价值概念从高资源语言向低资源语言转移容易,反之则难;价值对齐可通过跨语言转移、弱到强移植、模型编辑等手段实现。文章呼吁需要更多方法、机制和基准来推动多元价值对齐。
"如何实现多元价值对齐?" "跨语言价值概念如何转换?" "如何确保大型语言模型公平性?"
客服
商务合作
小程序
服务号
折叠