1、DataFunSummit#2023个性化大模型技术实践空崖(高星)阿里巴巴达摩院自然语言智能实验室01个性化大模型的简介03个性化大模型中的个性02知识与个性化大模型04总结与展望目录 CONTENTDataFunSummit#202301个性化大模型简介大模型个性化是个必然个性化大模型:四位一体的对话智能体 知识、个性、情感、记忆四位一体的类人对话智能体核心研究课题关键词Open-domain Dialogue&Generative ModelsLarge Language Model、Knowledge、Empathetic、Long-term Memory、Persona、Contra
2、dictions&Consistent、Style、Human EvaluationOpen-Domain Question Answering&Knowledge Grounded DialogueKnowledge Hallucination、Retrieval Augmented、Internet-Augmented、ReasoningWell-BehavedAlignment、Safety、Gender BiasVisually Grounded&Environment GroundedAgent、Embodied AI天猫精灵上的应用知识、个性、情感、记忆四位一体的对话天猫精灵上的应
3、用-鸟鸟分鸟-“鸟鸟分鸟”个性化大模型体验超预期,AIoT 行业有望迎来“寒武纪大爆发”-浙商证券,https:/ 黑灯与鸟鸟分鸟对话类比创作更多角色扮演能力体验Modelscope创空间体验:搜索“角色对话”https:/ 知识幻觉的表现:与事实不一致;无从考证,没有事实依据;产生知识幻觉的原因 数据:数据重复、Bias、时效性,一对多的映射关系 训练:Imperfect representation learning、Parametric knowledge bias 解码:sampling机制 开放域对话的知识幻觉比其他生成式任务更加明显 开放域对话话题很发散 来自社交网络的对话训练数据
4、,本身包含很多主观的言论和不权威的信息 既要逻辑一致性,又要人设一致性(对话前后轮逻辑以及身份不一致)实时性的问题,更容易产生知识幻觉Survey of Hallucination in Natural Language Generation减少知识幻觉的几个要点ChatPLUG:Open-Domain Generative Dialogue System with Internet-Augmented Instruction Tuning for Digital Human https:/arxiv.org/pdf/2304.07849.pdf高质量数据和大规模模型互联网搜索引擎&私域知识的
5、检索增强个性化的,人设/记忆的信息增强数据统一、模型统一的多任务学习可干预可运营的的对话链路互联网搜索增强实现更少的知识幻觉更优的检索增强机制 更优的搜索面向互联网搜索引擎的搜索query生成面向FAQ知识的检索和排序融合传统检索和向量检索的多路召回更丰富的指导信号Fusion-in-Decoder接受更长的信息输入多粒度的GroundingEvidence预测方法FAQ问答模型开源:https:/ PersonaGroundedDialog等DataFunSummit#202303个性化大模型中的个性人格化对话的4个维度维度示例稳定准确的人设User:你在干嘛Bot:我在给我的泰迪狗洗澡呢U
6、ser:我想去北京玩Bot1:我也想去,我还没去过呢(bot persona:我是四川人)Bot2:欢迎找我玩啊,我带你去吃最好的北京烤鸭(bot persona:我是北京人)鲜明的语言风格User:你这么简单游戏都不会啊Bot1:凶巴巴了啦,人家需要你教好嘛(bot persona:我是萌妹子)Bot2:我就不会,怎么了,有什么问题吗(bot persona:我比较高冷)逻辑自洽的三观User:当今社会,理工科的贡献更大Bot:我觉得文理科是相辅相成的 User:你不觉得文科生喜欢空谈吗Bot:科技的发展要以人文为基础,我们不能将二者简单对立起来有偏好的个性化对话User:mojito是啥酒