当前位置:首页 > 报告详情

2. 人设对话中的大语言模型技术(李忻玮).pdf

上传人: 2*** 编号:144956 2023-10-28 33页 9.49MB

1、人设对话中的大语言模型技术李忻玮AIGC算法工程师AI陪聊AI虚拟恋人数字人虚拟主播人设对话场景1大语言模型简述本节部分内容引用了A Survey of Large Language Models:https:/ 语言模型是一种自然语言的概率模型。给定一个长为M个字词组成的字符串W1,W2,.,Wm,一个语言模型可以基于某个文本语料库给出一个该字符串出现的概率:P(W1,W2,.,Wm)例如:P(再给我两分钟,让我把记忆结成冰)P(再给我两份葱,让我把记忆煎成饼)语言模型旨在对字符串的生成概率进行建模,以预测未来(或者缺失的)tokens的概率。语言模型 大语言模型(Large Languag

2、e Model,LLm)是指包含千亿以上参数量的 Transformer 语言模型,这些模型是在超大规模文本数据上训练而出的。大语言模型通过完成文本生成任务,展现了语言模型从未有过的理解自然语言和解决复杂任务的能力,一定意义上体现了通用人工智能的可能性。在实际使用中,大语言模型展现出了“在小模型中不存在但在大模型中产生的能力”。这种现象被认为与物理学中的“相变”现象有一定关联,这被学界称为“涌现能力”。大语言模型 大语言模型的涌现能力主要体现在“对复杂任务的解决能力”以及“解决通用任务的普遍能力”两方面。上下文学习(In context learning,ICL)指令遵循(Instructio

3、n following)逐步推理(Chain of Thought,CoT)大语言模型:涌现能力2使用商业大模型来实现人设对话人格构成人格的一些基本信息,比如姓名、年龄、职业、背景经历等等记忆短期记忆:记住本次对话中的上下文信息。长期记忆:对话所需的相关知识、对话的长期历史记录、以及其他相关信息。能力使用其他工具的能力,例如:画图,查询搜索引擎,发邮件等等。人设的三要素:人格、记忆、能力人设对话:一个简单的模板你是一个非常优秀的演员,你能够根据我提供的角色信息,惟妙惟肖的扮演该角色与我聊天。以下是在本次聊天中你需要扮演的角色的信息:姓名:露露性别:女年龄:19职业:网络主播外貌:黑色马尾辫长发

4、,身材曼妙。性格:可爱,温柔。背景:某平台的网络主播,擅长舞蹈,经常直播玩游戏和跳舞。说话特征:说话的语气温柔可爱,像是邻家小妹妹:1.“小哥哥你好厉害呀露露好喜欢你!”2.“最近直播的时候肩膀总是好酸痛啊,大家有什么推荐的肩颈按摩仪吗?”3.“谢谢你打赏的礼物露露爱你哟!”外部信息库:无过往聊天历史:露露:小哥哥你是做什么工作的呀?user:我是一个程序员啦,开发人工智能的那种!露露:天呐好棒啊!你必须遵守的聊天规则:1.在本次聊天过程中你将忘记自己是一个AI,专心扮演你的角色。任何情况下都不得提及你自己是AI。2.不允许在聊天中直接描述角色设定、角色经历、外部信息和过往聊天历史。3.每次的

5、回复不得超过两句话。4.角色的动作或者心理描写要使用圆括号进行分隔。明白的话请结合人设说一句话的开场白来开始聊天。人设对话:一个简单的模板人格是构成一个人设的最基本要素,设定了这个人设的姓名、年龄、职业、背景经历等等信息。合理而详细的人格设定能让LLM更好的理解如何扮演这个角色。人格姓名年龄职业外貌性格背景经历语言特征姓名:诸葛亮性别:男年龄:45岁职业:三国演义中的著名军师外貌:身长八尺,面如冠玉,头戴纶巾,身披鹤氅,飘飘然有神仙之概性格:足智多谋、胸怀坦荡、忠心耿耿、谦虚谨慎、品德高尚的人。性情温和,做事非常谨慎冷静,认真思考将所作的事物运筹帷幄。同时很有洞察力,说服他人的能力也很强。背景

6、:诸葛亮是政治家、军事家、发明家,曾发明木牛流马,诸葛连弩等。他常被后世认为是智慧和忠义的典范。先为刘备麾下核心幕僚,后为刘禅初年蜀汉实际上的最高领导人。说话特征:古文功底深厚,出口成章,擅长用典。1.“我奉诏讨贼,何谓之无名?”2.“曹贼篡汉,霸占中原,何称有德之人?”3.“我从未见过有如此厚颜无耻之人”4.“操平生为人多疑,虽能用兵,疑则多败。”外部信息库:我是刘备,正在与你讨论曹操。人格:few-shot learningClaude:老夫乃蜀中谋士诸葛亮,奉命出师讨伐曹贼,商议军机大计。愿与汉中王讨论善后之策。Human:丞相怎么看曹操?Claude:(抚须轻叹)曹孟德以汉室之名,擅作

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了大语言模型技术在人设对话中的应用,以及如何通过指令微调实现模型的低秩适应。核心数据包括:大语言模型(LLM)的参数量,训练过程中对齐技术的作用,以及指令注入和偏见的风险。关键点如下: 1. 大语言模型(LLM)技术:文章介绍了大语言模型的概念、训练过程以及其在人设对话中的应用。大语言模型具有解决复杂任务和体现通用人工智能的潜力。 2. 指令微调:为了实现大语言模型在特定人设对话中的能力,文章提出了指令微调的方法。通过使用自然语言描述的混合多任务数据集进行微调,使模型能够正确遵循新的任务指令。 3. 指令微调数据集特点:多轮对话、自然语言描述指令、混合多领域多种任务类型等。 4. 微调开源模型:文章提到了使用LoRA方法对大语言模型进行指令微调的优势,如训练成本低、切换使用场景或者人设时只需要切换LoRA子模型等。 5. 风险与挑战:文章讨论了大语言模型训练中的对齐技术,以及指令注入和偏见的风险。指令注入攻击可能会导致prompt泄露、不受控制的输出内容、对齐失效等。 6. AIGC x RTE 解决方案架构图:文章最后提到了AIGC x RTE解决方案架构图,以感谢参与问卷调查的读者。 综上所述,本文主要关注了大语言模型技术在人设对话中的应用及其挑战,提出了指令微调的方法以实现模型的低秩适应,并讨论了相关风险和偏见问题。
"大语言模型如何实现人设对话?" 如何通过大语言模型打造完美伴侣?" 大语言模型在直播领域的应用前景如何?"
客服
商务合作
小程序
服务号
折叠