快意大模型在短视频互动场景的应用探索-刘澈.pdf-三个皮匠报告

1、快意大模型在短视频互动场景的应用探索快手-快意大模型研发团队分享人简介主讲人简介：刘澈，快手-快意大模型-智能交互团队负责人，负责大模型智能问答、多轮对话、多模态对话、人格化等技术研发和业务应用。在加入快手之前，曾在滴滴AILab、阿里达摩院从事人机智能交互研究，在ACL、EMNLP、KDD等会议上发表多篇论文。个人联系方式快手技术团队公司介绍及项目背景公司介绍及项目背景Yii基座模型介绍及能力评测人格化大模型介绍及在短视频互动场景的应用探索成立于2014年7月，注册资本60亿美金现位于北京市海淀区西二旗西路商业模式：直播、电商、数字营销、本地生活等研发投入连续三年超过百亿主营产品：

2、快手APP、一甜相机、快影等港股上市，属有限责任公司（台港澳法人独资）北京达佳互联信息技术有限公司商业线上营销收入143.5亿同比增长 30.4%直播收入99.7亿同比增长16.4%电商GMV2655亿同比增长38.9%用户DAU3.76亿同比增长 8.3%互关用户对数311亿对同比增长 50%日均互动总量80亿含点赞/评论/转发内容直播供给400类视频库400亿每日上传视频3000万公司介绍公司介绍OpenAI的ChatGPT惊艳了世界，预示着通往AGI的可能性2022底开始，AI技术突破的新篇章开启2018-2019年2023年2020年2021年2022年GPT-1、GPT-2GPT-

3、3GPT-3.5LaMDAChatGPTGPT-4LLaMA文心一言、文心一格通义千问、通义万相日日新大模型星火认知大模型盘古大模型豆包（原Grace）零一万物项目项目背景背景ChatGPT上线2个月，月活用户突破1亿，成为史上增速最快的消费级应用之一GPT4是迄今为止“史上最强模型”，同时拥有文本和多模态能力项目背景项目背景作为一家以AI技术驱动的公司，快手制定新的AI战略，于2023年初启动快意大模型研发专项技术技术侧侧智能生产消费娱乐搜索问答垂类大模型语言大模型多模态大模型千亿参数的大模型训练及推理Infra创新场景驱动创新场景驱动海量多模态数据海量多模态数据领先的领先的AIAI算力

4、基建算力基建生态侧生态侧公司介绍及项目背景Yii大模型介绍及能力评测大模型介绍及能力评测人格化大模型介绍及在短视频互动场景的应用探索快意大模型快意大模型的的效果展示效果展示快意大模型快意大模型的的效果展示效果展示文案创作常识问答编程/对轮对话快意快意大模型大模型的的评测评测结果结果C-Eval结果榜单2023-09-18CMMLU结果榜单2023-09-18在同等参数规模下，快意66B的基座预训练模型在各权威榜单中均处于领先位置业界同等规模大模型在权威benchmark上的评测结果模型ChatGPT54.455.5170.057.148.1GLM-130B44/44.8/LLAMA2-70B

5、50.1/68.956.829.9InternLM-104B62.7/67.262.9/快意大模型快意大模型-66B B73.771.167.260.953.1LLAMA-65B38.839.863.423.750.9C-Eval(%)中文全科清华&上交 13.9K个单选题CMMLU(%)中文全科MBZUAI&上交&微软亚研院11.5K个单选题MMLU(%)英文全科国外大学与研究所14K个单选题GSM8K(%)英文小学数学OpenAI8.5K个多步计算题HumanEval(%)英文代码与算法OpenAI168道编程题快意大模型的评测结果快意大模型的评测结果快意66B模型经过对齐后，

6、在人工和自动测评结果上取得接近GPT-4的效果单轮效果多轮效果基础体验问题基础体验问题快意大模型快意大模型的的效果展示效果展示-多模态能力多模态能力modelNoCapsFlickr30KtextcapsGQAtextvqaMMBenchMMBench_CNOKVQAQwen-VL-chat120.281.067.1957.561.560.656.756.6KwaiYii-VL-chat115.2(-5)95.1(+10.8)137.7(+69.47)62.2(+4.7)65.38(+3.88)69.1(+8.5)70.8(+14.1)61.8(+5.2)快意66B多模态模型在开源榜单相关结果

快意大模型在短视频互动场景的应用探索-刘澈.pdf

相关报告