人工智能行业:多模态AI加速发展IP版权价值望迎多维重塑-230403(32页).pdf

编号:120997 PDF 32页 3.81MB 下载积分:VIP专享
下载报告请您先登录!

人工智能行业:多模态AI加速发展IP版权价值望迎多维重塑-230403(32页).pdf

1、 20102030405 OXlZkZRUhVkZpMnOmO9PbP6MsQrRsQoNeRnNrNeRqQnR9PrQoRNZqNmOuOqRsQ3/3/CONTENTS01020304 4/4 5GPT-41.1资料来源:Open AI官网,新智元,国泰君安证券研究2018.6G P T-12019.2G P T-22020.5G P T-32022.3G P T-3.52023.3G P T-4无监督训练加有监督微调,通过BooksCorpus大数据集(7000本书)进行训练零样本学习,进一步将训练规模扩大至40GB的数据集海量参数,进一步扩大训练规模至570GB数据集和1750亿参数

2、具有指令微调和RLHF,优化输出结果合理性强大的识图能力,文字输入提升至2.5万字,部分专业考试达人类水平以2017年Transformer模型为起点,近年来GPT的迅速迭代概括了大模型的发展历程,2023年以来明显提速,目前已迭代至GPT-4,支持图像输入并给予正确的文本反馈。61.1在处理复杂任务时,GPT-4较GPT-3.5表现更优,并且语言性能更强。如在美国律师执照模拟测试中,GPT-4测试分数位列前10%,而GPT-3.5居于后10%。GPT-4支持图像输入并给予正确的文本反馈,视觉能力的扩充有望打开更多应用场景。比如GPT-4指出这幅图把一个大而过时的VGA接口插入一个小而现代的智

3、能手机充电端口是荒谬的。图1:随着测试复杂程度提升,GPT-4与GPT-3.5表现差距逐步拉开图2:GPT-4可以判断出照片中不合常理之处资料来源:Open AI官网GPT-4 71.2资料来源:Stable Diffusion,新智元图:Stable Diffusion(发布于2022年8月)图:2022年12月升级后的Stable Diffusion可生成质量更高的景观图像AI绘画工具Stable Diffusion于2022年8月推出后迅速流行,4个月后的2.1版本支持渲染非标准分辨率的图像,建筑、自然风光等宏伟景观生成质量显著提高,该版本亦加强反向提示词(即告诉模型不生成什么内容),从

4、而使最终结果更为精致。81.2资料来源:Midjourney,新智元另一主流AI绘画工具Midjourney发布于2021年,知名获奖作品太空歌剧院便出自该工具,3月16日公测的V5版本可迅速生成专业画师级图像,光影效果及细节处理较此前版本显著优化。图:Midjourney(发布于2021年)图:3月16日公测的Midjourney V5可生成专业画师级图像 9AIRunwayGEN-21.3资料来源:新智元海外主流AI视频剪辑工具Runway与Stable Diffusion隶属于同一团队,目前Runway已助力2023年奥斯卡最佳影片瞬息全宇宙及其他低预算PGC作品搭建特效场景。2月初,R

5、unway推出AI视频生成模型GEN-1,该模型可根据文本提示词或者参考图像来改变原视频风格。3月20日,Runway推出GEN-2,在一个月内实现8种功能的全面升级。功能1:Text to Video(文字生成视频)“傍晚的阳光透过纽约市阁楼的窗户窥视。”功能2:Text+Image to Video(文字+图像生成视频)“一个男人走在街上的低角度镜头,周围酒吧的霓虹灯照亮了他。”10AIRunwayGEN-21.3资料来源:新智元功能3:Image to Video(图像生成视频)功能4:Stylization(风格化)将任何图像或提示的风格转移到视频的每一帧功能5:Storyboard(

6、故事版)将模型变成完全风格化和动画化的渲染图 11AIRunwayGEN-21.3资料来源:新智元功能6:Mask(掩码)隔离视频中的特定对象并使用简单的文本提示对其进行修改“一只身上有黑色斑点的白毛狗。”功能7:Render(渲染)通过应用输入图像或提示,将无纹理渲染变成逼真的输出功能8:Customization(个性化)通过自定义模型以获得高保真度的个性化形象 12/12 13AI2.1根据美国版权局规定,AI生成作品不受版权保护。2022年末,作家Kristina Kashtanova为其漫画作品黎明的曙光申请版权保护,根据美国版权局裁定,小说文字部分可受保护,但AI生成的插画无法受到

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(人工智能行业:多模态AI加速发展IP版权价值望迎多维重塑-230403(32页).pdf)为本站 (data) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
折叠