《2024生成式AI发展趋势展望及海外巨头企业生成式AI技术革新进展分析报告(42页).pdf》由会员分享,可在线阅读,更多相关《2024生成式AI发展趋势展望及海外巨头企业生成式AI技术革新进展分析报告(42页).pdf(42页珍藏版)》请在三个皮匠报告上搜索。
1、2 0 2 3 年深度行业分析研究报告目录目录 第一部分:生成式第一部分:生成式AI快速发展,技术奇点有望到来快速发展,技术奇点有望到来 第二部分:技术创新百花齐放,海外巨头引领创新第二部分:技术创新百花齐放,海外巨头引领创新2PBmVlX8YlYnVlW6MbP7NsQrRoMtPkPnNqMiNmMoM7NnMrRuOrRpMxNpOrO1.1 发展历程:算法模型持续迭代,发展历程:算法模型持续迭代,AI行业快速发展行业快速发展3资料来源:信通院人工智能生成内容(AIGC)白皮书,CSDN官网,阿里云开发者社区,NIH Record官网,MIT官网,51CTO官网,机器之心官网,腾讯云开发
2、者社区,科技行者官网,雷锋网,澎湃新闻网,winbuzzer官网,MBA百科,Geekwire官网,datamarketinglabs官网,安全客官网,AIGC开放社区公众号,IT之家官网,OpenAI官网,36氪官网,国元证券研究所1.1 发展历程:算法模型持续迭代,发展历程:算法模型持续迭代,AI行业快速发展行业快速发展41基础的生成算法模型是基础的生成算法模型是驱动驱动AI的关键的关键2014年,伊恩古德费洛(lan Goodfellow)提出的生成对抗网络(Generative Adversarial Network,GAN)成为早期最为著名的生成模型。GAN使用合作的零和博弈框架来学
3、习,被广泛用于生成图像、视频、语音和三维物体模型。随后,Transformer、基于流的生成模型(Flow-based models)、扩散模型(Diffusion Model)等深度学习的生成算法相继涌现。Transformer模型是一种采用自注意力机制的深度学习模型,这一机制可按输入数据各部分的重要性分配权重,可用于自然语言处理(NLP)、计算机视觉(CV)领域应用,后来出现的BERT、GPT-3、laMDA等预训练模型都是基于Transformer模型建立的。图:图:AIGC技术累积融合技术累积融合资料来源:腾讯研究院AIGC发展趋势报告,国元证券研究所1.1 发展历程:算法模型持续迭代
4、,发展历程:算法模型持续迭代,AI行业快速发展行业快速发展51基础的生成算法模型是基础的生成算法模型是驱动驱动AI的关键的关键模型模型提出时间提出时间模型描述模型描述变分自动编码(VariationalAutoencoders,VAE)2014年基于变分下界约束得到的Encoder-Decoder模型对。生成对抗网络(GAN)2014年基于对抗的Generator-Discriminator模型对。基于流的生成模型(Flow-based models)2015年学习一个非线性双射转换(bijective transformation),其将训练数据映射到另一个空间,在该空间上分布是可以因子化的
5、,整个模型架构依靠直接最大化log-likelihood来完成。扩散模型(Diffusion Model)2015年扩散模型有两个过程,分别为扩散过程和逆扩散过程。在前向扩散阶段对图像逐步施加噪声,直至图像被破坏变成完全的高斯噪声,然后在逆向阶段学习从高斯噪声还原为原始图像的过程。经过训练,该模型可以应用这些去噪方法,从随机输入中合成新的“干净”数据。Transformer模型2017年一种基于自注意力机制的神经网络模型,最初用来完成不同语言之间的文本翻译任务,主体包含Encoder和Decoder部分,分别负责对源语言文本进行编码和将编码信息转换为目标语言文本。神经辐射场(Neural Ra
6、diance Field,NeRF)2020年提出了一种从一组输入图像中优化连续5D神经辐射场的表示(任何连续位置的体积密度和视角相关颜色)的方法,要解决的问题就是给定一些拍摄的图,如何生成新的视角下的图。CLIP(Contrastive Language-Image PreTraining)模型2021年1)进行自然语言理解和计算机视觉分析;2)使用已经标记好的“文字-图像”训练数据。一方面对文字进行模型训练,一方面对图像进行另一个模型的训练,不断调整两个模型的内部参数,使得模型分别输出的文字特征和图像特征值确认匹配。DiT(Diffusion Transformers)模型2023年用Tr