1、 本报告由中信建投证券股份有限公司在中华人民共和国(仅为本报告目的,不包括香港、澳门、台湾)提供。在遵守适用的法律法规情况下,本报告亦可能由中信建投(国际)证券有限公司在香港提供。同时请参阅最后一页的重要声明。证券研究报告证券研究报告海外行业深度海外行业深度 A AI I 音乐:音乐:打通打通技术技术新新路径路径,大模大模型时代加速发展型时代加速发展 核心观点核心观点 计算机音乐因专业门槛相对高、结构化数据获取难度大,相比计算机视觉及自然语言处理发展较缓慢,随着大模型引发 AI 浪潮、硬件及基础设施快速升级,AI 音乐迎来机遇:2023 年 2 月谷歌推出 MusicLM 模型,尝试以 Ber
2、t 模型机制实现音乐数据的情景生成,结合早期基于 RNN、VAEs、GANs 的预训练模型,音色混音等难题得以攻克,上游数据标注领域也逐渐出现商业化工具。目前 AI 音乐发展的障碍在于核心版权资源高度分散,数字音乐行业版权壁垒高筑,原始录制文件无法从互联网直接获取,随着版权方投资入局,谷歌引领 wav-to-wav 类模型兴起,发展路径更加通畅,有望产生突破式进展。硬件升级解锁新的技术路径,“暴力求解”模式解放硬件升级解锁新的技术路径,“暴力求解”模式解放 A AI I 音乐生音乐生产力。产力。计算机音乐已经几十年发展历史,基于深度学习的音乐生成约在 2015 年起步,主流模型是 VAEs、G
3、ANs 等,行业玩家包括索尼等科技公司、Spotify 等流媒体平台、乐器厂商、AI 音乐初创公司等。2022 年以来大模型浪潮推动 AI 基础设施发展,谷歌尝试用 NLP 生成方式训练音乐生成模型,验证了 MLM 方式在音乐生成任务中的可行性(传统 AI 音乐模型的基础理论主要是概率类),音色、混音等难题得以一并攻克。随着算力持续升级、调优迭代、数据量增加,模型有巨大的升级潜力。核心痛点核心痛点是是版权音乐版权音乐资源资源的封闭和分散的封闭和分散,随着版权方积极入局、随着版权方积极入局、上游数据集行业发展,现状上游数据集行业发展,现状有望有望改善。改善。音乐版权壁垒高筑,版权资源有严格的层级
4、分发渠道,三大唱片厂拥有大部分流行音乐版权。不同于图文,互联网获取的音频丢失了大量创作细节,难用于结构化的再生成,长期以来主流模型使用的是以 BGM、古典乐、游戏音乐为主的公版资源。近年来环球音乐、华纳音乐等老牌唱片公司积极投资 AI 音乐初创公司,有望释放更多商业 AI 数据资源;上游数据标注行业发展也将推动 wav to wav 模式下更多训练资源的产出,国内已经有慧听科技,海天瑞声等公司提供音乐数据服务,各众包平台也能提供定制化的标注服务。公司方面,(公司方面,(1)版权方)版权方:包括环球音乐、华纳音乐、索尼音乐等,其中索尼音乐依托索尼集团,AI 研发和商业化能力领先。(2)流媒体平台
5、流媒体平台:Spotify、TME、云音乐、Apple Music 等,研究主要围绕用户行为、歌曲识别等展开,长期有望受益于 AI 增量内容带来的全行业降本增效。(3)互联网公司:互联网公司:谷歌、微软、百度等,AI 研究成果储备最多,有望持续推动前沿技术革新。(4)AI 通通用技术用技术商商和数据公司和数据公司,比如商汤,科大讯飞,海天瑞声等。维持维持 强于大市强于大市 孙晓磊 SAC 编号:s1440519080005 SFC 编号:BOS358 崔世峰 SAC 编号:S1440521100004 发布日期:2023 年 05 月 11 日 市场表现市场表现 相关研究报告相关研究报告 -3
6、0%-10%10%30%50%2022/4/182022/5/182022/6/182022/7/182022/8/182022/9/182022/10/182022/11/182022/12/182023/1/182023/2/182023/3/18传媒恒生指数资讯科技业资讯科技业 海外行业深度报告 资讯科技业资讯科技业 请参阅最后一页的重要声明 目录目录 一、生产要素分析.1 技术路线:百花齐放,算力升级使暴力求解成为可能.1(1)传统路线:基于音符逻辑的算法音乐.1(2)AI 时代:神经网络架构的音乐生成诞生多流派.1(3)GoogleMusicLM:基于 NLP 语境学习思路的音乐生成