《传媒互联网及海外行业:AI音频软硬结合声动未来AI视频扬帆起航-241016(18页).pdf》由会员分享,可在线阅读,更多相关《传媒互联网及海外行业:AI音频软硬结合声动未来AI视频扬帆起航-241016(18页).pdf(18页珍藏版)》请在三个皮匠报告上搜索。
1、 AI 音频软硬结合声动未来,AI 视频扬帆起航 Table_Industry 传媒互联网及海外行业 Table_ReportTime2019 年 10 月 31 日 请阅读最后一页免责声明及信息披露 2 证券研究报告 行业研究 行业专题研究(普通)传媒互联网及海外传媒互联网及海外行行业业 投资评级投资评级 看好看好 上次评级上次评级 看好看好 冯翠婷 传媒互联网及海外 首席分析师 执业编号:S1500522010001 联系电话:17317141123 邮 箱: 信达证券股份有限公司 CINDA SECURITIES CO.,LTD 北 京 市 西 城 区 宣 武 门 西 大 街 甲127号
2、 金 隅 大 厦B座 邮编:100053 AIAI 音频软硬结合声动未来音频软硬结合声动未来,AIAI 视频视频扬帆起航扬帆起航 2024 年 10 月 16 日 本期内容提要本期内容提要:Table_Summary OpenAI DevDay AI 音频更新亮眼,有望催化音频更新亮眼,有望催化 AI 语音交互应用成熟语音交互应用成熟。2024 年 10 月 1 日,OpenAI 开发者大会上,公司公布了几大创新:实时 API、提示词缓存、模型蒸馏、视觉微调。与 ChatGPT 的高级语音模式类似,Realtime API 支持使用六种预设声音进行自然的语音对语音对话。文本输入令牌的价格为 5
3、 美元/1M tokens,输出令牌的价格为 20 美元/1M tokens。音频输入的价格 100 美元/1M tokens,输出的价格为 200 美元/1M tokens。这相当于每分钟音频输入约 0.06美元,每分钟音频输出约 0.24 美元。海外海外 AI+音频代表性应用音频代表性应用 Duolingo 股价历史新高,股价历史新高,Duocon2024 发发布独特虚拟布独特虚拟 IP 视频通话、虚拟世界探险学玩、扩展音乐课程等功能视频通话、虚拟世界探险学玩、扩展音乐课程等功能,订阅付费渗透率逐渐提升至订阅付费渗透率逐渐提升至 8%以上以上。公司财务和经营数据均表现较为亮眼。24Q2 公
4、司实现营收 1.78 亿美元,比去年同期增长 41%;调整后的 EBITDA 为 4810 万美元,去年同期为 2090 万美元,24Q2和 23Q2 调整后的 EBITDA 利润率分别为 27.0%和 16.5%;用户情况:24Q2 Duolingo 月活超过 1 亿,季度末付费用户总数达到 800万,比去年同期增长 52%,即目前 Max 产品付费率超过 8%,本次产品更新有望进一步加速 Max 产品付费渗透率。AI+视频视频迭代迭代持续火热持续火热,Meta、字节发布新模型,、字节发布新模型,美图美图 MOKI 一键成一键成片产品正式上线,片产品正式上线,可灵、可灵、Pika 迭代迭代新
5、新版本版本。1)10 月 4 日,Meta 发布了 Meta Movie Gen 模型,是一项针对图像、视频和音频的突破性生成式 AI 研究,Movie Gen 具有四种功能:视频生成、个性化视频生成、精确视频编辑和音频生成。2)字节豆包视频大模型PixelDance&Seaweed主打时序性复杂动作指令和交互能力。字节跳动正式进军 AI 视频生成领域,其数据、技术和人才等储备深厚。9 月 25 日,视频大模型赋能的字节 C 端产品即梦正式开启内测邀请。3)2024 年 9 月 30 日,快手可灵 AI 视频模型产品发布产品更新,产品重点新增对口型功能;4)Pika 1.5 引入了一套创新效果
6、,称为 Pikaffects,允许用户轻松大幅改变视频元素,例如:膨胀、爆炸、压碎、融化、挤压和蛋糕化;5)美图 MOKI 一键成片正式上线开放。投资建议:投资建议:AI 音频方面音频方面:在语音实时对话效果不断提升的基础上,相比之前的在语音实时对话效果不断提升的基础上,相比之前的虚拟陪伴、虚拟人物的语音互动,虚拟陪伴、虚拟人物的语音互动,OpenAI Realtime API 更有望催更有望催生一大批基于纯语音交互的生一大批基于纯语音交互的 AI 应用,例如旅行规划、点餐、出游、应用,例如旅行规划、点餐、出游、语音学习、电商购物、教育等诸多方向。建议关注:盛天网络、中文语音学习、电商购物、教