《互联网行业逐浪大模型:互联网巨头的AI野望-230531(67页).pdf》由会员分享,可在线阅读,更多相关《互联网行业逐浪大模型:互联网巨头的AI野望-230531(67页).pdf(67页珍藏版)》请在三个皮匠报告上搜索。
1、 本报告由中信建投证券股份有限公司在中华人民共和国(仅为本报告目的,不包括香港、澳门、台湾)提供。在遵守适用的法律法规情况下,本报告亦可能由中信建投(国际)证券有限公司在香港提供。同时请务必阅读正文之后的免责条款和声明。证券研究报告证券研究报告海外行业深度海外行业深度 逐浪大模型:互联网巨头逐浪大模型:互联网巨头的的 A AI I 野望野望 核心观点核心观点 语言模型已步入大模型发展阶段,国内大模型研发应用热潮持续高涨,科技大厂在模型、算力、平台、应用进行了四位一体的全面布局,如阿里的“通义大模型+飞天智算平台+魔塔社区+行业应用”、百度的“文心大模型+昆仑芯+飞桨平台+行业应用”、腾讯的“混
2、元大模型+HCC 算力集群+太极机器学习平台+行业应用”、字节的“视觉语言模型+火山高速训练引擎+火山机器学习平台+行业应用”。大模型落地将形成 API、PaaS 和 MaaS 三种收费模式,目前仍以内部应用为主,后续主要向 B 端企业拓展服务,预计少数企业将在 C 端市场形成规模。摘要摘要 大模型发展全面加速,通过“预训练大模型发展全面加速,通过“预训练+精调”模式进行落地。精调”模式进行落地。语言建模经过统计语言模型、神经语言模型、预训练语言模型,已经全面迈入百亿、千亿参数规模的大语言模型阶段。大语言模型具备优秀的上下文学习能力、上下文学习能力、可观的知识容量、优秀的泛化性和复杂推理能力。
3、大模型研究存在 Google 的Bert 模式、OpenAI 的 GPT 模式和国内的混合模式三条技术线,以 ChatGPT 为主导 GPT 模式目前已经占据主流。目前,国内已有至少 19 家企业及科研院所参与人工智能大模型训练,主要分为大型科技公司、科研院所和初创科技团队三类。国际对比来看,目前美国领跑,中国跟跑,但差距不断缩小。在实践中,预训练大模型在基于海量数据的自监督学习阶段完成了“通识”教育,再借助“预训练+精调”等模式,在共享参数的情况下,根据具体应用场景的特性,用少量数据进行相应微调,即可高水平完成任务。互联网大厂在“模型、算力、平台和应用”互联网大厂在“模型、算力、平台和应用”
4、进行进行四位一体布四位一体布局。阿里“通义大模型局。阿里“通义大模型+飞天智算平台飞天智算平台+魔塔社区魔塔社区+行业应用”:行业应用”:在模型层,阿里达摩院主导大模型研究,发布通义大模型,包括通义 M6 多模态模型、通义 AliceMind 自然语言处理模型、通义视觉计算机视觉模型。在算力层,阿里云推出全栈智能计算解决方 维持维持 强于大市强于大市 孙晓磊 SAC 编号:S1440519080005 SFC 编号:BOS358 崔世峰 SAC 编号:S1440521100004 于伯韬 SAC 编号:S1440520110001 发布日期:2023 年 05 月 31 日 市场表现市场表现
5、相关研究报告相关研究报告 -14%6%26%46%66%86%2022/5/302022/6/302022/7/312022/8/312022/9/302022/10/312022/11/302022/12/312023/1/312023/2/282023/3/312023/4/30传媒标普500互联网互联网 海外行业深度报告 互联网互联网 请务必阅读正文之后的免责条款和声明。案“飞天智算平台”,并启动两座超大规模智算中心。此外,阿里不仅拥有最多的英伟达 A100 芯片,还拥有自研芯片含光 800、倚天 710 芯片,共同为人工智能大模型提供算力。在平台层,阿里推出 AI 开源社区“魔搭”,旨
6、在打造下一代“模型即服务”的共享平台,整合业界多方模型提供者,为开发者提供预训练基础模型和 API接口。在应用层,阿里已宣布旗下所有产品未来将全面改造并接入通义大模型,包括天猫、钉钉、高德地图、淘宝、优酷、盒马等。百度“文心大模型百度“文心大模型+昆仑芯昆仑芯+飞桨平台飞桨平台+行业应用”:行业应用”:在模型层,百度文心大模型构建了“基础+任务+行业”三级模型;在算力层,算力基础设施均由百度智算中心支持,昆仑芯二代已广泛应用在文心大模型,预计昆仑芯三代将于 2024 年初量产;在平台层,百度飞桨 PaddlePaddle 是其自主研发的深度学习平台,文心大模型通过百度飞桨平台,实现模型训练、推