《信息服务行业报告-OpenAI o1初探:或能成为引领AI Phenomenal Ride的LLM新范式-240925(28页).pdf》由会员分享,可在线阅读,更多相关《信息服务行业报告-OpenAI o1初探:或能成为引领AI Phenomenal Ride的LLM新范式-240925(28页).pdf(28页珍藏版)》请在三个皮匠报告上搜索。
1、 请务必阅读正文之后的信息披露和法律声明 Table_MainInfo 行业研究/信息服务 证券研究报告 行业专题报告行业专题报告 2024 年 09 月 25 日 Table_InvestInfo 投资评级 优于大市优于大市 维持维持 市场表现市场表现 Table_QuoteInfo 2995.454764.316533.188302.0510070.9211839.792023/92023/122024/32024/6信息服务海通综指 资料来源:海通证券研究所 相关研究相关研究 Table_ReportInfo 工业重点行业领域设备更新和技术改造指南发布,以设备更新为契机加速推进工业软件国
2、产化2024.09.22 计算机行业跟踪周报 355 期:华为全联接大会全面拥抱 AI,工信部印发设备更新指南2024.09.22 计算机行业跟踪周报 354 期:OpenAI 发布新模型,苹果华为新机同日推出2024.09.15 Table_AuthorInfo 分析师:杨林 Tel:(021)23183969 Email: 证书:S0850517080008 分析师:杨蒙 Tel:(021)23185700 Email: 证书:S0850523090001 分析师:魏宗 Tel:021-23180000 Email: 证书:S0850524040003 联系人:杨昊翊 Tel:(021)2
3、3185620 Email: OpenAI o1 初探初探:或能或能成为成为引领引领 AI Phenomenal Ride 的的 LLM 新范式新范式 Table_Summary 投资要点:投资要点:OpenAI 发布发布 o1 系列大模型系列大模型,AI 大模型进入新纪元大模型进入新纪元。9 月 12 日,OpenAI 宣布开发了一系列全新 AI 模型:OpenAI o1,与之前的模型相比,这些模型能够更好地进行推理,这是一项重大进展,代表了 AI 能力的新高度。o1 在物理、化在物理、化学和生物学等困难的基准任务中表现与博士生相似学和生物学等困难的基准任务中表现与博士生相似,此外,o1 在
4、数学和编程领域也表现优异。在国际数学奥林匹克竞赛的资格考试中,GPT-4o 仅正确解答了仅正确解答了13%的问题,而的问题,而 OpenAI o1 的正确率达到了的正确率达到了 83%。在 Codeforces 编程比赛中,OpenAI o1 的表现达到了第的表现达到了第 89 个百分位个百分位。OpenAI o1 系列的首个模型已被发布,这是一个预览版本,其被命名为 OpenAI o1-preview。此外,OpenAI 还发布了 OpenAI o1-mini,这是一款具有成本效益的推理模型。o1-mini 在 STEM领域表现出色,尤其是在数学和编程方面,几乎与 OpenAI o1 在评估
5、基准(如AIME 和 Codeforces)上的表现相当。o1-mini 成本比 o1-preview 便宜 80%,o1-mini 推理速度远超 o1-preview,OpenAI 预计,预计,o1-mini 将成为一个快速且将成为一个快速且经济高效的模型,适用于需要推理但不依赖广泛世界知识的应用经济高效的模型,适用于需要推理但不依赖广泛世界知识的应用。全新的推理范式:思维链条全新的推理范式:思维链条+自我对弈强化学习自我对弈强化学习。OpenAI o1 带来的是推理范式的全面革新,即利用大语言模型学习推理(即利用大语言模型学习推理(Learning to Reason with LLMs)
6、。OpenAI 的大规模强化学习算法通过高度数据高效的训练过程,教会模型如何通过思维链条进行有效推理。OpenAI 发现,发现,o1 模型的性能随着更多的强化学习模型的性能随着更多的强化学习(训练时的计算量)以及更多的思考时间(测试时的计算量)而持续提升。(训练时的计算量)以及更多的思考时间(测试时的计算量)而持续提升。与人类在回答难题前长时间思考的方式类似,o1 在尝试解决问题时也运用“思维链条(CoT,Chain of Thought)”。通过强化学习,o1 学会了优化其思维链条,并精炼所使用的策略。它能识别并纠正错误,学会将复杂的步骤拆解为更简单的部分,并在当前方法无效时尝试不同的方式。