腾讯研究院:2025年AI图景解码50关键词(64页).pdf

编号:188180 PDF  PPTX 64页 8.10MB 下载积分:VIP专享
下载报告请您先登录!

腾讯研究院:2025年AI图景解码50关键词(64页).pdf

1、在过去一年,人工智能技术的迅猛发展正深刻重塑着社会的运行方式。从前沿动态追踪到实际应用场景,从教育辅导到科研创新,AI已然成为推动社会进步的重要力量。在AI技术快速迭代的背景下,系统性的信息整合与分析变得尤为重要。为降低信息获取成本,提升学习效率,腾讯研究院开发了一系列专业的AI资讯产品:AI每日速递,一份高度凝练的日报产品,帮助读者用3-5分钟快速掌握AI领域当日十大关键进展,在信息过载的时代,为学习与研究“标注”出最有价值的高质量数据;AI每周50关键词,作为周报产品,基于AI速递内容构建。通过梳理一周热点关键词并制作可交互索引,为研究者提供便捷的“检索增强”工具,助力快速定位所需信息;科

2、技九宫格,一档短视频栏目,以3-5分钟视频形式解读科技热点与关键技术原理。通过可视化呈现,促进读者对前沿技术的理解与讨论,为团队内容优化提供重要“反馈”;这些产品的运营过程,恰如大语言模型的迭代优化持续不断地吸收新数据,萃取新知识,产生新洞见。在此基础上,团队还同步开展了AGI专题分析、AGI线上圆桌、AI&Society高端研讨会与AI&Society百人百问等系列研究探讨。基于全年研究积累的三十余万字AI进展数据库,对当前AI发展进行阶段性总结具有重要意义。为了系统呈现AI发展的关键技术要点和趋势,该报告精选了50个年度关键词,覆盖大模型技术的八大领域:图像处理、视频生成、3D生成、编程助

3、手、Agent、端侧智能、具身智能和基础模型;借鉴大模型的思维特征,创新性序序言言1的通过快思考与慢思考两种维度进行分析,形成了50张AI技术图景卡片。快思考维度呈现印象卡片,采用人机协同方式完成。项目团队研究人员主导提示词工程与价值判断,把握内容方向;AI系统负责执行,最终绘制输出技术定义、图示与总结语;慢思考维度则深入分析技术发展的底层逻辑。重点整合研究团队在圆桌讨论和专题研究中的深度思考,借助AI辅助梳理出逻辑链条、本质洞见与趋势判断,为读者勾勒AI发展的脉络与方向。AI技术呈现持续演进、动态发展的特征。该报告通过50个关键词构建的技术图景,旨在展现AI发展的重点领域,把握未来关键趋势,

4、为各界提供研究与决策参考。腾讯研究院将持续深化AI&Society领域的探索,并诚挚的邀请各界好友一共关注与参与,一起迈向一个智能共生的时代。腾讯研究院院长腾讯研究院院长 司晓司晓23A:Transformer从文本扩展至其它B:DiT架构带来图像生成质的飞跃C:Scaling Law在图像领域开始生效核心观察核心观察1.A 技术演进:下一个字符 下一个像素 突破:序列建模能力迁移2.B 架构优势:替代:U-Net MMDiT(SD3、Flux、混元文生图)提升:-空间关系理解-复杂提示处理-细节还原能力3.A+B C:规模效应 参数规模:800M 12B 涌现能力:-真实度提升-控制力增强-

5、细节完善逻辑链条逻辑链条1.图像生成正从传统扩散模型走向序列化建模2.Transformer不同模态的底层范式可以实现迁移3.图像领域正在复制语言模型的缩放法则与能力涌现本质洞见本质洞见DiT架构结合扩散模型和Transformer的架构,用于高质量图像生成的深度学习模型。扩散变幻,意象成型扩散变幻,意象成型4A:图像控制从文本描述走向精确控制B:控制方式呈现多层次演进C:ControlNet实现精确干预能力核心观察核心观察1.A 控制维度演进:Prompt:文本描述引导 LoRA:低成本模型微调 ControlNet:精确条件控制2.B 技术路径分化:描述控制:语义理解 参数控制:模型微调

6、条件控制:额外输入引导 工作流控制:外部编排3.C 精确控制突破:光影:IC-Light照明控制 轮廓:Paints-Undo创作追溯 构图:Omost自动扩展逻辑链条逻辑链条1.控制正从描述性向操作性演进2.多层次控制机制形成互补优势,图像生成正走向精工制造时代3.AI图像生成正从粗放生成走向精确控制,这将重塑创作生产流程。本质洞见本质洞见图像生成控制通过精确的提示词、参数和约束条件,引导AI模型生成符合预期的特定图像内容和风格。参数为笔,意念成像参数为笔,意念成像5A:AI图像处理已突破1K分辨率门槛B:高分辨率对图像生成具有重要商业价值C:高分辨率对图像理解同样关键D:高分辨率处理仍存在

7、多重技术限制核心观察核心观察1.A B 产业应用扩展 生成模型支持10241024原生分辨率 艺术创作/广告/游戏开发等应用提升2.A C 专业领域突破 医学影像分辨率需求256-1024 模型达到1K处理能力 专业应用可行3.D 技术演进方向 (高分辨率处理)(架构创新 性能优化)例:Pixtral 12B,Eagle系列针对分辨率优化逻辑链条逻辑链条1.1K分辨率是AI图像处理由通用向专业化过渡的分水岭2.AI图像价值实现需要技术与产业的双向驱动,专业需求 技术突破 应用深化本质洞见本质洞见高分辨率图像处理对大尺寸、高精度图像进行分析、增强和变换,以提取信息、改善质量或适应特定应用需求。细

8、微入毫,尺显真容细微入毫,尺显真容6A:生成式AI具有强大的技术能力和流量吸引力B:技术能力需要转化为有效商业闭环C:AI企业被迫进行商业模式转型D:产业整合成为主要出路核心观察核心观察1.A B C 为什么要转型?技术能力 商业价值 流量优势 变现能力 (技术优势 商业化失败)寻求转型2.C D 案例佐证:-Stability AI:技术困境 视效领域融合 -Leonardo.ai:独立运营 平台整合3.(成功转型案例)(产业链整合 场景深耕)-原生技术 工具产品 产业解决方案逻辑链条逻辑链条1.想要跨越鸿沟,要么融入既有产业链,要么能够成功对接具体应用需求2.AI图像生成企业将技术驱动向场

9、景驱动转变,通过产业整合获得商业生态位本质洞见本质洞见AI图像商业化将人工智能图像生成技术转化为可持续的商业服务,实现技术价值与市场需求的良性循环。智造赋能,价值衍生智造赋能,价值衍生7A:图像理解在医疗领域率先实现商业化B:科技巨头深耕医疗AI研发C:学术界取得突破性进展D:行业权威对医疗AI持积极态度核心观察核心观察1.A 产业成熟度与应用价值 图像理解 图像生成 专业应用 通用应用2.B C 技术进步 企业投入:-Med-Gemini系列(2D/3D/基因组)学术突破:-Mirai(预测诊断)-SAT(3D分割)技术突破 临床验证 商业应用 (成功医疗AI)(专业性 实用性 可靠性)3.

10、D 发展趋势 领域专家认可(Hinton、吴恩达等)技术路线可靠性逻辑链条逻辑链条1.多模态识别能力提升,让AI在专业领域理解、分析应用成为可能2.医疗AI的成功得益于其深度对接专业场景,以解决实际临床需求为导向的发展路径 本质洞见本质洞见医疗AI运用人工智能分析医学影像、临床数据,协助医生诊断决策,实现精准治疗增强。慧眼穿透,微显著知慧眼穿透,微显著知89A:视频生成相比图像生成难度提升百倍B:视频生成技术发展出自回归与扩散两大路线C:Sora引领DiT架构成为主流方向D:规模化训练是实现高质量视频生成的关键核心观察核心观察1.问题难度跃升(A)视频生成/图像生成 百倍复杂度:大量连续帧、时

11、序连贯性、主体一致性2.技术路线探索(B)自回归Transformer方案 or 扩散模型 规模化训练3.技术突破与统一(B C D)DiT架构整合:融合Transformer与扩散模型优势 引入时空块编码创新 通过规模化训练实现性能突破逻辑链条逻辑链条1.视频生成的技术演进呈现分散探索路径统一的特征2.规模化训练是解决复杂生成任务的通用范式3.架构创新(DiT)+训练范式(规模化)的组合是突破性进展的关键本质洞见本质洞见规模化训练通过扩大模型参数、数据规模和算力投入,在量变中实现质变的训练范式。以量取胜,跃迁超萃以量取胜,跃迁超萃10A:视频生成模型的核心在于时序特征处理B:DiT架构通过扩

12、散过程处理时序关系C:自回归方案将视频离散为可预测的token序列D:下一帧预测是视频连续性的关键保证核心观察核心观察1.技术路线分化(A)扩散模型:噪声迭代 帧序列生成 自回归Transformer模型:token预测 帧序列构建2.实现机制对比(B C)DiT方案:整体扩散过程、时空特征同步建模 自回归Transformer方案:视频token化、序列化预测3.预测能力(D)连续性保证:时序特征学习+运动规律理解+状态迁移预测逻辑链条逻辑链条1.下一帧预测是视频生成的核心任务,但不同技术路线有不同实现方式2.自回归预测通过将视频离散化,把复杂的时序预测转化为token预测问题3.预测范式的

13、选择直接影响模型的生成能力与效率权衡本质洞见本质洞见下一帧预测基于已知视频帧序列的时空特征,推演预测未来瞬间的画面内容。窥今以知来,推果溯因窥今以知来,推果溯因11A:模型厂商通过工具+社区培育创作生态B:厂商频繁举办各类创作比赛扩大影响C:与艺术家合作已成为行业标配D:艺术家参与可反哺模型训练形成数据飞轮核心观察核心观察1.生态构建路径(A B)打造工具产品 运营社区 举办比赛活动 扩大影响2.艺术家价值链(C D)前端:优质作品展示 中端:专业反馈收集 后端:训练数据优化3.闭环形成(A B C D)工具应用 社区运营 艺术家合作 数据反馈 模型优化逻辑链条逻辑链条1.AI视频生态正在从工

14、具提供向价值共创演进2.艺术家在生态中扮演双重角色:既是内容生产者,也是模型优化的关键贡献者3.数据飞轮成为商业闭环的核心驱动力,将持续提升AI创作的质量边界本质洞见本质洞见艺术家共创人类艺术家与AI模型通过交互式创作,在视频生成过程中实现创意的双向激发与融合。天人合一,机艺双馨天人合一,机艺双馨12A:视频生成模型的交互逻辑比文本模型更复杂B:模型能力支持多样化输入(文本、图片、视频)C:配套工具提供细粒度控制选项D:AI原生创作工具正在向全流程方向演进核心观察核心观察1.交互使用难度差异(A):文本模型(简单)视频模型(复杂)2.能力扩展(A B)文生视频 图生视频 首尾帧控制 视频生视频

15、3.控制增强(B C)精细化控制=运镜控制+运动笔刷+主体选定+.4.范式升级(C D)传统创作工具 AI原生创作平台(多工具集成+工作流适配+专业功能对标)逻辑链条逻辑链条1.视频生成模型的应用正在从单一生成向创作生态演进2.成功的AI创作工具需要在保持AI能力优势的同时,兼顾传统创作习惯3.降低使用门槛与提供专业控制是视频生成模型应用的双重任务本质洞见本质洞见AI原生创作以AI视频生成模型为核心重构视频创作的思维范式与工作流智成影像,创意无界智成影像,创意无界13A:视频生成模型正向游戏世界模拟方向发展B:多个研究团队在游戏生成领域取得突破C:游戏引擎本质是一种受限的世界模型D:从游戏模拟

16、到现实世界模拟存在复杂度跨越核心观察核心观察1.技术演进路径(A B)Oasis:Minecraft式开放世界生成 Genie-2:通用可交互游戏生成基础模型2.概念拓展(B C)游戏引擎 受限世界模型 特征:有限世界尺寸、封闭规则系统、可预测状态转移3.仍待探索(C D)现实世界=复杂度指数级增长+数据收集成本激增+状态空间爆炸逻辑链条逻辑链条1.游戏生成是通向世界模拟的缩微实验场,提供了可控的技术验证环境2.从游戏到现实的跨越不仅是量的积累,更需要在模型架构和学习范式上的质变本质洞见本质洞见生成式游戏通过AI生成技术动态创造游戏内容,实现无限可能的交互叙事与世界构建。无限想象,生生不息无限

17、想象,生生不息14A:多实验室主张视频生成模型是实现世界模拟器的可行路线B:当前视频生成模型存在成本高、模态不全、长视频不稳定等问题C:游戏生成模型在实时模拟方面取得突破性进展D:游戏引擎可视为特定范围的世界模型核心观察核心观察1.现状认知(A B)技术路线已明确 现实困难:成本高、缺模态、不稳定2.游戏生成带来希望(C D)DIAMOND:可交互游戏画面预测 Oasis 开放世界实时模拟3.演进路径(B C 未来发展)游戏模拟 受限世界模拟 通用世界模拟逻辑链条逻辑链条1.世界模拟器的实现路径正在从完整模拟转向分级模拟2.游戏生成模型作为受限环境的世界模拟,为解决视频生成核心问题提供了新思路

18、3.实现真正的世界模拟器需要解决的根本挑战是复杂度控制与数据获取本质洞见本质洞见世界模拟器一个能够模拟现实世界物理规律、因果关系与智能行为的计算机系统虚实之间,万象归一虚实之间,万象归一1516A:各类技术方案快速涌现B:性能与效率大幅提升C:应用场景不断拓展D:技术挑战仍待突破核心观察核心观察1.A 主流技术方案 -Tripo 2.0:DiT+U-Net架构 -GRM:四视图transformer重建 -Unique3D:多视图及法线扩散2.B C 应用价值 (形态还原)(速度 质量 效率)广泛应用:-游戏开发:场景建模-影视制作:特效场景 -工业设计:产品迭代-VR构建:虚拟环境3.D 发

19、展挑战 数据积累 模型优化 产业赋能 当前瓶颈:-训练数据稀缺-泛化能力有限 未来方向:-GANs数据生成-迁移学习优化逻辑链条逻辑链条1.图片、视频的生成均为帧的叠加,3D生成难度加大,须解决空间几何难题2.几何形态还原技术通过持续创新,推动3D生产效率与应用范围双提升本质洞见本质洞见几何形态还原从复杂物体中提取基础几何特征,重建物体的本质形态结构与空间关系。化繁为简,归元返真化繁为简,归元返真17A:纹理生成方法多元化B:核心技术不断突破C:AI赋能加速发展D:应用场景持续扩展核心观察核心观察1.A 基础方法体系 生成路径:-基于图像:纹理映射/无缝拼接 -基于模型:细节增强/PBR渲染

20、-基于深度学习:GAN/CNN架构2.B 关键技术 技术要素:-UV展开与优化-程序化生成算法 -PBR材质系统-纹理合成修复3.C D 发展趋势 算法突破 AI赋能 应用拓展 AI应用:-自动生成/转换-风格迁移/增强 (纹理生成)(自动化 真实感)逻辑链条逻辑链条1.材质还原跟图片生成存在不同,比如存在光影问题,需要针对性解决2.材质生成通过多元技术融合,推动3D内容制作提质增效本质洞见本质洞见材质还原基于几何模型的空间结构特征,生成真实感材质与纹理映射。质感重构,真实再现质感重构,真实再现18A:高斯泼溅是一种实时3D渲染技术B:使用高斯分布描述三维空间点C:具备多项技术优势D:应用场景

21、广泛核心观察核心观察1.A B 技术原理 光栅化 高斯函数描述 精确场景表达 属性:位置 协方差 颜色 不透明度2.C 性能三角:-高品质渲染(NeRF)-实时性能(100fps1080p)-训练效率(单纯压缩规模 则 提升效率 模态叠加逻辑链条逻辑链条1.端侧模型不是越小越好,而是够用更好、好用最好2.设备算力决定了最优模型规模,未来终端需求将呈多样化3.多模态能力是突破通用计算的关键,仍有强需求本质洞见本质洞见39A:大模型发展有两种路线:单一系统(快思考)vs 双系统结合(快+慢思考)B:端侧资源约束要求最优化使用C:Agent 是连接模型与应用的关键核心观察核心观察1.为什么需要Age

22、nt?A+B 双系统路线更适合端侧 资源有限性 任务复杂性 生态多样性2.Agent如何创造价值?B+C 双重价值实现 资源优化:任务分解、按需调用 生态连接:跨应用协作、UI理解3.发展趋势:技术:从单一模型到多智能体协作 生态:从封闭应用到开放服务 交互:从指令执行到场景理解逻辑链条逻辑链条1.Agent不是锦上添花,而是端侧AI的必需品2.Agent的作用远不止于目前,未来,平台竞争将围绕 Agent能力展开本质洞见本质洞见端侧Agents在终端设备上自主运行的智能代理程序,具备感知、决策、执行的闭环能力。自主循环,智在边端自主循环,智在边端40A:传统GPU架构面临存储墙瓶颈B:存算一

23、体架构实现突破性提升C:超快推理或将重构AI应用形态核心观察核心观察1.A 传统架构局限:存算分离制约性能 数据搬运消耗巨大 并行计算效率受限2.B 架构创新:Groq:LPU一维处理器阵列 Cerebras:晶圆级存算集成 英伟达:HBM近存优化3.A+B C:应用变革 思考更敏捷:-深度推理成本降低-多方案实时对比 交互更自然:-实时语音对话-动态应用生成逻辑链条逻辑链条1.存算分离到存算一体是计算架构的范式转换2.推理速度的量级提升,将重构人机交互模式3.市场成熟度与技术突破之间存在时间差,需要通过应用场景培育推动发展本质洞见本质洞见AI芯片高效执行人工智能算法的专用集成电路,通过并行计

24、算单元阵列实现模型加速。算力凝芯,效能焕发算力凝芯,效能焕发41A:传统读屏停留在机械识别层面B:Ferret-UI等实现了智能理解突破C:读屏或将成为端侧智能的基础设施D:读屏或带来数据安全与隐私等新问题核心观察核心观察1.A B:能力跃迁 从简单识别到智能理解 从固定流程到动态适配 从单一操作到任务推理2.B C:基础设施化 视觉理解:屏幕内容完整解析 意图理解:自然语言指令转换 行为执行:跨应用任务编排3.C+D:技术实现路径:底层突破:能力构建:生态价值:逻辑链条逻辑链条1.UI理解是智能交互的核心入口2.读屏技术正从工具走向平台,但须解决数据安全问题3.进一步或将重塑整个端侧交互范式

25、和应用生态本质洞见本质洞见 多分辨率处理 细节增强采样 基础识别定位 高级推理交互 应用协作 智能交互读屏操作通过智能视觉分析解构界面结构与交互元素,实现对屏幕内容的理解与自动操作。解构识别,如臂使指解构识别,如臂使指42A:云端模型始终领先端侧一个量级B:用户数据实际大量存储于云端C:端云协同或不是选择,而是必然核心观察核心观察1.能力差异的演化:A Q1:两种条路线:云端:追求极限能力 端侧:追求效率平衡 Q1 R1:差异将持续存在且加大,不存在端侧赶超的可能性2.数据分布的现实 B Q2:纯端侧假设已被打破;Q2 R2:数据天然呈现混合分布:敏感数据:端侧存储 通用数据:云端存储 交互数

26、据:实时流动3.协同的深层必然性 (R1+R2)Q3:单一架构难以满足需求 Q3 R3:协同不是技术选择,而是架构必然 能力协同:优势互补 数据协同:动态流转 成本协同:资源优化逻辑链条逻辑链条1.端云不是简单分工,而是能力的有机融合,协同效应超越单一能力的叠加2.端云的边界正在消失,未来将形成动态流转的统一计算范式与AI基础设施本质洞见本质洞见端云协同端与云的计算资源动态调配机制,实现智能任务的最优分发与协作处理。智能调度,云端共生智能调度,云端共生43A:传统隐私保护依赖物理隔离B:新型隐私方案突破物理限制C:多元化解决方案正共存发展核心观察核心观察逻辑链条:1.认知转变:A Q1:物理隔

27、离的局限性 成本高昂 效率受限 体验割裂 Q1 R1:需要新型隐私保护范式2.技术突破:B Q2:突破传统边界约束:Q2 R2:形成新的保护模式 算力:云端托管 数据:加密流转 控制:用户主权3.生态演化 (R1+R2)Q3:不同场景要求不同;Q3 R3:多元化是必然选择 封闭生态:极致控制,如苹果模式:垂直整合 开放生态:灵活平衡,Cohere模式:水平协作 混合模式:场景适配逻辑链条逻辑链条1.范式转换:空间隔离逻辑隔离、静态保护动态保护、被动防御主动赋权2.隐私计算将从简单的隔离保护走向智能协同,重塑技术架构和服务模式本质洞见本质洞见隐私计算在数据加密状态下进行分布式协同计算,确保数据应

28、用与隐私保护的动态平衡。密而不绝,算而不泄密而不绝,算而不泄4445A:大模型不等于具身智能B:传统液压技术存在工程局限C:电动化成为新技术路线D:硬件基础设施仍需突破核心观察核心观察1.(A)具身智能具有复杂性 硬件限制 算法限制 工程实现 理论突破 AI能力 物理实现能力 演示性能 实用性能2.B C(技术路线转变)案例分析:-Atlas:液压电动 -Optimus:全电动架构 -Figure 02:电动+AI融合3.(技术突破)多维度进展:-本体控制 -灵巧手 -触觉传感 -表情模仿逻辑链条逻辑链条1.仍须提升:基础设施 控制算法 应用场景 综合能力提升2.人形机器人需要在身体能力上实现

29、突破,才能真正释放大脑的潜力本质洞见本质洞见人形机器人融合形态结构与认知交互的智能体,实现类人化的感知、决策与动作能力。形神兼备,智行合一形神兼备,智行合一46A:供应链成熟度制约产业发展B:成本远超预期目标C:中国供应链展现竞争优势D:国内企业推动多样化创新核心观察核心观察1.A B 产业困境 -Atlas(液压):$2M -Optimus(电动):$60K vs 目标$20K 原因:零部件定制化需求2.C 突破路径 案例佐证:-宇树G1:99K -众擎SE01:$20-30K (中国供应链)(成本优势 快速迭代)3.D 发展趋势 供应链创新:技术创新:-傅利叶:FSA执行器-众擎:谐波力控

30、关节 实践验证:技术验证 小规模量产 供应链成熟 规模化突破逻辑链条逻辑链条1.机器人零部件的成本问题,将决定具身智能的落地进展2.中国供应链有望重复新能源汽车的成功,通过成本优化推动产业规模化发展本质洞见本质洞见机器人供应链机器人核心部件(动力、传感等)及标准化模块的供应体系与产业链条。硬核汇聚,零整相成硬核汇聚,零整相成47A:空间智能是具身智能的关键基础B:3D数据获取是主要瓶颈C:数据与算法双轨并进D:空间智能复制ImageNet成功路径核心观察核心观察1.A 发展必要性 具身智能需求:-多维感知-空间理解-物理交互2.B C 突破路径 数据创新:-数字表亲(ACDC)-WonderW

31、orld(FLAGS)技术突破:-ReKep框架-关系关键点约束 (空间智能)(数据基础 算法创新)3.D 发展模式 ImageNet路径复制:经验复制 维度升级 2D图像 3D场景 标注分类 空间关系逻辑链条逻辑链条1.空间智能要做的是ImageNet路径复制与维度升级2.价值巨大,通过数据积累与算法创新,为具身智能构建认知世界的基础能力本质洞见本质洞见空间智能通过多维感知和理解来构建三维世界模型,实现空间定位、场景理解与环境交互的认知系统。洞悉维度,空间致知洞悉维度,空间致知48A:市场需求驱动技术发展B:三类关键价值方向浮现C:实际落地需考虑比较优势D:数据积累是重要目标核心观察核心观察

32、1.A 市场优先原则:技术 市场成功 案例佐证:-增程式电动车-苹果终端 技术创新 市场匹配 工程实现 数据增长 (规模扩张)(数据限制 效益递减)2.C 技术转折点 传统路径局限:预训练依赖数据量,需要寻找新的增长点 -模式匹配 推理能力 -直觉模仿 自主思考3.D 突破方向 新范式探索:更多类似人类进化的新Scaling模式,慢思考、稀疏数据等 -Agent自主性-合成数据生成-推理时计算 -生物学方法逻辑链条逻辑链条1.AI正在突破传统Scaling范式,探索更高效的智能涌现机制2.新的增长点,或来自于生物学而非仅是物理学启发3.类似人类进化的新Scaling模式,而非简单的线性扩展本质

33、洞见本质洞见Scaling Law模型规模与能力的基础增长规律,揭示智能涌现的量变质变辩证关系。量变质变,智慧涌现量变质变,智慧涌现54A:多模态视觉交互能力上线B:实时互动体验显著提升C:人格化特征逐步完善D:竞争压力日益加剧核心观察核心观察1.A B 功能突破 能力拓展:-视频通话理解-屏幕内容共享-实时教学指导 创新方向:单一模态 多维交互 被动响应 主动引导 (交互升级)(多模态 实时性)2.C 交互升级 人性化特征:-情感化反馈-多样化声音-记忆与学习3.D 市场竞争 OpenAI与谷歌对比:-功能相似度高-时间差劣势-技术实力待证 技术跟进 创新引领 功能对标 场景创新逻辑链条逻辑

34、链条1.高级视频语音效果惊艳,但同样在技术上不存在明显的竞争壁垒2.竞争者需在多模态交互基础上,探索独特价值与应用场景本质洞见本质洞见高级视频语音模式将AI助手能力扩展到实时视频通话场景,通过多模态交互实现沉浸式对话体验。视听通感,如临其境视听通感,如临其境55A:AI进入通用智能新阶段B:规模定律遇到数据瓶颈C:强化学习成为新范式D:产品能力由模型决定,正在发生改变核心观察核心观察1.A 通用智能形成条件 必要因素:-互联网数据积累-算力突破 -Transformer架构 (因素缺失)(通用智能)数据规模 算力限制 范式创新需求2.B C 范式转变 数据瓶颈:-优质数据耗尽-专业数据不足 强

35、化学习突破:-自我对弈-思维链生成-推理时间延长 突破路径:被动学习 主动思考 即时响应 延时推理3.D 产品发展规律 算力转移:训练端 推理端 技术能力 产品能力 通用助理 超级应用逻辑链条逻辑链条1.AI正从规模定律向强化学习转变,通过主动思考突破数据瓶颈限制本质洞见本质洞见慢思考通过递进式的深度推理和验证机制,构建系统化的思维链路以获得可靠结论。循序渐进,深思熟虑循序渐进,深思熟虑56A:合成数据易,高质量合成数据难B:合成数据的研究方法不断发展(如英伟达、World Labs等)C:合成数据的评估是自循环的关键核心观察核心观察1.A 价值递进:数据量 数据质量 数据结构 质量提升的两难

36、:结构化程度 真实性 2.B 系统进化:工具属性:-数据制造-规模扩充 生态属性:-知识重组-自我优化 结构化 语义化 模块化 数据的可理解性 范式转变:合成数据是知识创造过程,而非简单的数据制造3.C 未来方向:合成范式:单向生成 对抗验证 系统共生 自我进化 最终目标:数据工具 知识系统 规模扩张 质量提升逻辑链条逻辑链条1.合成数据的量变并不能直接产生质变,数据的质量、结构至关重要2.合成数据需要从扩充数据转向创造知识,通过系统化方法提升训练数据质量本质洞见本质洞见合成数据利用规则和模型构造的人工数据集,补充现实数据的不足并增强训练效果。衍生多样,增益求真衍生多样,增益求真57A:MoE

37、由专家模型与门控网络组成B:架构具有稀疏性与扩展性特征C:支持多任务学习与知识共享D:在多领域展现应用价值核心观察核心观察1.A 基础架构 组件构成:-专家模型(任务处理)-门控网络(动态路由)(MoE系统)(专家分工 动态调度)2.B C 核心特征 技术优势:-稀疏激活降低开销-灵活扩展应对复杂性-多任务共享知识 优化方向:计算效率 模型性能 架构扩展性3.D 应用价值 落地场景:-NLP:翻译/问答-CV:分类/检测-推荐:个性化服务 挑战权衡:性能提升 vs 复杂性增加 灵活性 vs 训练稳定性逻辑链条逻辑链条1.MoE架构为模型预训练提供了一条有效的路径,突破规模上限2.MoE通过专家

38、分工与动态调度,实现计算效率与模型性能的优化本质洞见本质洞见MoE架构动态路由到不同专家网络的混合系统,实现大规模模型的条件计算和稀疏激活。分工协作,智慧共融分工协作,智慧共融58A:多种硬件架构各有特色B:算法与芯片深度融合C:不同场景有差异化需求D:应用领域持续扩展核心观察核心观察1.A 硬件特征分析 处理器对比:-CPU:高主频(3.51GHz)/大缓存优势-ASIC:专用高效/能耗优化 -GPU:并行计算强/功耗高限制-FPGA:灵活可编程/场景定制2.B 技术融合案例 -Groq LPU:内嵌SRAM/500T ops -AlphaChip:强化学习优化布局3.C D 场景应用 (应

39、用场景)(性能需求资源约束)最优架构选择 -自动驾驶:实时性要求 -金融分析:风险控制 -医疗诊断:精确性需求 -智能家居:交互体验逻辑链条逻辑链条1.除GPU外,将从通用处理迈向专用优化加速,并推进AI基础设施协同优化2.AI加速推理需要基于场景、性能、能效等,选择合适架构实现性能优化本质洞见本质洞见加速推理深度定制模型结构与芯片架构,实现高效能的推理计算。芯模相融,提速增效芯模相融,提速增效59A:开闭源争论反映商业策略差异B:开源模型与开源软件有区别C:大模型开源受到高度关注D:商业可持续性面临挑战核心观察核心观察1.A 商业策略分化 路线选择:开闭源并存 差异化竞争 -纯开源:Meta

40、等重社区 -双轨并行:微软等重生态 -纯闭源:OpenAI等重商业2.B 开源特点 区别开源软件:-仅开放部分参数-缺乏完整技术细节-社区贡献受限3.C D 市场现状 需求维度:-企业研发验证-低成本应用-安全自主可控 生存挑战:-负毛利运营-商业模式待解-行业整合加速 技术路线 商业模式 开源闭源 市场需求逻辑链条逻辑链条1.区别于开源软件,大模型的开源并不是拿来即用2.开源模型受到广泛关注,但与闭源比较各有优劣,最终将由市场需求决定竞争格局本质洞见本质洞见开源生态基础模型通过开放协议释放能量,形成自组织协同进化的创新共同体。汇智共创,生生不息汇智共创,生生不息60逻辑操作符说明逻辑操作符说

41、明逻辑符号逻辑符号1.非(否定):表示对一个命题的否定。例如,p 表示“不是 p”或“p 不成立”。2.全称量词:表示“对于所有”,例如 x P(x)表示“对于所有 x,P(x)都成立”。3.存在量词:表示“存在”,例如 x P(x)表示“存在某个 x,使得 P(x)成立”。4.充分条件:pq 表示“如果 p 成立,那么 q 也成立”,即“p 是 q 的充分条件”。5.且(与):表示两个命题都为真时,整体结果才为真。例如,pq 表示“p 且 q 都为真”。推理符号推理符号1.推导关系:表示“可以推导出”,例如 pq 表示“从 p 可以推导出 q”。2.等价关系:表示两个命题可以互相推导。例如,

42、pq 表示“p 和 q 是等价的”,即 p 与 q 可以互相推导。推理法则推理法则1.双重否定律:p p,表示否定一个命题的否定与原命题等价。2.对置律:(p q)(q p),表示“如果 p 推出 q,那么 q 推出 p”。3.传递律:(p q)(q r)(p r),表示如果 p 推出 q,并且 q 推出 r,则 p 推出 r。61AI50AI50关键词附录关键词附录腾讯研究院AI速递AI每周关键词Top50科技九宫格短视频AGI路线图圆桌AGI路线图专题AIS百人百问62项目顾问:项目顾问:司晓、冯宏声、刘琼项目策划:项目策划:李瑞龙、袁晓辉研究团队:研究团队:李瑞龙、曹士圯、袁晓辉、徐思彦联合研究:联合研究:李继刚、数字生命卡兹克研究团队研究团队63

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(腾讯研究院:2025年AI图景解码50关键词(64页).pdf)为本站 (颜如玉) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
会员动态
会员动态 会员动态: 关闭

139**63... 升级为至尊VIP wei**n_... 升级为至尊VIP

wei**n_... 升级为高级VIP wei**n_... 升级为标准VIP

wei**n_... 升级为至尊VIP wei**n_... 升级为高级VIP

艾**... 升级为至尊VIP 185**18... 升级为至尊VIP

155**56... 升级为高级VIP 155**56... 升级为标准VIP

137**56... 升级为高级VIP wei**n_... 升级为至尊VIP

wei**n_... 升级为至尊VIP wei**n_... 升级为至尊VIP

wei**n_... 升级为标准VIP wei**n_... 升级为高级VIP

人**... 升级为至尊VIP wei**n_... 升级为高级VIP

wei**n_... 升级为至尊VIP 188**27... 升级为高级VIP

159**20... 升级为标准VIP wei**n_... 升级为标准VIP

wei**n_... 升级为至尊VIP 158**62... 升级为至尊VIP

wei**n_... 升级为至尊VIP wei**n_... 升级为至尊VIP

gu**i 升级为至尊VIP wei**n_... 升级为至尊VIP

138**89... 升级为高级VIP wei**n_... 升级为高级VIP

wei**n_... 升级为至尊VIP wei**n_... 升级为至尊VIP

159**17... 升级为高级VIP 152**09... 升级为至尊VIP

wei**n_... 升级为高级VIP wei**n_... 升级为至尊VIP

133**01... 升级为至尊VIP wei**n_... 升级为高级VIP

wei**n_... 升级为标准VIP 159**37... 升级为高级VIP

wei**n_... 升级为标准VIP 176**14... 升级为至尊VIP

wei**n_... 升级为至尊VIP 储伟 升级为标准VIP

wei**n_... 升级为标准VIP 151**97... 升级为标准VIP

wei**n_... 升级为高级VIP wei**n_... 升级为至尊VIP

rac**ll... 升级为高级VIP 186**21... 升级为至尊VIP

J**e 升级为标准VIP wei**n_... 升级为至尊VIP

wei**n_... 升级为至尊VIP 178**48... 升级为高级VIP

139**57... 升级为高级VIP wei**n_... 升级为标准VIP

wei**n_... 升级为高级VIP 135**97... 升级为标准VIP

维维**6 升级为标准VIP wei**n_... 升级为至尊VIP

181**09... 升级为至尊VIP wei**n_... 升级为高级VIP

158**47... 升级为标准VIP 150**75... 升级为标准VIP

范** 升级为至尊VIP 156**18... 升级为标准VIP

wei**n_... 升级为至尊VIP 131**12... 升级为标准VIP

186**14... 升级为至尊VIP wei**n_... 升级为至尊VIP

微**... 升级为标准VIP KY**ZY 升级为高级VIP

wei**n_... 升级为至尊VIP wei**n_... 升级为标准VIP

wei**n_... 升级为标准VIP wei**n_... 升级为至尊VIP

院**... 升级为至尊VIP 老**... 升级为至尊VIP

wei**n_... 升级为高级VIP 137**80... 升级为至尊VIP

158**15... 升级为至尊VIP wei**n_... 升级为至尊VIP

wei**n_... 升级为至尊VIP wei**n_... 升级为至尊VIP

wei**n_... 升级为至尊VIP wei**n_... 升级为至尊VIP

wuz**en... 升级为至尊VIP 189**29... 升级为至尊VIP

wei**n_... 升级为至尊VIP wei**n_... 升级为高级VIP

wei**n_... 升级为标准VIP wei**n_... 升级为高级VIP

临渊 升级为至尊VIP wei**n_... 升级为高级VIP

189**47... 升级为至尊VIP wei**n_... 升级为高级VIP

wei**n_... 升级为高级VIP wei**n_... 升级为标准VIP

gen**ia... 升级为高级VIP 138**79... 升级为至尊VIP