1、领军路径分歧:更大的模型还是更低的成本? AI全行业赋能系列深度研究之五 证券分析师:刘洋A0230513050006、洪依真A0230519060003、施鑫展 A0230519080002、周海晨A0230511040036 2021.12.13 2 结论结论 以商汤、旷视为代表的AI明星在平台上有什么特别的布局? 自研了深度学习训练、推理平台,大量算法积累,AIDC算力支持; 商汤科技:SenseCore大模型+小模型,降低AI应用落地成本; 旷视科技:Brain+平台支撑了跨行业AIoT解决方案。 深度学习开源训练框架格局如何?国内AI公司自研深度学习框架有何种意义? TensorFl
2、ow、PyTorch、MXNet、CNTK已可以满足工业界、学界的绝大部分要求; 技术遗留问题:静态图、动态图技术方案都还有缺陷,有同时解决的可能性; 国产平台由于技术遗留问题、国产化等适配性等原因可能仍有空间。 为何AI大模型成为趋势?复现大模型的难度在哪里? 以GPT为代表的大模型能大幅降低对数据量的需求,预训练大模型+细分场景微调,更适合长尾落地。 但对存储、算力要求极高,普通机构难以复现。商汤、旷视在复现大模型上有算力、训练推理平台优势。 对于必然的碎片化AI落地,不同公司路径差异在哪里?哪种路径可能胜出? 更大的模型路径:较高软件占比,硬件外采;大规模参数的通用模型,极高的首次开发成
3、本;模型长尾投 入理想状态接近0;适合额外硬件建设较少,下游需求标准化程度强,产业链已有分工度高的行业; 更低的成本路径:自有生产线压缩硬件成本;小模型、小算力,较低的首次开发成本;中台复用等方式控 制成本。适合已有硬件基础差,需求标准化程度低,产业链已有分工度低的行业。 PYmWjW9UnVbWxUwV9P9RbRtRrRpNpOkPpOsQfQrQnR7NrRwPwMnQmQMYqRrQ 3 两种路径更适合的场景两种路径更适合的场景 3 算法和平台能力 全栈解决方案 硬 件 物 联 软 件 方 案 需要 额外 的硬 件建 设少 下游标准化程 度高 下游标准化程 度低 下游客户付费 能力强
4、下游客户付费 能力弱 产业 链分 工程 度高 产业 链分 工程 度低 智慧城市/安防 手机 需要 额外 的硬 件建 设多 工业智能化 物流 汽车 医疗 更低的成本 更大的模型 目录目录 1. AI产业链:从算力到应用 2. AI平台层:何种训练模型可以脱颖而出? 3. AI大模型:为何更大的模型成为行业新 趋势 4. AI明星:商汤、旷视自研平台亮点 5. AI碎片化问题:软件公司应对的两种路 径熟优? 4 5 1.1 AI1.1 AI行业产业链行业产业链工作流程视角工作流程视角 设计、实现、运行: 算法设计环节:机器视觉、语音识别、自然语音处理、知识图谱; 算法实现环节:深度学习框架,训练、
5、推理部署,对模型的调参优化; 算法运行环节:AI芯片和AIDC超算中心,提供硬件基础。 图:算法实现工作流程 资料来源:英伟达、英特尔、寒武纪官网,申万宏源研究 6 1.2 AI1.2 AI行业产业链行业产业链代表厂商代表厂商 资料来源:艾瑞咨询中国人工智能产业研究报告()2020,申万宏源研究 图:AI行业更领域代表性公司 7 1.2 AI1.2 AI芯片:突破芯片:突破NvNv壁垒的三种可能性壁垒的三种可能性 AI芯片的整体性能=AI芯片硬件性能(AI芯片厂商算子库和工具链+深度学习框架支持) AI芯片公司需 要做的软件 生态壁垒产生的 根源在于软硬件 的高度耦合 最大的工作量是对海量算子
6、 和特定芯片的支持 突破AI生态壁垒的三种可能机会 从苹果MacOS X案例可以推测,当任何一家 AI芯片公司能够从英伟达手中逐渐拿走10%份 额的时候,深度学习框架厂商也大概率会去逐 渐投入为该厂商的AI芯片去做特定优化。 AI编译器的成熟 芯片性能和英伟达相比具备明显优势 等待英伟达失误 1 2 3 AI芯片公司所采取不同突围路线 AI芯片公 司遇到了 不同的瓶 颈 AMD 华为 寒武纪 谷歌 兼容CUDA的路线,借 力英伟达生态 在走英伟达的路线 深度学习框架+AI芯片” 自研路线 难点在于其更新迭代速度永远跟不上CUDA并且很难做到完全兼容 华为:没有深度学习框架厂商主动支持,其自研的