《破局全球AI算力-技术出海的关键决策与实践指南(public).pdf》由会员分享,可在线阅读,更多相关《破局全球AI算力-技术出海的关键决策与实践指南(public).pdf(21页珍藏版)》请在三个皮匠报告上搜索。
1、破局全球AI算力:技术出海的关键决策与实践指南PPIO派欧云联合创始人&CTO 王闻宇王闻宇技术型连续创业者,2004年参与中国第一代互联网视频服务PPTV(PPlive)的创立,从第一行代码构建了PPTV 的分布式视频服务,并创新多项 P2P 直播技术,服务全球近5亿用户;2014年二次创业极豆车联网,研发了中国首个车载智能系统“极豆OS”,产品服务于奥迪、宝马、奔驰等国际知名车厂;2018年联合创办PPIO派欧云,聚焦分布式算力。技术领域主要聚焦在分布式计算、云原生、AI Infra 等。拥有20多年的分布式网络技术和音视频云服务架构经验,发表边缘计算、人工智能、大模型相关SCI 论文15
2、篇(其中CCF-A/中科院1区8篇),申请并授权发明专利20余件。为什么出海最近那么热需求在出海大量成功出海 App开放自由的市场中国工程师红利海外vs国内应用发展的差异和逻辑辑海外海外国内国内需求来源ToC爆发ToB/ToG创新主导Developer/Startup大厂创新团队规模 几个人,十几个人几十人/几百人技术心智拿来主义自研主义逻辑差异:1.资本市场差异2.市场自由程度3.流量公正性4.科技成本差异DeepSeek R1 之后,貌似市场情况有些改观,出海ToC创业公司心智初创期快速验证产品,不在乎成本/数据/独特性;调用Chatgpt(RAG+Agents)等闭源接口增长期开始关注成
3、本,推理成本占比40%,收到账单后阿彩发现好贵,开始尝试开源模型,调廉价开源模型API壁垒期开始思考如果建立特色,在乎数据,在乎独特性,尝试自有数据的Fine-tuning,坚定基于开源优化模型科学家型创业公司例外23年 Llama 开源的刚出现国内海外娱乐类 toC App弱AI场景(对智能要求不高)API调用量高速增长私有化+Fine-tuning 潮大量公司,认为自己可以部署一套行业“ChatGPT”无需考虑性能问题,无需考虑数据隐私问题但是 Llama的中文能力不行,Llama 无信息管制于是用自己的行业数据去做 Llama 的Fine-tuning 成行业数据很快,出现了大量 私有化
4、 Fine-tuning的机会25年 DeepSeek R1刚出现国内海外大量主流场景从 OpenAI-DeepSeek强AI场景(对智能要求高)效果差不多推理成本1/20开源私有化+Distill 潮大厂App 从自研模型 DeepSeek大量公司,认为自己可以部署一套自己的 R 1但是很快发现,部署满血版的成本太高了,H20 x8x2于是开始部署蒸馏模型,或者用自己问题对满血版做蒸馏,然后再去Fine-tune Llama3或者QWen我们为什么做海外公司基因:更善于做市场化需求技术能力:技术能力硬,面对海外公司有些独特的优势启动市场:跟着大量中国出海App一起出海市场更大:海外原生Glo
5、bal市场更大2023202320232023训练算力爆发推理算力爆发推理成本大幅下降(10X-100X)AI 推理成本AIGC 流量“Affordability”is all you need抓住不变的需求:找到“第一性原理”推理一直持续的需求,未来的推理成本一定持续降低,并伴随着用量规模的持续增加我们要十年时间持续做的事情就是,怎么在做到满足需求的情况,让推理的性价比足够高。派欧算力云:适合推理的云闲置数据机房空间企业闲置算力资源整合资源提供服务区域DC汇聚机房专业服务IDC接入机房中小企业机房节点间SDN互联运营商机房边缘容器云边缘裸金属云IaaSPaaS音视频类实时云渲染类AI推理类中
6、心云用户终端云原生云边协同分布式调度管理接入网就近连接MAN/LAN/5G RANPPIO派欧云技术实践指南为什么推理成本会持续很贵生产资料昂贵ScalingLawLLM 参数和序列都还在扩大视频生成的到来超长序列发展太快还没有深度优化我们在是怎么把推理成本降下来的降低生产资料成本分布式云降低 GPU成本降低电费降低其他场地/运维推理加速模型压缩全球网络加速Serverless分布式云充分动员市场社会驱动力算力新基建新质生产力闲置利用技术驱动力CloudNativeDevOps/AIOps高性能网络弹性和调度经济驱