08-面向 GenAI 时代的 LOKAI 基础设施挑战与实践 -Zhenyu Zheng.pdf

编号:621002 PDF 9页 1.02MB 下载积分:VIP专享
下载报告请您先登录!

08-面向 GenAI 时代的 LOKAI 基础设施挑战与实践 -Zhenyu Zheng.pdf

1、面向GenAI时代的LOKAI基础设施挑战与实践郑振宇 OpenAtom openEulerGenAI 时代云基础设施的机遇与挑战2024全年云基础设施花费达到$330 Billion,较2023年上涨22%,较2022年上涨44.7%ChatGPT于2022年底发布,与基础设施业务爆发式增长节奏相匹配调查表明,超过半数基础设施增长源于GenAI业务Source:Synergy data and analysis 近半数GenAI业务自部署AI基础设施软件栈Source:Linux Foundation ResearchGenAI 时代云基础设施的机遇与挑战LinuxKubernetes(Cl

2、oud Native)OpenStack(Cloud)AI StackX86ARMGPUNPUopenEulerUbuntuCentOSOpenStackAWSAzureKubernetes硬件使能OneAPIKleidiAICUDACANNAI框架PyTorchTensorFlowMindSporePaddle加速库vLLMDeepSpeedLlama.cppSGlang模型LlamaDeepSeekStableDiffusionQwen应用ChatCodingPic GenVideoHardware核心挑战:算力支持:硬件种类繁多,GenAI时代大规模集群与异构融合成为刚需;算力释放:加速

3、库与训、推工具链全量支持,硬件使能层释放多样性算力;软件生态:丰富的AI软件生态,加速库与训、推工具链全量支持,释放多样性算力;集群能力:集成云与云原生能力,打造坚实、灵活的算力底座;快速响应:AI软件栈日新月异,快速使能、快速集成、快速响应;OPEA:AI应用E2E快速部署Open Platform for Enterprise AILF AI&DATA 旗下开源项目为用户提供端到端企业级GenAI应用部署方案:用于构建生成式人工智能解决方案的组件,包括检索增强:生成式人工智能模型-大型语言模型(LLM),大型视觉模型(LVM)等。系统组件-例如,嵌入模型;向量数据库;排序,提示处理等。用于

4、构建AI代理和创建完整端到端生成式人工智能流程的组合能力用于微调、定制和优化的工具,包括数据中心/本地设置各种经过验证、准备就绪的端到端参考流程v1.2 Released in 2025.1.2722个企业级GenAI应用https:/opea.dev/openEuler:多样性算力支持、易用稳定的Linux发行版算力支持:Arm/x86/RISC-V/GPU/NPU/DPU/Power/算力全量支持;算力释放:主流加速库与工具链全栈使能核心加速库全量验证,支撑算力释放;软件生态:主流框架全部支持,海量模型开箱即用,使能应用开发;集群能力:使能异构算力融合,集群资源动态调整,节点间异构设备协同,推理场景性能相对提升20%;社区响应:极具活力的开源操作系统社区;22个E2E GenAI应用https:/opea.dev/100+官方容器镜像Docker Official Supported OSS is cheap,show me the DEMOAvatarChatbothttps:/opea-project.github.io/latest/GenAIExamples/AvatarChatbot/README.htmlopenEuler+OPEA Demo Placeholder了解更多关于openEuler的内容Thanks.

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(08-面向 GenAI 时代的 LOKAI 基础设施挑战与实践 -Zhenyu Zheng.pdf)为本站 (张5G) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
折叠