当前位置:首页 > 报告详情

keynote-running-llms-in-the-cloud-xi-daepnanoai-chan-bo-yun-nf-miley-fu-developer-advocate-second-state.pdf

上传人: 山海 编号:627250 2025-04-21 13页 22.09MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
Miley Fu是开源技术的贡献者,她在GitHub上活跃,主要贡献于WasmEdge和LlamaEdge项目。WasmEdge是一个支持WebAssembly的运行时,而LlamaEdge是一个简化的大型语言模型(LLM)部署和推理的工具。该项目允许开发者将LLM嵌入到容器应用程序中,并确保应用程序与LLM版本紧密耦合,即使LLM升级,应用程序也能正常工作。LlamaEdge的主要特点包括:轻量级(仅5GB大小)、便携式(支持跨CPU和GPU)、易于集成(支持Rust/JS/Python)、与现有容器工具(如K8s)兼容。实际应用案例包括:个人LLM(如Gaia Network)、AI操作系统、金融分析机器人、硬件机器人语音控制、教育辅导以及游戏引擎(如Cocos AI)。此外,LlamaEdge支持单一代码跨平台二进制文件,能够利用本地硬件加速器,并且可以通过K8s将应用程序部署到新的硬件上。与传统的Python运行时相比,WasmEdge和LlamaEdge的Docker镜像大小只有其十分之一。
"如何将大型语言模型嵌入容器应用程序中?" "如何在不同的硬件平台上轻松部署和使用大型语言模型?" "大型语言模型在实际应用中有什么具体的使用案例?"
客服
商务合作
小程序
服务号
折叠