当前位置:首页 > 报告详情

unlocking-llm-performance-with-ebpf-optimizing-training-and-inference-pipelines-chuan-hui-ebpfji-xi-llmxia-daep-xiao-zhen-relia-fa-qiu-yang-xiang-yunshan-networks-inc-1.pdf

上传人: 山海 编号:627390 2025-02-21 37页 8.08MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了大规模语言模型(LLM)训练和推理过程中存在的效率挑战,并提出了一种基于eBPF(扩展Berkeley数据包过滤器)的零代码观测性解决方案。文章首先指出了现有解决方案和工具的问题,如NVIDIA Nsight和PyTorch Profiler等,然后详细介绍了使用eBPF进行零代码观测性的方法,并通过实际案例展示了其在PyTorch中的全栈剖析和D-追踪的应用。文章还讨论了eBPF在AI/HPC训练工作流中的观测性需求,以及在在线推理服务中的分布式追踪能力。最后,文中提到了eBPF在华为、字节跳动等公司的实际应用,并展示了其在分布式服务架构中的优势和挑战。
"如何优化LLM训练与推理效率?" "eBPF技术在AI训练和推理观测中的优势是什么?" "如何通过零代码全栈观测性解决LLM应用中的性能挑战?"
客服
商务合作
小程序
服务号
折叠