当前位置:首页 > 报告详情

2024龙蜥大会技术实践分论坛:PyTorchCompile模型优化和应用-朱宏林.pdf

上传人: 张** 编号:175498 2024-09-11 15页 4.90MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
阿里云程序语言与编译器团队负责研发编程语言、运行时,并专注于通过软硬件结合优化系统性能,其产品和技术包括AJDK、Alibaba GCC/LLVM和AI优化软件栈等,并被多个操作系统和顶会收录。PyTorch compile技术通过Dynamo、AOT Autograd和Inductor生成针对GPU、C++和Aten op的目标代码。实际应用中,通过替换默认frame evaluation、修改bytecode,以及pattern matching等技术,实现了self-attention、SDPA、flash-attn等优化。研发范围包括AC2镜像等。
"PyTorch Compile如何优化AI模型性能?" "阿里云如何通过编译器技术提升PyTorch应用效率?" "在AI模型优化中,SDPA和FlashAttention有何不同?"
客服
商务合作
小程序
服务号
折叠