当前位置:首页 > 报告详情

构建云原生的端到端生成式 AI 应用-肖元君.pdf

上传人: 张** 编号:153182 2024-01-15 29页 6.84MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了构建云原生的端到端生成式AI应用的相关议题。首先,提出了大模型推理面临的挑战,包括模型体量大、并行计算、基础设施设置成本、模型编译和托管成本等方面。然后,介绍了如何通过Amazon SageMaker和Amazon Bedrock降低这些复杂度。SageMaker支持多种推理引擎,如HF accelerate, deepspeed, fastertransformer等。而Bedrock则提供了一系列基础模型,如Claude 2, Command + Embed等,并支持自动将文本文档转化为Embedding内容。最后,文中给出了生成式AI的一些典型应用场景,如营销文案生成和营销图片生成,并以小红书种草文案生成为例,展示了SageMaker的流式推理能力。
如何利用Amazon SageMaker和Amazon Bedrock简化大模型推理的复杂度? 以RAG架构为例? 生成式AI在组织中有哪些最有前景的应用场景?
客服
商务合作
小程序
服务号
折叠