《03-Build high-accuracy Generative AI application on enterprise data-Zheng Yubin.pdf》由会员分享,可在线阅读,更多相关《03-Build high-accuracy Generative AI application on enterprise data-Zheng Yubin.pdf(35页珍藏版)》请在三个皮匠报告上搜索。
1、构建基于企业数据的高精度生成式人工智能应用郑予彬开发者布道师亚马逊云科技目录生成式AI在企业中的转化潜力01如何优化云上Gen AI 工作负载03RAG架构-连接企业数据与大语言模型02Content生成式AI在企业中的转化潜力Part 01Data流数据处理大数据分析数据库数据可视化数据湖仓多数据源融合数据治理Generative AI 应用GenAI 应用植根于数据平台数据驱动型公司可实现每年30%+的速度增长68%的企业表示仍然无法从数据中获取高价值只有 28%的企业反馈已建立数据文化Accenture,“Closing the Data-value Gap,”https:/accntu
2、.re/33V6sU3Accenture,“Closing theData-value Gap,”https:/accntu.re/33V6sU3Forrester,“Insights-Driven Businesses Set the Pace for Global Growth,”hHps:/bit.ly/3r4uRiL企业迫切需要转变为构建数据驱动型公司数据集成Data Ingestion数据处理和存储Data Processing&Storage数据转换和建模Data Transformation&Modeling机器学习Machine Learning分析 Analytics作业调度
3、 Job Scheduling&工作流自动化 Workflow Automation数据源构建数据平台是实现数据驱动型公司的关键RAG架构-连接企业数据与大语言模型Part 02企业数据训练专属预训练模型微调预训练模型检索增强生成(RAG)持续预训练企业的数据是关键的差异化因素构建生成式 AI 解决方案的主流方法复杂简单采用难度训练专属预训练模型微调预训练模型检索增强生成(RAG)持续预训练企业的数据是关键的差异化因素增 强 提 示专 有 数 据 源答 案/响 应Retrieval augmented generation(RAG)1用 户 查 询Amazon Titan Text Expre
4、ss基础模型Anthropic Claude 2.1AI21 Labs Jurassic 2Meta Llama 245623基 础 模 型输 入生 成生 成RAG的主要优势在于它能够将外部知识库的信息与语言模型结合,从而生成更准确、更相关的回答。这种方法特别适合需要访问专有数据或最新信息的应用场景Large Language ModelPrompt augmentationResponseRAG 工作流程Embeddings modelData sourceVector storeEmbeddings modelEmbeddingUserUser InputContext-0.020.89-
5、0.38-0.530.950.17文本生成工作流程数据摄入工作流程Semantic searchDocument chunks输入转化为向量语义搜索撇配相关内容生成上下文进行prompt增强文档分块存入向量数据库结合外部知识,提高回答准确性和相关性,支持实时数据更新,处理私有或定制数据NoSQL 数据库数据仓库SQL 数据库流式处理大数据数据湖机器学习生成式 AI人工智能数据摄取数据处理原始内容提取的内容数据治理数据质量数据隐私集成转换处理批量摄取流式数据摄取物联网/设备第三方数据应用程序数据现有数据源日志数据目录数据共享数据洞见最终用户SaaS 数据生成式 AI 应用程序训练专属预训练模型微
6、调预训练模型检索增强生成(RAG)持续预训练数据集成OLTP数据预处理内容提取为生成式 AI 应用程序扩展数据摄取数据处理原始内容提取的内容数据治理数据质量数据隐私集成转换处理批量摄取流式数据摄取物联网/设备第三方数据应用程序数据现有数据源日志数据目录数据共享数据洞见最终用户SaaS 数据生成式 AI 应用程序训练专属预训练模型微调预训练模型检索增强生成(RAG)持续预训练数据集成OLTP数据预处理内容提取为生成式 AI 应用程序扩展HTML电子邮件JPEG/PNG音频转写PDF扫描件文档文档非结构化数据源https:/ AI 工作负载Part 03现代化的容器平台可以高效地管理调度计算资源,