《汽车行业基础模型高效训练实例分享.pdf》由会员分享,可在线阅读,更多相关《汽车行业基础模型高效训练实例分享.pdf(16页珍藏版)》请在三个皮匠报告上搜索。
1、 2024,Amazon Web Services,Inc.或其附属公司。保留所有权利。2024,Amazon Web Services,Inc.或其附属公司。保留所有权利。在亚马逊云科技上为汽车和 OEM 客户从零开始高效训练基础模型Han Man,PhD(文翰斌)Principal Science Manager,GenAI/ML数据科学首席经理 亚马逊云科技唐俊杰Principal Consultant 德国首席顾问 亚马逊云科技 2024,Amazon Web Services,Inc.或其附属公司。保留所有权利。汽车和制造业中的生成式 AI常 见 期 望 效 益3提高效率和生产力新的
2、商业模式和收入来源借助 AI 减少创新的时间和成本 2024,Amazon Web Services,Inc.或其附属公司。保留所有权利。合同、标准操作程序、产品、操作和支持文档工程和设计规范、供应链优化、工艺优化客户服务和代理协助通过应用程序和车载系统提供的个性化媒体体验3D/2D产品图像及部件代码生成以加快上市速度设计复用搜索面向 X 的设计用于产品和工艺测试的合成数据个性化的培训针对特定需求的技能提升虚拟指导(如设计、维护等)搜索手册、工作指导书、技术文档汽车和制造业中的生成式 AI常 见 用 例4设计生成客户体验知识管理研究生成会话用例文本生成和摘要 2024,Amazon Web S
3、ervices,Inc.或其附属公司。保留所有权利。数据发现5机遇大部分驾驶数据看起来像是这样的:但有用的数据看起来是这样的:2024,Amazon Web Services,Inc.或其附属公司。保留所有权利。数据发现6使用自然语言进行搜索 2024,Amazon Web Services,Inc.或其附属公司。保留所有权利。一个旨在发布、学习和试验各种模型的知名内部研究小组一家客户正在寻求帮助以建立高效的基础设施用于测试内部和外部生成式 AI 用例庞大的内部数据宝库,可用于定制基础模型训练,如移动数据等九个月前,一家大型汽车制造商客户找到我们,评估内部基础模型的可行性客户旅程 2024,A
4、mazon Web Services,Inc.或其附属公司。保留所有权利。生成式 AI 应用存 储数 据 库、分 析 和 数 据 湖治 理 与 合 规 性数 据 集 成数据基础使用您的数据从零开始训练的好处数据的分量通用生成式 AI了解您的业务和客户需求的生成式 AI外语聊天内部代码定制机器人 2024,Amazon Web Services,Inc.或其附属公司。保留所有权利。让生成式人工智能处理检索增强生成(RAG)微调学习数据的基本结构通过“下一个 token”预测进行半监督学习需要大量的计算机和数据资源持续预训练更改底层模型的部分层改变模型的领域或风格“方式”例如,特定任务或指令调优特
5、定上下文的聊天机器人“内容”检索以增强模型生成评估的内容专业化提示工程1份文档-10至100个 token100份文档-1万个token10至1000亿个 token1000 x10Mx 2024,Amazon Web Services,Inc.或其附属公司。保留所有权利。客户基础模型和用例Llama27B,13B,70BStableLM7B大语言模型 +“外语”语言模型编程大语言模型视觉条件大语言模型(VLMs)大行为模型(LBMs)CodeLlama34BLLaVA7B,13B-训练数据模型纯文本内部聊天机器人,跨语言内部聊天机器人960亿个 token 的英语数据集,140亿个 toke
6、n 的“外语”数据集,100亿个 token 的维基百科数据,用于维持英语的保真度内部 Python 编程助手使用1万亿个 token 的红睡衣数据集进行持续预训练多模态内部聊天机器人视觉/语言对齐55.8万个图像-标题对多模态指令调优66.5万个提示-目标生成对机器人任务规划7.6万个演示轨迹,350小时的交互数据,564个场景,86个任务用例超越 LLaVa 1.5 并减少 30%计算量 2024,Amazon Web Services,Inc.或其附属公司。保留所有权利。基础模型预训练的工作流程效率图像代码文