《厦大团队:2025年DeepSeek大模型及其企业应用实践报告-企业人员的大模型宝典(148页).pdf》由会员分享,可在线阅读,更多相关《厦大团队:2025年DeepSeek大模型及其企业应用实践报告-企业人员的大模型宝典(148页).pdf(148页珍藏版)》请在三个皮匠报告上搜索。
1、DeepSeek大模型及其企业应用实践林子雨 副教授厦门大学DeepSeek厦门大学大数据教学团队作品 2025年3月3日每个人都可以读懂的大模型科普报告(企业篇)厦门大学大数据教学团队团队联系方式:国内高校大数据教学的重要贡献者团队负责人:林子雨 副教授年轻力量:核心成员全部46周岁以下结构合理:教学型、科研型、实验工程师专注专业:从2013年至今,11年专注于大数据教学团队特点:眼光前瞻、紧跟技术、创新实干、执行力强影响力高:多项指标在国内高校大数据教学领域领先教材数量教材占有率MOOC课程学习人数师资培养教学研讨会教学网站访问量在线讲座观看人数大模型系列报告(科普报告,非技术报告)n 报
2、告1:大模型概念、技术与应用实践(面向社会大众)n 报告2:DeepSeek大模型赋能高校教学和科研(面向高校)n 报告3:DeepSeek大模型及其企业应用实践(面向企业)n 报告4:DeepSeek大模型赋能政府数字化转型(面向政府部门)报告下载地址:https:/ 大模型的概念1.2 大模型的发展历程1.3 人工智能与大模型的关系1.4 大模型分类1.1 大模型的概念大模型通常指的是大规模的人工智能模型,是一种基于深度学习技术,具有海量参数、强大的学习能力和泛化能力,能够处理和生成多种类型数据的人工智能模型。通常说的大模型的“大”的特点体现在:参数数量庞大训练数据量大计算资源需求高202
3、0年,OpenAI公司推出了GPT-3,模型参数规模达到了1750亿。2023年3月发布的GPT-4的参数规模是GPT-3的10倍以上,达到1.8万亿,2021年11月阿里推出的M6 模型的参数量达10万亿。1.1 大模型的概念大模型的设计和训练旨在提供更强大、更准确的模型性能,以应对更复杂、更庞大的数据集或任务。大模型通常能够学习到更细微的模式和规律,具有更强的泛化能力和表达能力大模型具有更强的上下文理解能力,能够理解更复杂的语意和语境。这使得它们能够产生更准确、更连贯的回答上下文理解能力大模型可以从大量的数据中学习,并利用学到的知识和模式来提供更精准的答案和预测。这使得它们在解决复杂问题和
4、应对新的场景时表现更加出色学习能力强大模型可以生成更自然、更流利的语言,减少了生成输出时呈现的错误或令人困惑的问题语言生成能力学习到的知识和能力可以在不同的任务和领域中迁移和应用。这意味着一次训练就可以将模型应用于多种任务,无需重新训练可迁移性高1.2 大模型的发展历程大模型发展历经三个阶段,分别是萌芽期、沉淀期和爆发期1.2 大模型的发展历程1.2 大模型的发展历程大模型发展对算力的需求演变1.3 人工智能与大模型的关系人工智能包含了机器学习,机器学习包含了深度学习,深度学习可以采用不同的模型,其中一种模型是预训练模型,预训练模型包含了预训练大模型(可以简称为“大模型”),预训练大模型包含了
5、预训练大语言模型(可以简称为“大语言模型”),预训练大语言模型的典型代表包括OpenAI的GPT和百度的文心ERNIE,ChatGPT是基于GPT开发的大模型产品,文心一言是基于文心ERNIE开发的大模型产品人工智能机器学习深度学习深度学习模型预训练模型深度学习预训练大模型预训练大语言模型预训练大语言模型GPT文心ERNIE.ChatGPT文心一言1.4 大模型的分类语言大模型视觉大模型多模态大模型是指在自然语言处理(Natural Language Processing,NLP)领域中的一类大模型,通常用于处理文本数据和理解自然语言。这类大模型的主要特点是它们在大规模语料库上进行了训练,以学
6、习自然语言的各种语法、语义和语境规则。代表性产品包括GPT系列(OpenAI)、Bard(Google)、DeepSeek、文心一言(百度)等是指在计算机视觉(Computer Vision,CV)领域中使用的大模型,通常用于图像处理和分析。这类模型通过在大规模图像数据上进行训练,可以实现各种视觉任务,如图像分类、目标检测、图像分割、姿态估计、人脸识别等。代表性产品包括VIT系列(Google)、文心UFO、华为盘古CV、INTERN(商汤)等是指能够处理多种不同类型数据的大模型,例如文本、图像、音频等多模态数据。这类模型结合了NLP和CV的能力,以实现对多模态信息的综合理解和分析,从而能够更