《6.肖睿-大模型时代的AI教育:思考与实践.pdf》由会员分享,可在线阅读,更多相关《6.肖睿-大模型时代的AI教育:思考与实践.pdf(36页珍藏版)》请在三个皮匠报告上搜索。
1、大模型时代的AI教育:思考与实践 肖睿 主要内容 30分钟和大家分享的内容:01:对AI技术的认知 02:对AI教育的思考 03:我们的AI教育实践 VUCA时代,AI技术日新月异,所有的认知、思考、实践都在迭代中 01 对AI技术的认知 AI是一种工具,也是一种赋能,更是一种思考范式。我们从三个角度来认知AI技术:人工智能的本质 大模型的能力边界 通向AGI之路 01 对AI技术的认知:人工智能的本质 智能(Intelligence):以模型为核心,是对真实世界的模拟和解释 人类智能 抽象(语言):概念,数字,理念 逻辑(理性):归纳,演绎,类比 计算(模型):科学方法 基于观测经验,发现规
2、律 MIT:一切问题都是模型问题 模型:一个映射,一个函数 科学范式 用语言逻辑方法获取理论模型:模糊 用解析数学方法获取数学模型:精确 用计算数学方法获取数据模型:近似 用机器学习方法获取概率模型:复杂 用人工神经网络获取网络模型:黑盒 超过两层的神经网络可以逼近任意连续函数 01 对AI技术的认知:人工智能的本质 人工智能(ArtificiaI Intelligence):第三代,核心是数据智能,以史为鉴 从规则到数据:逐步破除我执(去人类中心主义)1.第一代(规则系统):推理为核心 2.第二代(知识工程):知识为核心 3.第三代(数据模型):学习为核心 从机器学习到深度学习 1.任务:判
3、别、预测,通过学习数据分布规律 2.边界:有规律、可以数字化,属于经验科学 3.要素:机器学习-深度学习 模型:神经网络模型(分层;单向)策略:损失函数定义 算法:反向传播+梯度下降 从感知智能到认知智能 1.专用任务模型:NLP、CV、Gaming 2.通用任务模型:AIGC Diffusion、transformer 从NLU+NLG到LLM(大语言模型)1.语言逻辑和数据集蕴含了人类的认知智能 2.LLM是人类的认知智能的实现方式之一 3.LLM的原理很简单;工程很复杂;效果很神奇 01 对AI技术的认知:大模型的能力边界 用人工神经网络获取网络模型:深度学习-Transformer模型
4、-大语言模型 大语言模型的核心原理:数据化-语义化-NTP(Next Token Prediction)大语言模型的三层能力:语言能力-知识能力-推理能力 1.语言能力:一本正经地说话,语言顺畅,GPT时达到 NLG+NLU:语言理解、语言表达(包括温度和情商)人类语言、代码语言、XX语言 2.知识能力:海量公开知识,言之有物,GPT-2时达到 顺带学习(基座模型):文字中蕴含了知识 压缩:幻觉 遗忘:微调(迁移学习),尤其是RLHF 3.推理能力(涌现):一般需要10B以上,GPT-3时达到 模仿学习:代码中蕴涵、文字中蕴含 提示能力:ICL 思考能力:CoT ReACT,Agent O1的
5、最新进展(GPT-1时刻):表现是慢思考;本质是合成数据 有些是产品能力,不是模型本身的能力:RAG Function Call 等等 01 对AI技术的认知:大模型的能力边界 基于LLM的三层能力做产品:锤子和钉子 LLM的三个能力的应用:选型标准 1.语言处理场景:语言能力 文字处理:翻译、摘要、判别、生成等 人机界面:指令、信息、prompt 2.知识助手场景:语言能力+知识能力 知识压缩、知识提取、知识组织 智能问答 3.任务执行场景:语言能力+知识能力+逻辑能力 任务分解、任务执行 操作外部工具或软件接口 Agent 三种应用类型 1.模型增强:FT;MaaS;产品包装(ChatGP
6、T)2.AI赋能:用AI提高原有流程和工具的效率 3.AI原生:新场景、新需求、新应用 三种技术 1.闭卷考试:RAG 2.开卷考试:FT 3.引导能力:Prompt工程 01 对AI技术的认知:通向AGI之路 通用人工智能(AGI):泛化任务、自主学习、自主行动 两个阶段:特定任务到泛化任务 弱人工智能:可以完成训练过的特定的智能任务,特定 强人工智能:可以完成没有训练过的新智能任务,通用 三个能力 感知智能:知识表达 认知智能:知识处理 行动智能:环境交互 四条道路 1、数据智能:LLM取得了突破,最被看好 概率模型,机器学习(统计学习方法)、数据模型、计算数学 2、学习人脑:当前遇到挑战