《之江实验室:2023重构教育图景:教育专用大模型研究报告(简版)(11页).pdf》由会员分享,可在线阅读,更多相关《之江实验室:2023重构教育图景:教育专用大模型研究报告(简版)(11页).pdf(11页珍藏版)》请在三个皮匠报告上搜索。
1、重构教育图景:教育专用大模型研究报告(简版)(简版)中国教育科学研究院数字教育研究所之江实验室智能教育研究中心2023 年 12 月1当前,新一代人工智能技术迅猛发展,在全球引起了广泛关注。2023 年 11 月,OpenAI 召开首个开发者大会,发布了 GPTs 及最新开发技术,让每个人都可以通过自然语言人机对话的方式创建自定义大模型。同时,百度、阿里巴巴、华为、科大讯飞等国内科技企业相继发布了多款人工智能大模型,提供中国解决方案。未来,人工智能大模型将深度融入各领域各环节,赋能千行百业智能升级,助力社会生产力跃升。从通用大模型到教育专用大模型,是人工智能大模型技术深化发展的重要趋势。这不只
2、是在通用大模型基础上进行微调和优化,而是一种基于教育场景、开放模型架构的重大创新。教育专用大模型是指以通用大模型为基础的多层次开放技术架构,以多样的教育数字化应用为驱动,通过统一交互对话界面向师生和社会学习者提供专业能力。它具备丰富多样的教育专业知识,并在应用中持续升级。在这个背景下,中国教育科学研究院数字教育研究所和之江实验室智能教育研究中心组建研究团队,聚焦教育专用大模型,从技术基础、应用现状、潜在挑战、创新构思、落地场景等方面开展研究,形成了重构教育图景:教育专用大模型研究报告。2第一章 教育专用大模型的技术基础“大模型”(large models)是指具有数十亿到数百亿甚至更多可训练参
3、数的人工智能模型,它是深度学习、GPU 硬件、大规模数据集等多种技术共同发展的产物。大模型所展现的强大能力实质上是深度学习中“量变引起质变”的结果。当模型参数量达到一定规模时,模型准确率会经历质的飞跃,这一过程被称之为“涌现能力”,即从原始训练数据中自动学习并发现新的、更高层次的特征和模式的能力。这些能力突出表现为通用的用户意图理解能力、强大的大范围上下文连续对话能力、智能的交互修正能力、内容的润色分类和总结能力、新内容的生成能力、多模态能力。作为重点研发领域之一,教育专用大模型是大模型技术、知识库技术以及各类智能教育技术的集成应用,将在教育过程中训练形成教育新场景,实现人类学习和机器学习的双
4、向建构。当前,教育专用大模型主要采取两种技术路线:一是直接调用通用大模型,通过微调或提示学习的方式使之具备一定专业能力;二是利用教育领域专业数据,专门训练用于解决教育任务的大模型。这两种技术路线都取得了一定进展,但实现效果仍有待提升。由于缺乏足够的专业数据训练,教育深度知识不够,智能性不强,难以灵活处理复杂多变的教育任务。3如何研发教育专用大模型,破解之道在于两条技术路线整合起来。这并非简单相加,而是通过建立一种全新的开放技术架构,系统整合通用问题解决能力和教育专用问题解决能力,实现技术突破。具体来说,要要结合通用大模型与教育结合通用大模型与教育领域专业数据领域专业数据,打破数据孤岛,通过开放
5、数据接口源源不断地获得来自常态化教育应用中的数据;要以专家知识库作为要以专家知识库作为大模型的补充大模型的补充,将学科知识和教育教学中的各种规则有意识地“教”给大模型;要整合应用各类智能教育技术要整合应用各类智能教育技术,将已经发展起来的各类智能教育技术集成于教育专用大模型之中。第二章 教育专用大模型的案例分析大模型在口语练习、数学学习、情感分析和个性化推荐等方面为教育带来巨大潜力和可能性。我们梳理了五种典型的教育专业大模型应用案例,对其发展背景、应用场景、设计特色等进行了深度分析。表 1 教育专用大模型典型应用案例序号序号典型应用产品典型应用产品研发单位研发单位采用的大模型采用的大模型学科类
6、型学科类型1星火语伴科大讯飞星火认知大模型语言学习2EmoGPT华东师大自研大模型心理疏导3MathGPT好未来自研大模型数学学习4智海-三乐阿里云通义千问AI 知识学习5Khanmigo可汗学院ChatGPT-4多学科学习4从应用场景看从应用场景看,星火语伴主要用于语言学习,支持多语言文本、语音和图片的实时翻译,并能纠正语法错误,提供口语陪练等。EmoGPT 用于提供心理健康服务,能识别和响应用户情绪,提供持续的心理支持。MathGPT 面向全球数学爱好者和科研机构,提供解题和讲题算法,支持用户进行数学解题和练习。智海-三乐用于 AI 专业教育,提供搜索引擎、计算引擎和本地知识库等功能,支持
7、智能问答和试题生成。Khanmigo 通过对话式 AI 聊天机器人为学习者提供个性化学习方案,同时也支持生涯规划服务、教学方法辅导优化等。从技术进展看从技术进展看,教育专用大模型在模型性能、应用场景、技术特点方面展现出优势,涵盖了大部分学科内容,主要聚焦于自主学习场景,包括知识问答、语言学习、学习引导和教学辅助等。在技术路线上,“通用+微调”的路径已证明其有效性,许多技术方案以通用大模型为基础,通过指令微调等方式实现针对特定学科知识的有效回答。从从现有现有不足看不足看,现有教育专用大模型在准确性、教学内容多样性、支持核心教育场景、包容学习者多样性方面还有所局限,存在错误率较高、缺乏共情理解能力
8、等问题,主要侧重于学科知识教学和应试教育情境,在跨学科学习、学生综合能力与高阶思维培养等方面仍有不足;主要聚焦于支持自主学习,在真实课堂、同伴协作、混合教学等场景下如何充分发挥大模型的作用尚未得到有效探索。5总之,大模型在教育领域的应用取得了明显进展,但仍面临着现实问题,需要进一步提升训练数据的质量和规模,尤其是将先进教育理念、教育深度知识和教育核心场景的真实需求深度嵌入技术设计,结合用户反馈进行多轮迭代,形成更智慧、更灵活的教育专用大模型。第三章 教育专用大模型的潜在挑战相较于其他领域,在教育中实现真正的自动化和智能化往往面临着更高的要求,因为教育任务大部分是“非程式化”的,可自动化程度相对
9、较低。随着大模型在模仿、生成、创作等能力上的不断突破,大模型有望在教育过程中得到深入应用。作为一项新兴的人工智能技术,有必要对教育专用大模型可能面临的挑战进行系统性评估。一方面一方面,智能机器与人类教师之间存在模糊分野智能机器与人类教师之间存在模糊分野。教育任务往往需要人类智慧,这使得具备生成、创造能力的大模型技术在承担复杂认知任务(如艺术创作、决策制定)时,逐渐模糊了机器与教师之间的界限,从而容易导致师生对大模型的过度依赖,造成知识体系的断裂和碎片化、偏见等问题。具体来说,大模型的强大生成能力简化了师生获取信息的流程,但也放大了其对知识探究的惰性。大模型往往会为复杂问题提供简洁、直接的答案,
10、但这些答案缺乏连贯性和完整性,可能导致学生所获取的知识处于不断被切割的状态。同时,数据集本身或算法等原因导致模型对某些特定群体或6主题存在偏好或歧视,可能会导致模型输出的答案或结论存在偏差。另一方面另一方面,通用与专用大模型在人类价值上可能存在冲通用与专用大模型在人类价值上可能存在冲突突。通用大模型在教育领域的应用受限主要源于其缺乏教育领域特定的深度知识和个性化定制能力。这种模型通常是通过广泛而通用的文本数据训练而成,未必能准确理解教育领域特定术语、学科需求及学习模式,由此引发通用与专用大模型之间的过程与结果的冲突、生成与探究的冲突、自动与协作的冲突、透明和可靠的冲突。因此,需要定制基于领域知
11、识深度理解的教育专用大模型来提供更有效、精准和深度的智能化支持。第四章 教育专用大模型的创新构思我们秉持“应用驱动应用驱动、共建共享共建共享”的理念,提出了开放创新的教育专用大模型架构,通过集成通用大模型、教育场景模型(小模型)和知识库三条技术路线,让教育专用大模型赋能各级各类教育数字化应用,让智能算力像“水电”一样,接入每一所学校、每一个课堂、每一台终端,让生成式人工智能成为广大师生的亲密助手。教育专用大模型的开放创新架构分为三层,分别是基础能力层(L0)、专业能力层(L1)、应用服务层(L2)。基础能力层(L0)基于通用大模型的基础能力,根据多元教育数据类型和多元任务需求,调用不同类型的大
12、模型。专业能力7层(L1)包括教育场景模型库和专家知识库。应用服务层(L2)将各类教育数字化应用接入大模型,在大模型为应用赋能的同时,将应用数据源源不断传入大模型,持续提高大模型的教育专业能力。图 1 教育专用大模型开放创新架构教育专用大模型并非单一、封闭的模型,而是一个开发者和用户共同参与持续完善的过程。广大师生和各类教育数字化产品的研发者既是模型的使用者,也是模型的贡献者、建设者,由此形成共建共享的教育专用大模型创新生态。教育专用大模型的技术路线包括大规模多元教育数据采集、数据预处理、特征工程、模型设计、模型预训练、微调与迁移学习、模型评估与调优七个关键步骤。8图 2 教育专用大模型的技术
13、路线目前,之江实验室研究团队在学前儿童观察和中小学教师智能教研方面,尝试部分实现教育专用大模型技术架构与建设思路,形成了相关解决方案。以幼儿园发展性评估系统“开心苹果”为例,该系统把评估标准和智能技术相结合,开发儿童游戏观察助手、协同备课系统、智能档案管理系统等一系列智能化服务工具,提供了“观察记录分析助手”和“文字素材生成器”两大核心功能区,形成了多层次立体化的质量评估工具箱,助力教师专业发展和儿童全面发展。9图 3“开心苹果”学前教育评估系统第五章 教育专用大模型的应用展望与行动倡议教育专用大模型将把“以学习者为中心”理念变成普遍现实。其中,在学前教育阶段,主要表现为尊重儿童、放手儿童,强
14、调培养儿童的自主性、创造性;在基础教育阶段,主要表现为从讲授灌输式教学走向深度理解和研究性学习,强调建立学习者的主体性;在高等教育和职业教育阶段,主要表现为以学生发展为中心,强调科教融合、产教融合;在终身教育阶段,主要表现为以学习需求为导向,重点解决优质教育资源供给与需求匹配的问题。教育专用大模型应用包括学习空间互动生成、学习资源按需供给、教师角色转型升级、探究性学习、对话式教学、嵌入式评价、服务式治理等关键要素。10为进一步推动教育专用大模型发展,我们倡议:一是提一是提升教育教学环境的韧性升教育教学环境的韧性、包容与灵活度包容与灵活度,利用教育专用大模型打造教育高质量发展的智能底座,有效支撑
15、教育数字化转型。二是加快关键技术的突破创新二是加快关键技术的突破创新,充分利用教育领域多模态、长周期的海量数据,对学习者认知过程与教学交互过程等进行准确捕捉与深度理解,进一步明晰教学过程及其底层机制,构建适用于多种类型教育任务的教育专用大模型。三三是推动教育目标与评价创新是推动教育目标与评价创新,探索开发式学习任务设计,全面强化学习过程评价,创新学生作业评价和教师评价。四是四是优化教师教学行为与范式优化教师教学行为与范式,形成人机协同的教育教学新常态,提高教师数字素养与技能,根据实际情况灵活调整教育专用大模型的应用策略。五是规范大模型的应用范围与指引五是规范大模型的应用范围与指引,明确使用范围、使用对象和使用场景,提出针对性的师生使用指引,并接受社会公众的持续性监督和反馈。六是持续开展六是持续开展大模型对教育的影响研究大模型对教育的影响研究,跟踪研判国内外教育专用大模型发展趋势,加强“人机共教”“人机共学”的基础理论研究和实证研究,完善教育政策工具箱,在大模型开发应用的生命全周期中彰显教育公平、确保教育质量。