人工智能赋能教育教学遐想_中国煤炭行业知识服务平台

本文缺乏系统深入的调研，只为交流，欢迎批评指正！

人工智能，英文Artificial Intelligence，简写为AI，表示“人造的智能”，可用于模拟、延伸和扩展人的智能行为。

进入2024年，深深感受到“AI+”对教育教学的强烈冲击，各类有关人工智能赋能教育教学的研讨会络绎不绝，基于人工智能的教学理念、教学手段、评价手段，以及基于AI技术的教学内容生产被广泛的讨论。本文为一篇学习笔记，旨在学习一些人工智能的基本概念，尝试探讨教师应该如何应对人工智能赋能教育教学这一概念。

人工智能的思想起源很早，世界上很多民族都有人工物被能工巧匠赋予智慧或意识的故事。我国《列子·汤问》中曾记载过周穆王西巡途中偃师献艺的故事，偃师献给周穆王一个能歌善舞的机器人，周穆王很高兴叫来嫔妃一同观看，在结束时机器人向嫔妃抛媚眼，周穆王大怒要杀掉偃师，偃师赶忙解释机器人是假人不是真人，拆解开来看都是由皮革、木头、树脂、漆和白垩、黑炭、丹砂、青雘之类的颜料凑合而成的。

现代人工智能起源于1920-1940年代，可编程计算机的发明启发一些科学家开始讨论制造能够模拟人类思考的“电子大脑”的可能性，这其中就包括图灵（Alan Mathison Turing，1912-1954）。

1950年，图灵发表了具有里程碑意义的论文《计算机器与智能》（Computing Machinery and Intelligence）。文中他指出“思考”很难定义，并设计了著名的图灵测试：如果一台机器能够与人类进行的对话（通过电传打字机），且对话内容与人类对话难以区分，那么就可以合理地说该机器在“思考”。图灵测试是人工智能哲学中第一个严肃的提议。

图1 图灵测试

多名评委在隔开的情况下，通过设备向一个机器人和一个人随意提问，多次问答后，若超过30%的人不能确定回答者是人还是及其，那么，该机器具备人类智能。

早期人工智能模拟人类思考过程主要基于逻辑推理模拟人类智能化（个人理解：能讲清楚道理，有确切的物理模型），被称为符号主义，有赖于对各类事物机理的深刻理解。

1940年代，沃尔特·皮茨（Walter Pitts，1923-1969）和沃伦·麦卡洛克（Warren Sturgis McCulloch，1898-1969）探讨理想化的人工神经元网络，并展示了它们如何执行简单的逻辑功能，形成了早期的人工神经网络，也被称为联结主义，它们改变了符号主义的智能模式，借鉴了脑科学理论成果，强调智能的产生是由大量简单的单元通过复杂的相互联结和并行运行的结果（个人理解：从大数据中挖掘规律，但缺少确切的物理模型），神经网络看上去，主要以大数据为基础，从中得出现象与结果之间的关系。

从1960-1980年代人们开始转向智能控制和智能机器人系统，被称为是一种基于“感知-行动”的智能模拟方法，这一派也被称为行为主义，其代表思想是认为人工智能应该基于感知和行动，让机器在与环境的交互中学习并优化行为。这一流派强调实时响应和适应性。如无人机，无人艇、自动驾驶汽车、等都是该领域杰出代表。

符号主义、联结主义、行为主义也被称为当代主流的三大人工智能派别。此外，还有模拟生物进化，使用遗传算法和编程的进化学派，以及使用概率规则及其依赖关系进行推理的贝叶斯学派，还有通过对相似性判断的外推来进行学习，强调从已知实例中进行类比推理，以发现新知识和解决问题的类推学派等。

图2 人工智能曲折的发展途径

人工智能经历了五个阶段，包括三次热潮和两次低谷。关键事件是于1956 年的达特茅斯研讨会，在这次会议标志着人工智能正式成为一门学科，当前人类处于人工智能的第三次热潮。

大模型是基于机器学习构建的人工智能模型，目前以人工神经网络为主，由大量的节点（或称神经元）和之间相互联接构成，每个节点代表一种特定的输出函数，称为激励函数（activation function）；每两个节点间的连接都代表一个对于通过该连接信号的加权值，称之为权重，相当于人工神经网络的记忆。

网络的输出则依赖于网络的连接方式，即权重值和激励函数。权重值和激励函数（形式给定但参数未知）通过大量的样本数据通过训练获得各参数的值，形成可以协助工作的大模型。早期的大模型的参数大约几百，现在大模型处理参数达到了千亿规模（GPT-3包含1700多亿个参数），预训练一个大模型所使用的GPU也需要几千个不等，在数据量保障的前提下，需要几个月的时间。

图3 神经网络示意图

每一个节点表示一个函数表示（包含若干参数）、节点影响下一层节点有权重占比，可见节点越多、层数（Layer）越多，参数越多。深度学习可直观理解为隐含层多的深度神经网络。

从大模型处理的内容看，可分为语言大模型，视觉大模型，多模态大模型三类。其中，语言大模型（或大语言模型）指的是主要依赖文本数据进行训练，专注于处理和理解自然语言文本，通过海量文本数据的训练，学会了理解和生成文本的能力，可以用于各种自然语言处理任务，如机器翻译、文本生成、问答系统等。此类大模型如GPT系列（OpenAI），Bard（Google）、文心一言（百度）等。

视觉大模型（大视觉模型）指在计算机视觉(Computervon，Cv)领域中使用的大模型，通常用于图像处理和分析，通过在大规模图像数据上进行训练，可以实现各种视觉任务，如图像分类、目标检测、图像分割、姿态估计、人脸识别等。此类大模型如VIT系列(Google)、文心UFO、华为盘古CV、INTERN(商汤)等。

多模态大模型指能够处理多种不同类型数据的大模型，如文本、图像、音频等多模态数据。多模态大模型结合了语言大模型和机器视觉的能力，可以对多模态信息的综合理解和分析，从而能够更全面地理解和处理复杂的数据。此类大模型如DingoDB多模向量数据库(九章云极DataCanyas)、DALL-E(OpenAl)、悟空画画(华为)、midjourney等。

另外，大模型还被分为通用大模型和行业大模型。通用大模型即不区分行业领域，企图囊括一切知识，这就需要更加广泛的数据。行业大模型将目光聚焦到某个行业领域，如金融、医疗、法律、教育、工业等，成为专门领域的大模型。

人工智能赋能教育教学遐想

图4 大模型产业

采用各类大模型（一种或者多种）作为底层模型，开发行业专用模型已在多个领域取得较大成功。

在人工智能领域，我们还经常听说“生成式人工智能”或者“生成式AI”，英文Artificial Intelligence Generated Content，简写为AIGC，是在大模型强大的计算能力和数据处理能力的前提下得以实现的。具体而言，“生成”是指利用大模型生成具有一定创意和质量的内容，包括文本、代码、图像、音乐、视频等多种形式的内容，被认为是人工智能1.0时代进入2.0时代的重要标志。当前，各类生成式AI大模型主要包括：

文本生成大模型如：GPT系列，文心一言、通文干问、盘古、Claude3、0sionLM.Chinchilla等；

文本生成图片大模型如：DALLE 2、Stabie Difuslon,Midjoumey、Pkxeling千象,DreamGausslan,百度AI作画、通义万相等；

文本生成音乐大模型如：MusicLM,ElevenLabs,Wondershare Filmora,Reech者声，天工SkyMusic.琴乐大模型、FunAudioLLM，MusicGen等

文本生成视频大模型如：Sora、Stable Video Ditfuslon、Vidu等

“生成”是根据人的需求出现的一种人工智能输出方式，协助人写文本、作图、生成视频、音乐等内容。除“生成式AI”外，还有另一种输出形式，协助人针对某种场景做出决策，被称为“决策式AI”。基本原理是通过学习数据中的条件概率分布，再对新的场景进行判断、分析和预测。例如在人脸识别领域，通过实时获取人脸图像信息，与人脸库中的特征数据匹配，从而实现人脸识别。

发展人工智能的意义，在于它可以替代人类完成部分脑力劳动。人工智能如何赋能教学？人工智能可以协助师生完成哪些工作？这取决于两个方面，一是人工智能可以干什么，取决于网络的成熟程度；另一个是老师有哪些需求，生成还是决策？取决于教师提出问题的能力。这里，我们尝试提出三个人工智能赋能教育教学的场景，望大家批评指正：

第一种场景：在全球范围内获取教育教学信息与资源，协助教师教学决策和生成教学资源。大模型数据来源于全球的教育教学数据，包括教育思想理念、方法手段，以及教学资源、教学案例等等，信息形式包括文本、图片、音频、视频等多种形式，从“决策”和“生成”两个角度协助教师。

从“决策”角度看，教师需要了解教育教学相关政策，在教研教改、学生管理等方面做出决策；针对于教学内容中知识点的准确性、教学组织形式、课程讲解方式等做出决策；以及在教材、课件选用，作业及测试习题选择等方面的决策，课程习题库等教学资源；教师在教学中遇到的各类疑问，人工智能可以给出较为准确和详细的解答。

从“生成”角度看，教师希望人工智能能够站在国内外的教学资源上，生成各种形式的、有一定创新价值的资源，用于编写教案、课件、教材、习题册、学生测试题、教改申报书等内容，且可以包括文本、图片、音频、视频等多种形式。然后，基于这些生成式教学资源开展教育教学。

第二种场景：以课堂为中心实现教学评价，协助教师和学生制定个性化学习方案（决策和生成）。教育教学是一种师生之间的互动，课堂是互动的主要阵地，互动效果决定了课堂效率，课堂效率可以从教师“教”的状态、学生“学”的状态，以及双方“互动”的默契程度三个角度评价，最终做到教学相长。在这个过程中，合理评估教学效果，并给出改进建议是师生双方都迫切需要的。基于视频、音频、行为、表情等信息的分析，开发课堂教学评价管理大模型，为师生成长提供决策。

对于教师，追踪教师“教”的状态（可用视觉通用大模型），从专业的角度分析出（授课内容，需要开发专业大模型），教师那些知识点讲的既准确又好，过程中学生表现出较高的学习兴趣，又或者那些知识点讲的不好，学生表现出畏难、无兴趣的特征。并基于这种分析，为教师给出精细化指导，制定教师教学能力提升规划，以提高教师教学能力。

对于学生，可以追踪学生的学习状态（可用视觉通用大模型），了解学生哪些知识点学生关注到了，哪些知识点没有关注到，并为学生制定个性化学习建议，包括学习时间建议（培养管理时间的能力）、学习内容建议（对知识体系的了解）（需要专业大模型）、学习效果在全班（寻找学习参照）。

第三种场景，以大模型为依托，为师生测评提供全面的智能化方案。这里测评包括平时作业、课堂测验、期中考试、期末考试等，构建习题库，可按照教师要求自动生成试卷（也允许教师另出新题），并能进行阅卷（决策），对于受力分析，公式推导，综合计算等复杂题目可以自动批阅（决策），并能针对学生学习情况给出学习报告、试卷分析、课程目标达成度等相关考试资料，协助考试资料归档（生成）。

力学题目通常比较复杂，包含受力分析图、内力图、证明题、计算题等，需要开发专业大模型，通过“标准答案样本”与学生作业之间的对比，从而决策题目答案是否正确，以及得分。

对于教师，依赖于大模型实现教师教学能力测评。以教学名师的授课课堂为样本，设计分析指标，以此训练教师教学能力测评大模型。该模型不仅可以作为训练自身教学能力提升的磨刀石，还可以基于大数据给出教师教学能力测评等级，为教师教学能力提升提供参考坐标。

最后，想说一点教师如何开展人工智能赋能教育教学。有些“伪人工智能”将网络搜索功能视为人工智能，网络搜索与人工智能有较大区别。首先人工智能必须有大模型，其次能为师生提供决策和生成内容，按照开发和利用大模型，教师开展人工智能赋能教育教学主要有两种途径：

一、基于大模型框架（用来开发大模型的工具或技术体系），独立或联合人工智能专业人员，开发依托课程、习题、考试管理（如考试资料归档）、学生管理（如学业预警与学习建议）等专属特性的专业大模型（相对通用大模型可称为小模型），在一个相对较小的领域训练具备一定的智能化功能的大模型，实现教育教学智能化。

二、基于通用大模型（如GPT系列、文心一言等文本或多模态大模型），在某些教学环节生成或决策教学理念、教学手段，重组或优化新的知识体系，实施教学改革与创新。让教师的教学内容、课堂组织形式保持活力，形成学生持久的学习吸引力。

在网络上简单搜索，现有的教育大模型主要集中在语言学习、算法生成，期待有力学专业课大模型的生成，助力力学课程建设与发展。

参考资料：

[1] 鲜枣课堂，62页PPT，初步看懂人工智能. 微信公众号：SDNLAB

[2] 百度、维基等百科知识

人工智能赋能教育教学遐想

煤科热搜

24小时内最火

24小时内最火

24小时内最火

24小时内最火