生成式人工智能何以促进高阶思维能力培养?——基于68项实证研究的整合分析

刘明.jpg

刘明

[作者简介] 刘明,博士,西南大学教育学部教授;郭烁,西南大学教育学部博士研究生;张微,西南大学教育学部硕士研究生;王静贤,博士,西南大学教育学部副教授。

[基金项目]本文系2024 年国家自然科学基金面上项目“知识增强大语言模型的科学课教学问题智能生成方法研究”(项目编号:62477039)、2024 年重庆市研究生科研创新项目 “生成式人工智能赋能大学生批判性学术阅读的机理与路径研究”(项目编号:CYB240081)阶段性研究成果。

图片[2]-生成式人工智能何以促进高阶思维能力培养?——基于68项实证研究的整合分析-AI Express News
引用信息
图片[2]-生成式人工智能何以促进高阶思维能力培养?——基于68项实证研究的整合分析-AI Express News

刘明,郭烁,张微,王静贤,2025. 生成式人工智能何以促进高阶思维能力培养? ——基于68 项实证研究的整合分析[J]. 远程教育杂志,43(5):55-66.

[摘   要] 系统揭示如何使用生成式人工智能(generative artificial intelligence,GenAI)促进学习者高阶思维能力培养,有助于科学规划智能时代人才创新发展路径,统筹推进教育科技人才一体化改革。 为此,采用系统性综述法,遵循PRISMA 指南,选取国内外68 项关于GenAI 促进高阶思维能力培养的实证研究,以培养类型、培养模式和培养效果为分析框架,厘清“GenAI 能促进学习者哪些高阶思维能力培养”“如何培养”以及“培养效果如何”等问题,并构建了内在机理模型。 研究发现:(1)现有研究主要集中于写作、编程、口语对话等六大场景,基于三种GenAI 平台,促进学习者七类高阶思维能力培养;(2)GenAI 以“助教”和“学伴”角色介入高阶思维能力培养,衍生基于GenAI 助教或学伴的人机协同结构化任务驱动、开放式活动探究等四类培养模式,但目前尚未形成“内发式”理论基础与实践应用;(3)现有研究对GenAI 促进学习者创造性思维能力尚存分歧,其中,明确的人机协同应用模式是激发学习者创造性思维的必要条件,使用时长是重要因素。 基于此,提出融合新型学习分析技术以揭示具体高阶思维能力培养内在机理、构建生成式人机协同教学/学习模式、加强学习者多模态过程数据挖掘以探明创造性思维能力养成规律等建议,以期为教育科研和教学实践人员提供参考借鉴。

[关键词] 生成式人工智能;高阶思维能力;实证研究;系统性综述

一、引言

根据布鲁姆教育目标分类,高阶思维能力(higher-order thinking skills,HOTS)是发生在较高认知水平层次上的心智活动或认知能力, 包括创造性思维能力、问题解决能力、批判性思维能力等(胡小勇,等,2022)。 学习者HOTS 培养已在世界范围内受到广泛关注。 2019 年,世界经济合作与发展组织发布报告《培养学生的创造力和批判性思维》,明确指出新时代背景下培养学习者HOTS 的重大潜在价值;2022 年10 月, 习近平总书记在党的二十大报告中提出, 加强人才HOTS 培养, 着力造就拔尖创新人才;2024 年9 月,联合国教科文组织发布《面向学生的人工智能能力框架》,提出重视培养学生HOTS,构建支撑学生终身学习的HOTS 体系。 但受技术和方法限制, 实践人员对学习者HOTS 的个性化学习支持服务不足,难以满足学习者问题解决、批判性讨论等发展需求,不利于HOTS 培养(何文涛,等,2023)。

近年来,以生成式人工智能(generative artificial intelligence,GenAI) 为代表的技术革命推动教育生态创变,其以多模态内容生成与个性化、拓展化支持服务功能, 为学习者HOTS 进阶发展提供强大动力(杨宗凯,等,2023;段世飞,等,2024)。 然而,学习者若不加干预、漫无目的地使用,会过度依赖GenAI,引发“Google 效应”, 阻滞HOTS 发展 (刘明, 等,2024a; 余胜泉, 等,2023)。 因此, 如何充分发挥GenAI 技术功效以促进学习者HOTS 培养, 已成为当前教育实践和研究领域关注的重要课题。

实证研究是基于证据、有一定解释深度、对教育现象背后本质的认识的探究过程,其因提倡“用数据说话”而深受研究者、管理者和决策者重视(刘选,2017)。因此,系统梳理国内外高质量实证研究,深入揭示GenAI 如何促进学习者HOTS 培养, 能够为该领域的研究者与教学实践者提供参考借鉴。 现有研究综述多集中于归纳GenAI 促进学习者HOTS 的机遇和挑战(朱永新,等,2023;Chang,et al.,2024),也有部分研究总结GenAI 在语言学习 (Jeon,et al.,2023)、医学教育领域(Lucas,et al.,2024)的应用,然而并没有概述GenAI 促进学习者HOTS 培养之全貌;有研究分析GenAI 应用效果(和文斌,等,2024;Ilgun,et al.,2024), 但均未明确回应 “如何应用GenAI 以促进学习者HOTS 培养”的问题。 为此,本研究对2022 年11 月以来国内外高质量实证研究开展系统性综述, 厘清 “GenAI 能促进学习者哪些HOTS 培养”“如何培养”“培养效果如何”等问题,为推动我国拔尖创新人才培养、 教育强国建设贡献理论与实践智慧。

二、研究设计

(一)研究方法和研究问题

为了解当前GenAI 促进学习者HOTS 的实证研究情况, 本研究采用系统性综述法分析以下研究问题:(1)GenAI 能促进学习者哪些HOTS 培养? (2)GenAI 如何促进学习者HOTS 培养? (3)GenAI 促进学习者HOTS 培养的效果如何?

(二)文献获取

1.文献检索策略

为全面获取近两年GenAI 促进HOTS 培养的高质量实证研究文献,本研究在中国知网、Web of Science、Google Scholar、Springer Link、EBSCO-ERIC、Elsevier ScienceDirect 六个数据库中, 进行包括标题、关键词和摘要的主题精确检索。其中,“GenAI”的中英文检索关键词为“生成式人工智能” “人工智能生成内容” “AIGC” “大语言模型” “教育生成式人工智能” “对话机器人” “文心一言” “豆包” “星火” “Kimi” “ChatGPT” “Claude” “generative artificial intelligence” “large language model” “chatbot” “GenAI or GAI in education”。 鉴于布鲁姆教育目标分类和HOTS 概念,HOTS 的中英文检索关键词为 “高阶思维” “高阶思维能力” “高心智活动” “高认知能力” “分析能力” “创造性思维” “评价能力” “high level skill” “high order thinking skills” “high cognitive ability”“analysis ability”“creativity”“evaluation ability”“assessment ability”;为涵盖更广泛的HOTS 研究,结合21 世纪技能、 核心素养中对HOTS 的相关描述,本研究添加中英文检索关键词:“21 世纪技能”“核心素养”“批判性思维”“协作能力”“问题解决能力”“自我调节学习”“计算思维能力”“元认知能力”“21st century skills” “core competencies” “coreliteracy” “critical thinking” “collaboration ability” “cooperation ability” “problem-solving ability” “self-regulated learning” “computational thinking” “metacognitive ability”。文献时间限定为2022 年11 月至2024 年11月,共检索到6512 篇中外文文献。

2.文献筛选标准

为保障文献分析结果的准确性和可靠性,本研究基于已有研究按以下标准筛选文献:(1)实证研究;(2)全文可获取;(3)文章是期刊或会议论文;(4)文章至少包含三页;(5)研究包括明确的研究问题、研究方法、数据采集和研究结论;(6)研究主题聚焦GenAI和HOTS(Radianti,et al.,2020)。其中1~4 条是为保证研究样本的准确性与权威性, 而普遍采用的筛选标准;第5 条是为了筛选科学严谨的实证研究,剔除缺乏研究问题、严谨的实验过程、数据分析的文献;第6 条旨在将研究主题聚焦于GenAI 和HOTS。

3.文献筛选过程

本研究遵循系统性综述及元分析方法(Preferred Reporting Items for Systematic Reviews and Meta-Analyses,PRISMA)的研究思路进行文献筛选,通过识别、筛选、纳入、综合等流程,获得符合标准的论文68 篇。其中,中文13 篇,英文55 篇:CSSCI 索引的文献有13 篇,SSCI 索引的文献有35 篇,SCI 索引的文献有9 篇,HCI 会议论文有11 篇。PRISMA 流程如图1所示。

ac6829cd6bbc37e7eed89634ee025eaa.jpg

图1 PRISMA 流程图

(三)文献编码

根据研究问题和已有研究分类(李新,等,2021;Ilgun,et al.,2024),本研究按3 个一级维度和9 个二级维度开展编码,如表1 所示。一级维度包括培养类型、培养模式、培养效果。 针对研究问题1,深入分析GenAI 技术特征与HOTS 的对应关系, 将培养类型分为培养场景、GenAI 平台、GenAI 功能、HOTS 类型4 个二级维度; 针对研究问题2, 鉴于GenAI 促进HOTS 的培养模式需要坚实的理论支撑(Radianti, et al., 2020), 本研究将从理论基础和实践模式两个维度展开论述。 针对研究问题3,促进效果分为数据收集方式、数据分析方式、实证检验效果3 类(李新,等,2021)。

表1 文献编码表

1c2c7198c0d8582f421572d9fdcff79f.jpg

为保证编码结果的可靠性, 编码由三位作者共同完成,先以10 篇文献为例,对编码框架进行协商讨论,达成一致后,再独立对剩余文献进行编码。 编码一致性采用Kappa 系数, 计算得出一致性为0.832>0.7,说明编码一致性较高。 同时,编码人员对结果不一致的文献讨论协商,最终确定编码结果。

三、研究结果

文献编码结果主要有GenAI 促进学习者HOTS 培养实证研究的培养类型、培养模式与培养效果三部分。

(一)GenAI 促进学习者HOTS 的培养类型

在厘清GenAI 能促进学习者哪些HOTS 培养这一问题前,需明确现有实证研究培养HOTS 的场景、使用了哪些GenAI 平台、有何功能,进而再探究基于不同场景下GenAI 促进学习者哪些HOTS 培养的问题。

1.培养场景

对68 篇文献统计发现,GenAI 促进学习者HOTS 培养的场景主要有6 类,如图2 所示。 其中,写作场景应用最多,有19 项,占27.94%;专业课授课场景有18 项,占26.47%。 其次是编程场景,有12项,占17.65%;口语对话和阅读场景均有7 项研究,占10.29%。 最后艺术创作场景(包括图像创作、服装设计等)有5 项,占7.35%。

c646640ce8cc66119da0f2afea1e26e0.jpg

图2 培养场景统计图

2.GenAI 平台及功能

经统计分析,68 项实证研究共涉及了三类GenAI 平台。 第一类是使用现有大模型平台开展实证研究,如使用ChatGPT、文心一言等。 此类平台主要提供答疑指导(n=23)、写作文本生成(n=7)、提供建议(n=5)、内容修改(n=1)和问题生成(n=1)等功能。第二类是自主开发的大模型平台,此类平台与现有大模型平台相比,功能更为集中,且对学习者提示语编写能力要求不高。 如有研究(Ng,et al.,2024)以GPT-3.5 为内核, 开发专门解决科学问题的教育大模型系统SRLbot, 学习者可以直接向GenAI 提问,无需参考提示语框架即可得到想要的答案。 该类工具或平台主要提供答疑指导(n=18)、写作文本生成(n=10)、评价(n=3)、资源推荐(n=3)等功能。 第三类是自主开发基于大模型的教育智能体平台, 如翟雪松等(2024a)基于AutoGen 框架开发多智能体教学实 验 平 台;有 研 究(Liu Y,et al.,2024)使 用Auto GPT4 作为智能体基础,开发能够提出精准研究问题的CoQuest 智能体。 此类工具或平台主要提供问题生成(n=2)等功能。

3.学习者HOTS 类型

学习者HOTS 统计分析结果,如图3 所示。 现有实证研究最关注学习者批判性思维能力(n=23,占比21.7%)、创造性思维能力(n=22,占比20.75%)、问题解决能力(n=19,占比17.92%),也有学者将此三类称为HOTS 中最核心的部分(汪茂华,2018)。 其次,自我调节能力(n=16)和人机协同能力(n=13)的相关研究也较多。 有7 项研究涉及培养学习者元认知能力,6 项研究培养学习者计算思维能力。

7dd73fe98bf22ac10551cef7335311a2.jpg

图3 高阶思维能力统计图

仅统计学习者HOTS 频次, 难以观测不同学习场景下的研究重心, 因此本研究建立了培养场景与HOTS 之间的对应关系,分析不同HOTS 适用场景和不同场景下适合培养哪些HOTS。 如图4 所示,从研究场景轴(纵轴)看,写作场景下涉及6 类HOTS 培养,在此场景下研究者更关注学生批判性思维能力,也关注自我调节学习能力、元认知能力。专业课授课场景也涉及6 类HOTS 培养,其中,有8 项研究涉及批判性思维能力培养,与写作场景不同的是,该场景下主要关注学生问题解决能力、 创造性思维能力培养,有少量研究关注计算思维培养。编程和阅读场景均涉及5 种HOTS 培养,其中,编程场景主要关注学习者问题解决能力, 阅读场景主要注意学习者批判性思维能力。 口语对话场景和艺术创作场景下HOTS 培养种类较少,分别有4 种和2 种,其中,口语对话场景主要培养学习者问题解决能力和创造性思维能力, 艺术创作场景主要培养学习者创造性思维能力。 从HOTS(横轴)看,创造性思维能力涉及6类场景,其中专业课授课场景的研究最多。批判性思维和人机协同能力涉及5 类场景, 其中批判性思维在写作、专业课授课场景的研究较多,人机协同能力在写作场景的研究最多。 提升学习者问题解决能力、计算思维能力和元认知能力主要见于编程场景、专业课授课场景、写作场景。

47b7cf7205995ebecd552f0d5bacf424.jpg

图4 培养场景与HOTS 对应气泡

(二)GenAI 促进学习者HOTS 的培养模式

GenAI 促进学习者HOTS 培养是在理论支撑下构建的培养模式,为此,本研究首先系统梳理了实证研究中的理论基础, 建立HOTS 与理论基础之间的映射关系, 再深入挖掘GenAI 促进学习者HOTS 的实践模式。

1.理论基础

在68 篇实证研究中, 有47 篇文献明确指出应用的理论基础,15 篇文献未明确指出。 因1 篇文献中可能有多个理论基础, 故统计结果多于47 (n=53)。如图5 所示,人机交互理论应用频数最多,基于GenAI 发展学习者HOTS 首要是与GenAI 协同完成任务,因此研究者需要探究人机如何协同,故人机交互理论应用频数最多。其次是反馈理论、自我调节学习理论,均有6 项研究使用。教育目标分类也是实证研究偏好借鉴的理论之一, 用于评价学习者认知水平 (Wang,et al.,2024)、 开展质性编码分类(Lee,et al.,2024)等;研究者也多次使用学习支架理论,通过任务拆解达成HOTS 培养目的 (Liao,et al.,2024;Hu,et al.,2024)。 综合研究内容,理论基础多用于指导教学/学习模式的构建, 部分研究将教育目标分类、反馈理论等应用于教育测评,将最近发展区、群体感知等理论应用于GenAI 平台开发。

8dc1e1a702b70945b2b188421bbaa06e.jpg

图5 理论基础统计

为揭示发展不同HOTS 需何种理论基础支撑,本研究绘制了HOTS 与理论基础对应气泡图,如图6所示。从HOTS 轴(纵轴)看,培养学习者问题解决能力涉及的理论基础更为多元,有12 种理论。 培养学生批判性思维能力多以反馈理论、 自我调节学习理论为基础,如有研究(Saritepeci,et al.,2024)在专业课学习场景下,基于GenAI 提供个性化反馈建议,让学生甄别GenAI 生成内容的准确性与合理性, 从而激发其质疑、评价、决策等认知活动,提高批判性思维能力。 培养学生计算思维多以学习支架理论为基础,还有研究使用曼陀罗思维法、隐喻理论,促进计算思维提升(Hu,et al.,2024)。 从理论基础轴(横轴)看,人机交互理论、TPACK、反馈理论等应用范围最广,其中TPACK 主要用于K-12 教师专业发展项目(Kong,et al.,2024)、师范生教学设计场景(Lu,et al.,2024)中,以发展学习者问题解决能力、批判性思维能力等。 自我调节学习理论也被用于指导学习者创造力、问题解决能力的提升,通常以齐默尔曼(Zimmerman)提出的自我调节学习计划、行为表征、反思阶段为基础,设计人机协同教学模式,促进HOTS 的提升(Fidan,et al.,2022)。 由于GenAI 工具使用对提示语要求较高,较多研究依据学习支架理论,为学习者搭建提示语编辑框架(Su,et al.,2024),提升学习者计算思维、自我调节学习能力。

ece1ac3360c393c4fd940d65590cda2d.jpg

图6 理论基础与HOTS 对应气泡

2.实践模式

据统计,仅20 项研究(占比近29.4%)明确提出GenAI 促进学习者HOTS 的实践模式, 深入分析发现,GenAI 以其特有的提出问题、智能规划功能充当“助教”角色,以其答疑解惑、多模态反馈功能充当“学伴”角色,进而介入结构化任务驱动和开放式活动探究,形成“人机角色协同—教学活动指向”的双轴四类实践模式(见图7)。

图片[11]-生成式人工智能何以促进高阶思维能力培养?——基于68项实证研究的整合分析-AI Express News

图7 GenAI 促进学习者HOTS 的双轴四类实践模式

基于GenAI 助教或学伴的结构化任务驱动实践模式指学习者以完成论文写作、 程序设计等真实任务为目标,基于设定的理论框架,与GenAI 助教或学伴协同参与任务解决,促进HOTS 发展的实践模式。由此形成的两类实践模式如下:第一,基于GenAI 助教的结构化任务驱动模式。 例如,有研究(Liu Z,et al.,2024)将GPT-4 嵌入二语写作平台,基于二语学习框架,构建GenAI 支持的PPPEE(preparation、presentation、practice、evaluation、expansion)写作模式,该模式有助于促进学习者自我调节学习能力发展。 第二,基于GenAI 学伴的结构化任务驱动模式。有研究(Liao,et al.,2024)基于计算思维的分解、抽象、算法、调试和迭代5 个组成要素,结合支架式教学理论,赋予GenAI 学伴五方面功能:Python 编程任务拆解、知识点概括、算法流程可视化呈现、代码优化和代码评估。 学习者在完成编程任务时,基于教学支架逐步与GenAI 学伴对话交流,提升学习者计算思维能力。

基于GenAI 助教或学伴的开放式活动探究实践模式指教师创设真实学习情境,GenAI 辅助学生参与、探究并解决问题的实践模式,GenAI 可作为助教或学伴, 为学生制定探究计划和答疑解惑, 促进HOTS 发展。由此形成的两类应用模式如下:第一,基于GenAI 助教的开放式活动探究模式。 李海峰等(2024a)在“现代教育技术”课程中,基于人机协同学习理论和涟漪拓展探究法, 以ChatGPT 和QQ 系统为基础开发人机协同深度探究性学习系统和智慧助教,将课程学习分为课前人机协同实践探究、课中人机协同作品创新、课后人机协同作品完善。 显著提升了学习者问题解决和创造性思维能力。 第二, 基于GenAI 学伴的开放式活动探究模式。 埃克辛塔里斯等(Exintaris,et al.,2023)将ChatGPT 用于学习者化学实验探究中,基于学习支架理论,GenAI 作为学习者同伴,分析和记录对解决问题的想法,提供个性化答疑辅导和规划,显著提升了学习者问题解决能力。

(三)GenAI 促进学习者HOTS 的培养效果

为分析GenAI 促进学习者HOTS 的培养效果,本研究对68 篇实证研究中的数据收集方式、数据分析方式进行统计,结合具体测评材料开展分析。

1.数据收集方式

经统计,发放问卷是最普遍的数据收集方式(n=47),测评工具包括黄国祯等(Hwang,et al.,2017)改编的批判性思维能力测评问卷, 吴婷婷等(Wu,et al.,2024)重点关注的由动机、参与和自我效能感组成的自我调节学习能力测评问卷, 赖秋琳等(Lai,et al.,2014)改编的问题解决能力测评问卷等。此外,访谈、GenAI 工具使用日志、测试题、写作文本等,使用频次分别为28 次、21 次、16 次和11 次。其中,GenAI工具使用日志指学习者与GenAI 工具交流对话的文本数据, 研究者通过收集学习者提问数据与GenAI答疑数据以分析人机协同能力、批判性思维能力等;写作文本包括论文(n=5)、反思日志(n=4)、实验报告(n=2) 等形式。 屏幕录制也是使用频数较多的方法(n=7),有研究者通过屏幕录制记录学习者在线编程行为(孙丹,等,2024)、PPT 制作(Liu M,et al.,2024)、人机协同写作(Nguyen,et al.,2024)等,以细粒度分析学生行为过程,揭示隐藏在成绩之下的学习规律。

2.数据分析方法

量化研究的数据分析一般采用方差分析 (n=25)、独立样本t 检验(n=14)、配对样本t 检验(n=10)、Mann-Whitney U 检 验 (n=7)、Wilcoxon signrank 检验(n=6)、Shapiro-Wilk 检验(n=5)、Pearson 相关检验(n=2)、Quantile regression 分析(n=1)等方法。质性研究的数据分析一般采用文本分析 (n=23)、主题聚类分析(n=4)、扎根理论(n=2)等,由于实证研究中涉及大量对话数据, 更多研究采用文本分析法分析人机交互对话数据(Elim,2024);主题聚类分析以LDA 聚类(n=3)和K-means 聚类(n=1)为主,用于提取主题词或学习者情感词(翟雪松,等,2024b)。新型学习分析技术——行为序列分析(n=5)、认知网络分析(n=4)也被应用于实证研究,以揭示学习过程和心理认知情况。

3.实证检验效果

根据数据分析结果,GenAI 影响学习者HOTS效果可为三类: 第一类认为GenAI 显著提升学习者HOTS。 有48 项研究一致认为GenAI 能够促进学习者问题解决能力、计算思维能力、人机协同能力、自我调节学习能力培养。 第二类对GenAI 提高学习者HOTS 持中性观点,有15 项研究。 例如,有研究认为GenAI 不能显著提升学习者元认知能力和批判性思维能力,学习者一般较信任GenAI 生成内容,常不加修改便使用,建议学习者谨慎使用,不断反思生成内容的科学性和有效性 (李艳, 等,2023;Kim,et al.,2024)。第三类认为GenAI 会抑制学习者HOTS,有5项研究。本研究结合实证研究数据分析结果,对比分析促进和抑制HOTS 提升的10 项研究(见表2)。 深入对比两类研究发现, 有无完整的人机协同模式和实验周期均会影响HOTS 发展,此外,不利于HOTS提升的实证研究更多关注结果性数据测评, 而促进HOTS 提升的实证研究以过程性评价和总结性评价相结合为主,可见,测评方式会导致实证研究结果偏差。

表2 促进和抑制HOTS 提升的相关研究分析

13a7dd25967d4abf657f5ab818a5c556.jpg

四、研究讨论与启示

(一)研究讨论

基于前述研究结果, 本研究构建了GenAI 促进学习者HOTS 培养的内在机理(见图8),并发现:现有研究在写作、编程、口语对话等六大应用场景中促进学习者七类HOTS 培养, 呈现三类典型特征;GenAI 以“助教”和“学伴”角色介入结构化任务驱动和开放式活动探究过程,形成四类HOTS 培养模式;GenAI 支持下提升学习者创造性思维能力的影响因素包括人机协同应用模式与GenAI 使用时长。

图片[13]-生成式人工智能何以促进高阶思维能力培养?——基于68项实证研究的整合分析-AI Express News

图8 GenAI 促进学习者HOTS 培养的内在机理

1.GenAI 促进HOTS 的三类典型特征

针对研究问题1,现有研究主要在写作、专业课授课、编程、口语对话、阅读和艺术创作六大场景中,探索促进学习者七类HOTS 培养, 呈现出应用场景集中于正式学习场景、平台类型多样化演进、对具体HOTS 培养机理揭示有限等特征。

第一, 应用场景集中于正式学习场景。 基于GenAI 开展的实证研究多集中在写作、专业课授课、编程等正式学习场景,口语对话、艺术创作等非正式学习场景相对较少。一方面,由于前三类场景均可在线实施、组织性强,学习者易于使用GenAI,教师也易于组织教学活动;另一方面,不同类型HOTS 均能在此三类场景中体现,如批判性思维能力、创造性思维能力等, 基于此三类场景可深度挖掘学习者不同类型的HOTS 培养。

第二,平台类型多样化演进。实证研究从基于现有的大模型平台向自主开发的大模型平台和自主开发基于大模型的智能体平台演进。 一方面,GenAI 底层技术原理契合学习者HOTS 培养。 GenAI 本质上是借助内部优化的算法模型、大量的优质语料,通过研究历史数据的模式自动生成新内容的专用人工智能技术(刘明,等,2024b)。 其GPT 算法模型利用上下文学习机制(in-context learning,ICL),有助于增强学习者写作的逻辑性, 提升学习者逻辑思维和计算思维。 另一方面,基于现有大模型平台、自主开发的大模型平台、 自主开发的基于大模型的教育智能体平台, 研究者能够解锁传统场景下的新功能和新场景下的新功能。 例如,在文献阅读场景下,有研究(Shin,et al.,2024)借助GPT-3 提炼文献、分类整合文献内容,并借助DALL-E 2 大模型生成阅读卡片,使文献重点内容可视化,以启发学习者学术思维。

第三,鲜有研究揭示GenAI 促进具体HOTS 培养的内在机理。 内在机理指事物内部的运行原理和规律, 构成事物的基础要素和运作方式(万力勇, 等,2019)。现有实证研究多面向GenAI 技术平台开发,介绍技术功能以及测评培养效果,缺乏技术功能与具体HOTS 的内在联系探讨, 制约了HOTS 具体培养方式与效果监测。 本研究虽从宏观整体层面构建了GenAI促进HOTS 的内在机理模型,但对于具体的HOTS 发展仍需建构专用的、可操作的机理框架,因此,后续研究亟需厘清GenAI 技术功能与学习者各类HOTS 培养的内在关联,提供不同场景下的专用性结论。

2.GenAI 促进HOTS 的四类培养模式

针对研究问题2, 依据GenAI 角色和教学活动类型,GenAI 促进学习者HOTS 培养模式可分为基于GenAI “助教”或“学伴”的人机协同结构化任务驱动和开放式活动探究四类实践模式。

第一,基于GenAI 的结构化任务驱动模式。该模式多在写作、编程和阅读场景中发生。一方面,GenAI作为“助教”,其核心功能在于辅助教师对任务进行拆解(Zhang X,et al.,2024),提出不同难度的问题以引导学习者反思(Zhao,et al.,2024; Elim,2024),并辅以个性化学习反馈为学生解惑(Liu Z,et al.,2024)。因此, 该模式通常以教育目标分类和学习支架理论为底层框架,鉴于不同情境特点和任务类型,选择ICAPB(Zhao,et al.,2024)、基于隐喻的机器人编程方法(Zhang X,et al.,2024),提供可操作的实践流程。另一方面,GenAI 作为“学伴”,其核心功能包括智能答疑,头脑风暴,呈现写作文本的优秀案例和素材资源(Nguyen,et al.,2024),编程问题多种解决方案(Liao,et al.,2024),数据分析结果深层解释(Valverde,et al.,2024),助力提升学习者创造性思维、问题解决能力。在此模式下, 研究者多参考借鉴自我调节学习理论(Kong,et al.,2024)、批判性思维框架(Sharma,2024)、人机共创理论(Zhang C,et al.,2024),构建可实施的教学活动。

第二,基于GenAI 的开放式活动探究模式。该模式多在专业课授课和编程场景中发生。 一方面,GenAI 作为“助教”,通过发布作业和提供学习规划,合理安排学习者实践探究活动(李海峰,等,2024b),结合争论引导(李海峰,等,2024a)、情绪感知(Hu,et al.,2024)等功能,引导学习者对专业知识的创新思考和探究。 在此模式下,研究者结合学习支架理论、群体感知理论、争论学习理论,使探究计划在实践中达成,助力学习者元认知、自我调节学习、批判性思维能力提升。 另一方面,GenAI 作为“学伴”,其核心功能在于多模态反馈信息, 及时纠正学习者在实践探究过程中出现的方向偏差(Wang,et al.,2024),引导学习者熟练掌握实践探究的流程, 提供情感陪伴(Exintaris,et al.,2023)。 在此模式下,研究者基于反馈理论,提供语音、肢体动作、面部表情等多模态反馈信息,给予学习者情绪支持,促进元认知和批判性思维能力的提升。

最后, 尽管上述四类模式为GenAI 促进学习者HOTS 培养提供了实践参照,但GenAI 特有的“生成性” 特征体现并不明显, 这制约了GenAI 功效的发挥。 此外,现有教育学、心理学等经典理论中尚未有直接支撑GenAI 促进学习者HOTS 培养的理论基础。因此,后续研究亟需探索“内发式”理论基础和实践模式, 面向特定场景构建生成式教学/学习模式,并开展设计研究进行迭代推广, 以支撑GenAI 促进HOTS 培养研究。

3.GenAI 支持下提升学习者创造性思维能力的影响因素

针对研究问题3, 学习者在GenAI 支持下能显著提升问题解决能力、计算思维能力等HOTS,但部分研究认为使用GenAI 会降低学习者创造性思维能力。该结论与哈比卜等的研究(Habib,et al.,2024)发现一致,GenAI 对学习者创造力和创造性自信会产生负面影响。 此外,《科学》(Science) 中也有研究表明, 作家使用GenAI 生成的故事彼此之间的相似度高, 导致集体产生的小说内容范围更窄(Doshi,et al.,2024), 从而提出培养人类智能和人工智能相结合的共同创造力建议(Rafner,et al.,2023)。 深入分析创造性思维能力培养实证研究, 发现理论指导下的人机协同应用模式和GenAI 使用时长均影响学习者创造性思维能力发展。

第一,GenAI 支持下促进学习者创造性思维能力提升的相关研究,均构建了可操作的教学/学习模式,且有成熟理论支撑,如有研究(Liu M,et al.,2024)基于海斯(Hayes)的认知写作模型,构建人机协同写作模式,显著提升了学习者创造性思维能力。 相反,未能促进创造性思维能力的相关研究, 通常是GenAI 被直接应用于学习或教学过程, 没有指导实践的具体教学/学习模式 (Niloy,et al.,2024; Shin,et al.,2024)。 应用模式成为GenAI 促进学习者HOTS提升的必要条件。

第二,GenAI 使用周期是影响HOTS 发展的关键因素。 GenAI 抑制创造性思维培养的相关实证持续周期超过10 周(12 周、15 周),长期的技术应用会使学习者对GenAI 产生技术依赖, 且技术新奇感降低,影响创造性思维能力发展。这与邓瑞奇等的研究结果一致(Deng,et al.,2024),该研究发现,学习者使用GenAI 周期在1 周以内和5~10 周效果最佳,高于10 周则出现学习成效“回流”现象。一方面,GenAI 通过函数公式将数字符号与语词形式一一对应, 仅仅是对符号的预测与摆放(高洁,等,2024),看似是全新的创意,实际是对现有知识的排列组合,并非根本性的创新。 学习者长期使用GenAI,会简化获得答案的过程,更多的是被动接收信息,错失具有挑战性、原创性、高参与度的学习机会,限制创造性思维能力发展。 另一方面,学习者使用GenAI 出现技术的“新奇效应”,即新兴技术所带来的吸引力和效益会随时间推移而逐渐消失殆尽(Koivisto,2014)。 在GenAI技术使用之初,学习者受技术新奇性影响,投入较高的学习兴趣和学习热情,HOTS 水平显著提升(Suh,et al.,2024),而后续经历HOTS 发展瓶颈,学习者缺少必要的个性化支持服务和学习动力, 使得HOTS发展没有显著提升,反而出现“回流”现象(Deng,et al.,2024)。可见,未来研究亟需探索可持续的人机协同个性化支持服务, 以破解GenAI 使用周期不宜过长与HOTS 培养长周期之间的结构性矛盾。

第三,测评方式影响学习者HOTS 评价,进而导致实证研究结果偏差。 促进创造性思维能力提升的相关研究,更关注学习者过程数据收集;而不利于创造性思维能力提升的研究多对学习者结果性数据进行了分析。一方面,依靠结果性数据难以揭示不同学习者在认知风格、学习路径上的差异。 HOTS 发展是分阶段且高度个性化的过程(钟志贤,2004),受学习者的认知风格、先前知识、动机、情感和环境等多种因素影响,仅通过事后/结果性数据和学生自我报告数据, 不易区分不同学习者的HOTS 差异。 另一方面,结果与过程失衡,使HOTS 培养因果关系模糊。多数实证研究缺乏对培养过程的直接观察和记录,很难准确判断哪些教学策略或教学活动真正促进了学习者HOTS 的提升。后续研究可开展长周期、多阶段测评研究,以科学监测HOTS 的发展成效。

(二)研究启示

1.融合新型学习分析技术,揭示GenAI 促进具体HOTS 培养的内在机理

针对鲜有研究揭示GenAI 促进HOTS 培养内在机理的问题,后续研究可融合认知网络分析(吴忭,等,2018)、滞后序列分析(刘革平,等,2023)、有序网络分析(An,et al.,2025)等新型学习分析技术,揭示认知、行为、会话等多模态数据表象的深层意蕴,探究人机互动过程中促进HOTS 培养的复杂动态关系和内在机理。在揭示不同HOTS 的核心构成基础上,研究者需将重心放在GenAI 在哪些环节能有效介入,通过对话文本、点击流等数据选择合适的学习分析方法,揭示高HOTS 学习者的行为、认知特征,总结普遍规律。 例如,博彻斯(Borchers,et al.,2024)在数学学习场景中, 采用有序网络分析法整合了学习者与GenAI 导师的交互数据、 教师空间位置和课堂观察笔记, 探究师—生—机之间的行为如何随时间而演变,以及如何与学习者HOTS 相关联,为设计人机协同数学学习活动提供基础支撑。因此,借鉴新型学习分析技术有助于探究学习者非语言行为规律,便于推广延伸至不同学习场景,揭示特定类型HOTS的培养机理。

2.构建面向HOTS 培养的生成式人机协同教学/学习模式,开展设计研究迭代验证

针对现有实证研究缺乏 “内发型” 人机协同教学/学习模式的问题, 后续研究可基于GenQuest 框架,构建面向HOTS 培养的生成式人机协同教学/学习模式。 基于生成式教学、苏格拉底教学法等理论,立足真实性、个性化、生成性、反思性、理解性等学习者HOTS 培养原则, 剖析GenAI 与教学要素之间的协同关系, 对传统教学模式进行要素革新和流程再造,形成“生成式人机协同教学/学习模式”,指导一般场景下GenAI 教学/学习实践(黎加厚,2024)。 研究者可以“激发—任务—对话—迁移—结论—评价”为活动主线,构建生成式教学/学习模式,并开展基于设计的研究方法迭代完善, 在研究人员和一线教学人员共同改进下,使教学/学习模式更具操作性和可迁移性,以支撑不同场景的GenAI 教育应用。

3.加强学习者多模态、过程性数据挖掘,重视创造性思维能力养成规律

针对现有研究对HOTS 测评存在结果偏差和GenAI 促进学习者创造性思维能力观点尚存分歧的问题, 后续研究需强化HOTS 培养的多模态过程性数据挖掘,并重视创造性思维的养成规律。 首先,加强学习者多模态、过程性数据挖掘。 在最终作品、问卷调查、访谈等传统数据基础上,融入面部表情、眼动以及脑电等多模态数据, 综合学习者与GenAI 交互过程, 评价学习者提示语提问深度和成果 “贡献度”,实现数据三角互证,全面了解GenAI 对HOTS的真实影响。其次,重视学习者创造性思维能力的过程性养成规律。 从理论层面拆解“创造性思维能力”的内涵结构, 揭示GenAI 影响创造性思维能力的机理规律,借助多模态过程数据验证机理,构建新型教学模式,以培养学生的发散性思维和收敛性思维。在此基础上, 采用结构方程模型、 中介和调节效应检验,从GenAI 基础执行应用和深度创意应用频次(李曼丽,等,2025)、GenAI 技术可用性和有用性(王思遥,等,2024)、学习者AI 素养和自我效能感(Liang,et al.,2023)等多方面探析创造性思维能力的影响因素,以针对性培养学习者创造性思维能力。

五、结语

本研究采用系统性文献综述法, 对国内外GenAI 促进学习者HOTS 培养的相关实证研究论文进行了统计分析,剖析了GenAI 实证研究的主题特征、GenAI 技术功能与HOTS 的对应关系、理论基础与应用模式、测量方法与效果,并在此基础上提炼未来开展GenAI 促进学习者HOTS 实证研究的建议。 本研究仍存在一些局限:首先,研究选择的论文时间范围是在2022 年11 月至2024 年11 月, 由于主题新颖,检索的文献量有限,使得HOTS 类型未能全面涉及;其次,研究选取的文章都是实证类研究论文,理论类文章、综述类文章等未被纳入,因此关于GenAI 促进学习者HOTS 的理论模型等内容相对薄弱;最后,本研究尚未量化GenAI 促进学习者HOTS 的效果, 未来研究可开展元分析系统分析促进的效果。

原文链接:https://mp.weixin.qq.com/s/E3jo9oMItFPoDUTXpXPWRA

© 版权声明
THE END
喜欢就支持一下吧
点赞12 分享
远程教育杂志的头像-AI Express News
评论 抢沙发

请登录后发表评论

    暂无评论内容