对K-12教育中AI驱动的智能辅导系统(ITS)的系统综述

2026年1月23日 | 新锐看点

论文摘要:
过去十年中,人工智能(AIEd)在教育中的应用呈指数级增长,尤其是智能辅导系统(ITSs)。尽管ITS的使用日益增多,并承诺提升学习效果,但其真正的教育价值仍不明确。本系统综述旨在识别ITS对K-12学生学习和表现的影响,以及目前用于评估的实验设计。本系统综述分析的28项研究共计4597名学生(N = 4597),采用了干预持续时间不同的准实验设计。总体来看,我们的发现表明,ITS对K-12教育学习和表现的影响总体上是积极的,但与非智能辅导系统相比,效果有所缓解。然而,需要更多更长干预时间、增加样本量、更多样化的研究。此外,还应探讨使用人工智能进行教学的伦理影响。

文章主要内容介绍:

根据联合国教科文组织的数据,全球正面临教育危机,超过2。5亿儿童辍学,另有6亿儿童未能达到最低能力水平。联合国教科文组织可持续发展目标指出,可持续发展只能通过利用数字革命的潜力实现,而数字革命日益涵盖人工智能(AI)。鼓励开展研究项目,探讨新技术如何影响教学与学习,以及如何在教育中以伦理和负责任的方式使用。

现有研究强调为学习者提供21世纪技能的重要性,包括更有效地使用数字技术进行学习。教育资源和学习活动通过数字学习环境越来越多地向学生传播。这些环境旨在根据用户的特性、需求和行为提供适度调整的教育。人工智能在教育资源中的应用是一个不断增长的产业,有望通过创建个性化学习的辅导系统来改变教育。

在这方面,过去十年中,人工智能(AIEd)在教育中的应用实现了显著增长。AIEd涵盖了广泛的应用领域,从为个性化内容量身定制内容的自适应学习平台,以满足个人学习风格和节奏7,到基于人工智能的分析工具,预测学生表现并为教育者提供可作的洞察。AIEd的发展扩展了教育工具箱,包括用于学生支持的聊天机器人、用于语言学习的自然语言处理以及自动化行政任务的机器学习,使教育者能够更专注于教学和指导。由于技术融合,这些工具已发展成为多用途的生成预训练变换器(GPT)。GPT,如OpenAI的GPT-4、Anthropic的Claude和谷歌的Gemini,是大型语言模型(LLM),结合了大量语言数据集和强大的计算能力,创建智能模型,经过训练后能够生成复杂、先进的人类水平输出以文本、图像、声音和视频的形式呈现。这些模型能够进行动态的人机对话,每次用户输入新提示时都会持续以新颖的输出响应,这些模型是在涵盖物理科学、自然科学、医学和教学法的庞大人类知识库中训练的。因此,AIEd很可能在未来几年继续成为关键话题。

计算机辅导最早于20世纪60年代末引入课堂,此后经历了显著改进,常常融入人工智能的进步。这些更新后的辅导系统现在通常被称为智能辅导系统(ITSs)。ITS是通常配备AI程序的软件程序,能够检测、理解并适应学习者的进展。他们监控学生进展,识别困难和错误,引导结构化的学科内容,提供并调整难度等级,从而制定最佳学习路径。一个著名的智能系统例子是Duolingo,一款针对每位用户个性化教学的移动语言学习应用。ITS在现代社会中越来越普遍,支持传统的教育环境如课堂以及远程学习或专业培训等替代学习环境。根据联合国教科文组织2021年政策制定者指南,目前AIEd是研究最广泛的应用。

然而,虽然关于ITS对K-12教育影响的文献有限,相关研究常常混淆了ITS对儿童和成人学习,或学校与职业环境中学习的影响。尽管ITS的使用日益普及,并为教育行业带来了巨大潜力,利益相关者仍在努力在提升学习成果和减少教育不平等的潜力与实际教育价值之间取得平衡,而实际的教育价值仍然不确定。

2016年,Kulik和Fletcher对50项ITS受控评估进行了荟萃分析;他们的发现显示,科学界对其有效性缺乏共识。然而,他们也证明了ITS可以成为非常有效的教学工具。虽然许多研究表明,ITS对学习的影响可能超过人类导师,其他人提出了质疑并凸显了ITS的局限性。另一项关于高等教育中人工智能应用的系统综述强调了对ITS有效性研究的必要性。该综述指出,课堂上使用新技术带来的积极成果几乎从未归因于新颖性效应尽管已有研究表明,新颖性本身可以提升学生的记忆力和学习能力。

话虽如此,霍内拜因和赖格鲁斯最近的分析说明了ITS能够极具效果,但前提是它们在适当条件下体现了扎实的教学特征。他们发现,诸如即时反馈、指导练习和适应性等关键特征并非多余的补充——它们基于数十年的教学理论,并且对学习有明显的积极影响。此外,这些特性的有效性在某些情况下可以最大化,比如真正利用个性化、主动学习的领域和情境。他们认为,将一个成熟的“传统”学习方法与一个半成品(缺乏这些特征)的ITS进行比较,既不公平,也缺乏信息。他们的核心观点是,为了“改进”而非“证明”ITS的有效性,ITS的设计者必须实现已被验证的功能并澄清其使用的情境变量;他们声称,当ITS与教学理论高度契合——在合适的条件下为合适的学习者应用正确的方法——它就能持续产生积极的结果。

在这方面,Pane及其同事进行了一项纵向研究ITS效应的研究。在这项大规模随机对照试验中,他们评估了认知导师代数I(CTAI),该课程为学生提供了个性化教学,以满足其具体需求。CTAI采用多模态方法,包括图表、方程、文本和概念,这些内容在现实问题场景中进行了背景化。他们展示了CTAI在提升学生代数熟练度方面的有效性。这一改善仅在持续实施后显现,他们观察到第二年,尤其是在高中,学生表现优于对照组,效应值约为+0。20个标准差。他们声称,这种效果相当于多学习一年代数的好处。然而,研究也显示,初中CTAI的使用在学习成果上表现出类似但不显著的趋势。总体来看,本研究结果与霍内拜因和赖格鲁斯的论点有一定一致性也就是说,ITS中部署了正确的功能,但实际使用情境变量只在高中中满足,而非初中。当然,这只是“适合合适的学习者”的正确工具,但其他混杂因素可能影响了结果,比如教师和学校在适应ITS和混合学习模式的初期实施期内出现的问题,而这些在不同学校层级之间可能存在差异。

史密斯和舍伍德指出,自计算机诞生以来,研究人员一直致力于开发与人类导师同等有效的计算机导师。范伦以及库利克和弗莱彻有助于理解ITS相较于其他学习方法(如人工辅导或无辅导)的整体效果,无论学习环境(成人培训、学校环境等)。与Pane等人的结果相反。库利克和弗莱彻在对ITS的综述中,仅有三项研究在学校环境中进行,且未发现ITS的部署对学校(K-12)表现有实质性提升。这一发现强调了进行系统性综述的重要性,涵盖ITS在小学和中学(K-12)教育中的有效性和改进,类似于Zawacki-Richter等人对人工智能在高等教育应用的综述。其目标是为各级利益相关者提供关于ITS在教育中开发、部署和应用的指导。

因此,ITS相关的科学知识差距不仅体现在提供积极学习成果方面的效果,还包括哪些特征和情境变量对ITS的成功部署有益。因此,需要进行全面的研究,以探讨AIEd在小学和中学(K-12)教育中的应用及其影响。尽管有多年关于ITS实施的研究和案例研究,但对其对学习质量的影响知之甚少。此外,目前尚无系统或普遍的理解,知道如何将其他形式的人工智能应用于优化学习成果

虽然AIEd在更广泛的伦理问题上超出了本综述的范围,但我们理解该领域已有丰富且不断发展的文献。从伦理角度来看,利益相关者应确保在教育环境中部署的ITS系统是公平、公平、透明且对学习者有益的。AIEd中的伦理涉及多个伦理维度,如公平、责任、透明度、问责制、能动性、可解释性和可解释性 ,这有可能使人工智能应用更具可信度和被接受度。

本系统综述旨在评估由人工智能创新推动的ITS研究的最新进展,并最终解决以下问题:

1。评估ITS效应时使用哪些实验设计?

2。ITS对K-12学生的学习和表现有什么影响?

原文下载:s41539-025-00320-7

声明:本文转自然网站(www.nature.com),版权归原作者所有。