方海光[1]
教育大数据视角下的教与学方式改进研究,这个主题目前来讲比较热,还处于一个学术研究的阶段。本文试图提供一些新的视角,用一个基本的理解问题的方式,研修三个哲学问题,第一个问题是我是谁,第二个问题是我从哪里来,第三个问题是我到哪里去,通过这个视角来认识教育大数据,尤其是在课堂上它真正的定位。
一、教育大数据是什么
大数据不在大,重在发现和挖掘数据的价值,关键是用好数据。
——雷朝滋司长
“大数据”当今很热。有人甚至说掌握大数据的人可以像上帝一样俯瞰整个世界。当然,若有这样的人,大数据就不叫大数据了。
——张景中院士
发展教育大数据,推进基于数据驱动的教育应用,为教育教学决策提供有效支持,提高教育质量和教育治理能力,为破解教育发展难题提供了有效途径。教育从业者通过大数据来分析学习进程和结果,进一步改善教学的方式与方法,有助于实现“改善学习成果,促进自主学习”,有利于大面积地提高教与学的效果,优化学生的素质。目前教育大数据的重要性已经提升到国家战略层面,教育大数据中心建设、区域数据共建共享应用成为主要的建设模式,对个体学习全过程数据分析和精准数据评测学习成为主要的应用场景。
教育大数据是全学习过程的数据,不仅仅是一种技术,还是利用新兴资源的新思维、新视角和新教学策略。不要纠结教育数据够不够大,无论是大数据还是小数据,能够进行知识共享共建的都是好的教育大数据。教育大数据包含三层含义:第一个含义,教育大数据是教育领域的大数据,是面向特定教育主题的多类型、多维度、多形态的数据集合;第二个含义,教育大数据是面向教育全过程的数据,通过数据挖掘和学习分析支持教育决策和个性化学习;第三个含义,教育大数据是一种分布式计算架构方式,通过数据共享的各种支持技术达到共建共享的思想。也就是说,我们把教育大数据定义为:面向教育全过程时空的多种类型的全样本的数据集合。教育大数据不仅仅是建设教育大数据中心,不仅仅是分析全过程学习数据,更多的是一种共享的生态思想。
与用传统方法收集的教育数据相比,教育大数据有更强的实时性、连续性、综合性和自然性,并使用不同的应用程序来分析和处理不同复杂度和深度的数据。传统教育数据收集的大多是阶段性的数据,而且大多在用户知情的情况下收集,使用的分析方法也通常是简单的统计分析方法。教育大数据收集的是整个教育教学过程中静态和动态的所有数据,可以在不影响教师和学生活动的情况下,连续记录整个教学活动的所有数据,如教学资料、互动反映和学生在每个知识点上停留的时间等。总之,教育大数据具有四个特征,即全学习的过程、多类型的数据、跨业务的价值、细粒度的密集。
目前教育大数据应用有三种方法,即数据挖掘强调处理技术,学习分析强调业务分析,数据可视化强调直观展示。数据挖掘就是从大量的、有噪声的、不完全的、模糊的、随机的实际应用数据中提取有效的、新颖的、潜在有用的知识的非平凡过程。学习分析运用多种方法采集、存储和分析学习者数据,如移动终端的数据和现场智能数据等,再使用多种技术来分析处理这些数据,最终应用于教育者和学习者,产生评估、预测和干预。数据可视化可以分为两种不同的类型,即探索型和解释型。探索型帮助人们发现数据背后的故事,而解释型则方便将数据展示给人们看。最常见的数据可视化方法包括以下五种:第一,2d区域;第二,时态;第三,多维;第四,分层;第五,网络。如何为数据展示选择正确的方法是比较困难的。
二、教育大数据从哪里得到
教育大数据的分析一般需要经过采集、处理、分析、呈现、挖掘、预测等几个过程,在课堂中,可能选择这个流程当中的某几个环节进行组合。对于一个典型的在线课堂或者平板课堂,目前看得见的数据比以往的时候更多,所以很多老师在面对这样的情况时,最大的困惑是,这么多的数据到底哪些数据可以用。团队研究提出基于教育大数据的课堂数据模型五要素,页面访问情况、视频观看情况、讨论情况、联系情况、测试情况,基本上围绕这五个纬度,参考它们之间的相关度,由此可以分析出来学生基本的参与度和表现度。
例如,全球少儿英语旗舰课程Big English,采集分析学生的学习进度、学情反馈、阶段性成果,了解学生在每道题上花费了多少时间、最长的是多少、最短的是多少、平均又是多少、听力和阅读水平是不是一样、做了几次以后才达到现在的水平的,以实现学习过程的动态管理、学习结果的动态管理。
对于课堂来讲,教育大数据应用过程有三个阶段:第一阶段,采集存储,数字化和非数字化的混合;第二阶段,业务应用,精准教学和个性化的融合;第三阶段,价值共享,学习分析和数据挖掘的整合。目前在学校这个层面,要真正达到基于大数据的这种效果,应该是一个跨场域的学习,而不是基于唯一的平台的学习。学生在课堂中拿着平板学习,在家里拿着笔记本学习,有一个跨平台、跨场域的学习,通过大数据进行一个学习的连接,利用教育大数据将学校非正式学习活动正式化,学习任务分解策略选择,记录过程实时指导,过程评价结果测试,深度学习改进完善。
教育大数据分析的手段和方法,包括常规分析、数据挖掘、商业智能、大数据技术、数据可视化等,从常规的这种分析的方式,往后朝着大数据的方向去延伸,如序列分析、决策树、关联分析、聚类分析、神经网络。教育大数据分析和预测基本过程,根据历史的数据来进行建模,通过当前的数据来进行预测。现代数据分析是对商务智能的进一步拓展和延伸,随着云计算、大数据、移动分析等新兴技术的出现,以及数据挖掘技术的不断成熟,数据分析将迎来更多的机遇与挑战。
三、教育大数据用到哪里
面对具体教育业务,教育大数据技术对教育的管理、教学、学习、科研和评价等都产生了很大的影响。通过教学过程中的数据,对教学反馈进行个体和群体的质量诊断,即学习检测和学情反思。借助教育大数据可以实时采集和实时反馈,当教师准确及时掌握学情,才能更好地进行教学改进。教研员精准教研,不断研究新方法,校长可以实现精准管理、精准学情;教师可以精准教学、精准发展;学生可以实现个性化学习,走向智慧化学习。智慧学习以学习者为中心,在任意时间、任意地点,以任意方式和任意步调(4A),进行轻松、投入、有效的(3E)学习。智慧学习是依托智慧学习环境建立的,智慧学习环境的“智慧”性体现在四个方面,分别是资源匹配、教学逻辑、用户体验和交互反馈。
对于课堂而言,教育大数据真正的价值是让课堂形成一个闭环的反馈,通过数据评估反馈,让每一个学生更接近学习目标,这是教育大数据对课堂的真正创新之处,而这种反馈就是传统经常提到的诊断,进而来进行教学的一些改进。教学大数据反馈的力度,可以根据教材结构、学习活动、知识点、每堂课、每个单元、每个项目进行数据采集。
教育大数据驱动了资源对数据的需求,与集中的学习记录数据中心不同的是,学习数据还可以分布式地存储在学习资源中。学习的数字化、广泛化和移动碎片化,使得学习者的学习变得容易、随时随地。灵活的学习方式让学习不再局限于课堂之上,学习方式改变对学习资源设计也提出了新的要求。学习过程即学习者与各种相关元素发生交互的过程。学习者与学习者之间以及教师之间的交互,其主要是学习内容,因此学习者与学习内容的交互实际上是学习者与学习资源之间的交互。人们所熟悉的数字化学习资源,如微视频、音频、图文阅读材料等,往往缺乏有效的学习交互。对学习资源进行合理的交互设计,可以有效地激发学习者的学习兴趣,增强学习者的学习动机,引导学习的进程,帮助学习者完成自我评估等。
在数字化课堂学习过程中,通过网络技术不仅可以使教育资源实现共享,还可以实现教师与学生、学生与学生、教师/学生与终端之间进行教与学的交互与反馈,教师、学生可以采取合作、竞争、讨论、交流等多种形式进行学习。一方面,通过数据挖掘和数据分析以及可视化等技术可以实现对课堂上教师和学生的教学行为和随堂测试数据信息的采集、处理、存储以及可视化呈现;另一方面,通过基于数据的教学策略优化,可以减轻教师教学负担,激发学生学习兴趣,实现教育资源合理配置,促进信息技术与教学过程的深度融合。
在基于PAD的数字化课堂中,课堂教学四要素的含义随之发生了变化,教师不再只是知识的传递者,而是教会学生利用新技术进行学习,帮助学生掌握知识的引导者。学生也不再只是知识的接受者,而是要主动学习、自主探究或者通过小组讨论,在教师的指导下利用新技术去分析问题和解决问题,甚至能够主动地发现和提出新的问题。教学内容也突破了教科书的局限,其形式还可以是多媒体材料、电子教材,甚至是在线教育资源和其他类型的资源,这些资源在基于PAD的数字化课堂中统称为“教材”。在课堂教学四要素中,教学媒体是由各种硬件和软件构成的数字化教学环境。例如,交互式电子白板、服务器、无线网、PAD、智能手机、课堂反馈系统等。
在基于PAD的数字化课堂学习环境中,教师、学生、教材和数字化环境构造了新的四维交互关系,即基于PAD的数字化课堂学习环境模型——PADClass 模型(见图1),课堂教学的四要素分为:教师、学生、数字化环境和教材。该模型体现的是以学生为中心,教师、数字化环境和教材构造了与学生进行交互的环境要素,为学生的学习提供教师指导、技术支持和资源支持。基于PADClass模型的数字化课堂中,教师可以根据需求选择合适的教学模式,如讲授式、自主探究式、合作探究式等;可以进行课堂管理,例如查考勤、查看学生的屏幕、锁定学生的屏幕、发布信息;教师还可以进行课堂测试,对所讲的知识进行测试,了解学生的掌握情况。教学环境与传统教学的教学媒体相比,最大的特点是网络和智能教学系统得到了充分的发挥。在数字化教学环境中,服务器和智能教学系统等为课堂教学提供硬件和软件的支持,交互式电子白板和PAD用来呈现教学内容和提供课堂交互,教材包含了各种纸质教科书、电子教材和在线教学资源等内容,为数字化课堂的教学提供了视频、音频、动画、图片、文字等丰富的教学资源。
图1 基于PAD的数字化课堂学习环境模型——PADClass模型
根据PADClass模型的特点和课堂反馈系统的功能,可以把课堂数据分析分为四个方面,即教师分析、学生分析、活动分析和资源分析(见图2)。其中教师分析根据教师的课前备课、课上授课和课后评价等行为分为备课分析、导学分析、互动分析、评价分析、教学目标分析和课后分析;学生分析根据学生课上行为和作业测试情况分为互动分析、评价分析、作业分析、测试分析和学习结果分析;活动分析根据活动的类型和时长分为活动类型分析和活动时长分析;资源分析根据资源的类型、大小和使用情况可分为资料分析和使用频率分析。它们为分析教师与学生的行为和教学目标的完成情况提供了科学精确的数据依据。
图2 基于PADClass模型的学习过程分析
数字化课堂学习过程数据挖掘就是在数字化课堂环境下,对教师教学和学生学习过程中知识发现、信息提取的过程。所谓课堂信息就是经过加工过的教学过程中产生的数据,它对教师和学生的决策或行为有现实或潜在的价值。课堂数据作为课堂过程的客观反映,学习过程数据经过过滤、解释、加工后,转化为信息存在。数字化课堂学习过程数据挖掘的整个过程可以分为四个阶段:数据预处理阶段、数据挖掘阶段、学习模式评估阶段和知识表达阶段。在基于PADClass模型的课堂数据挖掘系统中(见图3),数据预处理阶段模块是数据仓库系统建立的基础,是对数据的整理、集成、筛选和转换。数据挖掘阶段采取特定的算法来抽取隐藏在数据之中的课堂信息。学习模式评估阶段是根据一定的评估标准对数据挖掘的结果进行评价与可行性分析。知识表达阶段就是采用一定的方式展示挖掘结果,其展示方式可以是可视化表达、图形或表格表达等。在基于PADClass模型的课堂数据挖掘系统中,数据挖掘的方法包括关联分析、聚类分析、回归分析等。关联分析指搜索数据,从中寻找重复出现概率很高的模式或规则,即发现频繁项集,进一步分析关联,发现项集之间具有统计相关的规则。
图3 基于PADClass模型的课堂数据挖掘系统结构
基于PADClass模型的数字化课堂基于真实教学情境进行,实时地把学生学习过程客观地反馈给教师,即时客观地反馈学生的学习情况。教师可根据客观反馈数据及时调整教学行为和教学策略,深度理解学生学习过程变化,对学生进行更具个性化的指导。
以物联网、云计算和大数据为代表的新一代信息技术的快速发展,将现代教育从数字化逐渐推向智慧化。大数据技术已经成为数据时代建设智慧教育的重要支持,能够提高教育管理、决策与评价的智慧性。学习过程中产生的数据作为学习分析的支撑,已经成一种共识。
[1] 作者简介:首都师范大学教授。