8.6 建构“伴随数据采集”的数字校园应用评估环境(1 / 1)

数字校园建设要取得实效,关键在于应用。北京市教委要持续关注并强化学校应用程度,就要掌握学校信息化应用情况的有效信息,在此基础上加以监测分析,由管理者、建设者结合实际研究现象,分析成因,做到对症下药,体现决策的科学化和管理的精细化。传统信息获取方式包括学校报送、报表采集等,这些方式不仅效率低,学校积极性差,而且信息实时性不强,远远不能满足当前需求,特别是在教育信息化已发展至相当水平的今天,应采取系统化采集监测的手段,以满足全程性、实时性、细粒度、多终端、海量数据等条件下的常态化监测分析需求。

北京市教委通过“北京市中小学数字校园云服务平台”,动态采集来自全市范围内数字校园实验校各应用系统的应用状态数据。借助该平台,北京市教委建立了一套全过程伴随式采集、场景化监测分析、面向决策评估、全市“一盘棋”的监测评估环境。该监测评估环境在实践中充分契合了从学校运维到市教委决策各层次的需求,发挥了极其显著的效果。北京市数字校园应用监测评估环境的核心是一套全市数据接入网络、一套海量数据存储环境和一套监测分析模型。概要介绍如下。

8.6.1 全市学校监测数据采集接入网络

首先,北京市教委建立了一套能够连接全市数字校园实验校应用系统的实时采集网络,凡实验校的在线应用系统均可通过云服务平台提供的接口开展数据采集与汇聚。上述过程配置简单、便捷,学校只需对应用系统技术人员稍加培训,即可使他们快速完成配置,无须额外加大技术工作量。完成配置后,系统即可定时采集汇总监测数据。数据监测主要针对两类信息,一类是系统应用访问和用户行为情况,包括系统访问量、访问来源、访问时长、跳出跳入等信息;另一类是系统运行情况信息,包括网络连通、服务运行、页面加载等信息。

信息采集过程采取自动任务的形式,制定好采集规则后,各类信息自动汇总传输到云平台,工作人员只需定期开展对采集任务的值守巡查即可,维护工作量小,采集效率高。目前,平台一般采取每5分钟一次的数据采集频率,如此高密度的数据更新汇总为全市实时监测提供了源源不断的数据保障。

8.6.2 数字校园应用监测数据存储环境

数字校园要实现监测分析的实时、多维、细粒度,就必须依托海量的数据储备和科学的组织管理。目前,数字校园云服务平台积累的监测信息已超2亿条,文件数据已近3TB[1],且这些信息和数据以每年40%左右的速度持续增加,若不加以科学有序的组织,势必引发“数据爆炸”,形成积重难返的巨大负担。为此,项目研究者实践了一套符合北京市数字校园特点的“分布协同+混合存储”的存储管理环境。

首先,在存储架构上,充分利用现有市级云平台与各学校数字校园构成的“类分布式集群环境”,市级、校级分工存储,优化管理。具体地,各类结构化的监测数据随日常生成直接汇入市级云平台,由市级统一管理,如各区、学校有应用需求,可向市级申请提供拷贝;非结构化数据,如系统页面快照等,日常生成后存储在学校服务器,由学校自主管理,但必须保证近1年内形成的文件数据能够在线浏览。此外,视数据的重要程度,学校还可提交市级平台备份保存。分布式存储和协同分工,优化了市级和学校的存储组织形式,既避免了市级数据太集中造成管理成本巨大,也有效控制了分散管理时学校可能存在的隐患。同时,市级、学校能够互为备份,进一步提升了存储架构的稳定性。

其次,在存储技术上,采取传统关系数据库行式存储与列式存储混合的模式,以行式数据库存储各类核心业务关系数据,以列式数据库存储日志化的学校监测数据和学生教师行为轨迹数据。在开展统计分析时,以业务数据为牵引,触发列式存储环境开展分布计算处理,这样既保证了后台业务表达逻辑的清晰,也保证了海量数据运算的实时高效。

8.6.3 数字校园应用监测分析模型

数字校园拥有了坚实可靠的数据体系和存储环境作为保障,还需建立一套监测分析模型,以实现结果表达和展示服务。在建立数字校园应用监测分析模型过程中,工作人员充分考虑了学校、区、市教委的共性需求和个性化需求,制定了差别化的分析服务模型。在共性需求方面,数字校园应用监测分析模型满足各级管理者对系统访问情况、系统运行监测情况的统计图表查询和明细记录查询需求;同时,对区级提供全区层面的学校横向对比、分类统计、聚合关联、排名等服务;对市级提供全市层面各学校和各区的统计聚类、定期报告等服务。这样不仅满足了一线日常管理维护的需求,也满足了区级区域统筹协调的需求,更进一步满足了北京市教委的全局决策需求。

在最近两个年度的全市数字校园星级学校评估工作中,市级监测分析已成为评估学校数字校园发展情况的重要得分依据,同时,在日常监测及雾霾停课等专题分析中也发挥了支撑作用。基于数据采集的数字校园应用监测评估环境的建构,不仅为当下数字校园管理支撑提供了全新手段,也为今后中小学信息化管理服务的扩展与提升预留了空间。