台州科技职业学院 台州 318020
摘要:学生学业数据量大,涉及维度广,如何针对学业表现构建精确的评价指标体系,客观反映学情状况,及时反馈教育决策者和监督者,是当学教育管理的难题之一。本文基于学校的多个平台数据系统,围绕学业表现精准评价问题,构建德智体美劳五个维度的学业评价指标体系,通过深度学习方法构建学业预警模型,为学校学风管理提供有益参考。
关键词:教育大数据,深度学习,学业评价
中图分类号:G712 文献标识码:A
0 现状分析
学生的学业表现是教育大数据应用研究的一个重要方向,也是学校教育管理者、教师、家长共同关心的焦点。目前的学业评价存在以下问题:
1.评价内容传统、片面。在评价内容上,主要以知识和技能目标为主,对情感、态度和价值观,过程与方法等目标评价较少。高职院校学业评价偏重记忆性知识,缺乏综合应用能力的评价,评价结果不能真实反映学生学业全貌。传统的学生学业表现评价基于课程成绩,尽管这类课程成绩可能基于工作过程,比如成绩包含了平时成绩,期中成绩,实操成绩以及理论考试成绩。但是这些成绩也仅仅知识该生与课程相关的课业成绩,很难从宏观角度评价这个学生的在校综合表现。比如有些学生学习成绩较好,但是其体育锻炼不合格,或者课堂表现较好但是平时表现较差,在人际关系处理,寝室卫生,实践劳动等方面比较落后。因此如何全面、综合的对学生进行评价是目前学业表现评估的新问题。
2.评价方法单一、落后。目前,高职院校内部的学业评价制度散见于考试考务办法、人才培养方案之中,系统性不强。现有的评价方法往往基于学生的学生的课业数据,在计算汇总过程中仅仅通过简单的加权平均的方法进行评估,不能对学生的学业表现进行精准评价。有的用成绩评定代替学业评价,将学业评价片面地理解为给学生学业质量评定分数,没有看到评价不仅包括量化评价,还包括质性评价。
3.评价过程不够严谨严密。教师形成性评价开展随意,对学生课堂表现随意评价,作业也以简单的回忆性知识检测为主,无需大量查阅资料或练习,难度较低。另外评价实施不严密,存在重视期末考试,轻视补考和重修考试的现象,期末考风抓得严,但补考、重修考试不够严格。教师对于补考重修考生往往放宽要求,导致落后学生学业表现更加落后。
基于以上问题,本文综合在校表现的多维度评价数据,对数据进行解析分类,构建科学的学业评价指标体系,对学生的生德、智、体、美、劳五个一级指标进行评估,结合深度学习的大数据处理算法,实现大学生学业表现的精准评价。
一、学业评价指标体系构建
基于学生在校学习生活多类平台系统,收集学生在学习、生活多方面的表现数据,构建学生“在校档案立体数据库”,形成整合型教育数据系统。整合型教育数据系统,通过将分散在校内各类管理信息系统、业务系统的数据集中收集存储到统一的数据库中,统一进行管理和分析,可以提升教育数据挖掘分析的深度与效果。依据获得数据的来源场合,从以下七个方面进行数据收集:1.招生管理系统中的档案数据,其记录了学生的基本信息;2.教学平台数据,其记录了教务管理系统中学生的各门课程考试成绩;3.在线学习平台数据,其记录了课堂教学过程中学生的学习行为数据;4.体育系统中的体测平台数据,其记录了学生体育锻炼和测试的各项数据;5.教育科研平台数据,其记录学生参与创新创业、技能比赛数据;6.学生社会实践平台数据,其记录学生成长过程中的学习工作行为;7.图书借阅数据,记录了图书管理系统中学生的阅读记录、借阅次数等。
在完成学生多平台全方位数据的收集后,需要有效地提取分析学生的数据,使得数据能更客观、全面、科学的反应学生在校的学业表现。因此需要对各平台数据进行分类同时构建评价指标体系。学生的综合学业表现内容涵盖学生德、智、体、美、劳五个一级指标,主要数据组成为德育表现数据、智育数据、体能素质数据、美育课程数据、劳动教育相关数据五大部分。以下对学生的在校档案立体数据库按照以上五个方面进行分类。
1.1德育数据
德育数据分为4个二级指标,分别为:思想政治素养、行为素养、人文素养、职业素养。如下表1所示。
表1 德育数据构成
一级指标 | 二级指标 | 三级指标 | 数据来源 |
德育 | 思想政治素养(25%) | 1.提交入党申请书。 2.获得党校、团校培训并获得《结业证书》; 3.新生军事训练成绩; 4.获先进集体荣誉或优秀个人等荣誉次数; 5.《学生手册》考试成绩 ; ...... | 组织员 辅导员 |
行为素养(25%) | 1.“文明寝室”和“学习型寝室”评比获奖; 2.参加志愿服务或公益劳动次数; 3.每学期课堂、晚自修、阳光长跑考勤全勤者; 4.班级获评“诚信考场”示范班级; 5 参加“三下乡”等社会实践活动次数; ...... | 学工部 校团委 体育部 | |
人文素养(25%) | 1.去图书馆借阅相关书籍; 2.参加校内各类协会、社团组织的各项活动; 3.参加上级部门组织的各项活动与比赛; 4.担任校、院各级学生干部; 5.参与第三课堂等校园文化建设活动; ...... | 图书馆 校团委 | |
职业素养(25%) | 1.通过外语、计算机、普通话等级考试; 2.参加各类技能大赛; 3.参加创业创新大赛、挑战杯或职业生涯规划等大赛活动; 4.参加科研专利研发; 5.参加就业创业类相关讲座或活动; ...... | 教务处 校团委 |
1.2智育数据
智育数据主要指各文化课程成绩,数据主要来源于教务系统,该成绩由学生的多门课程成绩组成,每门课程成绩均为学生的总评成绩,总评成绩包含学生的平时成绩、期中成绩、期末成绩。平时成绩包含学生在学习平台上累计的数据,包括:课程资源浏览次数、线下作业完成次数、蓝墨云课堂参与互动次数、出勤率,举手、抢答次数、线上作业完成次数,参与讨论、问卷次数等。
表2 智育数据构成
一级指标 | 二级指标 | 内涵说明 | 数据来源 |
智育 | 选修课程 | A课程 B课程 .... | 教务平台 |
必修课程 | C课程 D课程 .... | 教务平台 |
1.3体能素质数据
体能素质数据主要指体育方面的成绩数据,主要包括:体育课或体测成绩,学生阳光长跑次数等成绩。数据来源于教务平台和悦动台科微信公众号。
1.4美育和劳动教育相关数据
美育课程成绩获取按照学校人才培养规定执行,学生至少选修2个学分艺术教育课程以上,劳动教育数据来源于学生的劳动教育相关课。以上两项数据来自于教务处。
二、基于深度学习的学生学业表现精准评价模型
2.1数据预处理
每个学生的学生学业表现均可由以上德智体美劳五个方面的数据系统组成:学生学业表现矩阵={德 智 体 美 劳},首先对每个方面的数据进行预处理。
针对德育数据,根据思想政治素养、行为素养、人文素养、职业素养四个方面从学工部团委等数据系统导出,对三级指标设定权重和分值,根据学生实际的表现情况生成每个方面的德育数据。针对智育、体育、美育、劳动教育数据,分别从相关的教务平台等数据系统导出,分别对每个维度进行数据特征提取。
根据以上德智体美劳五个方面的数据系统分别提取特征,设得到的自变量矩阵X如下:
其中X(t)=在校期间不同阶段对应的特征矩阵,m=学生数,n=特征个数,T=时间度量间隔,以学期或者月份进行表示。
由于数据维度很高,且格式不统一,因此需要对原始数据进行预处理。先对特征矩阵X中的特征X(t)进行Z-Score标准化。利用主成分分析方法对每个固定周期特征进行降维,降维后的特征。
设定Y为因变量矩阵,初始化因变量。将学生学业表现的各个维度的各项成绩进行加权平均,按照综合成绩分为优秀、良好、中等、及格、不及格五档,对应的分数分别为:90以上,80—90,70—80,60—70,低于60。以分数段进行独热编码,形成学生成绩标签Y。
2.建立基于长短时记忆网络的学业评价模型
构建长短时记忆网络模型,将同一学生连续的若干个单组特征数据集输入模型进行训练,得到该学生的学业评估模型。 将作为输入,Y作为输出,训练长短时记忆网络模型,采用交叉熵损失函数作为损失函数,形式如下:
其中Y表示实际输出,表示预测输出。
3.实现学业精准评估
在进行学业评估时,收集学生一个学期的德智体美劳五个维度相应学业表现数据,按照以上方法分别提取每个维度的特征并进行标准化,然后进行PCA降维,将低维特征数据输入训练完成的长短时记忆网络(Long Short-Term Memory,LSTM)模型,计算获得评估结果,即学生的成绩类别,其中每个学生的评估结果为。对评估结果进行转化赋值,可以得到学生在德智体美劳每个维度的综合表现情况。
图1 基于LSTM的学业评估模型
三、学业评估案例
收集我校汽车专业20级某个班级30位学生的德智体美劳五维数据,按照以上模型方法进行学业评估分析。首先,根据不同的数据库,统计并预处理学生的各方面数据信息,同时计算学生的综合加权平均成绩进行初始化,某学生A的学业表现初始化结果如图表格3所示。
表3 学生A学业表现初始化
项目 | 加权平均 | 评价 | |
德育数据 | 思想政治素养 | 20 | 中等 |
行为素养 | 22 | ||
人文素养 | 18 | ||
职业素养 | 15 | ||
智育数据 | 课程 | 80 | 良好 |
体育数据 | 课程 | 75 | 中等 |
美育数据 | 课程 | 90 | 优秀 |
劳育数据 | 课程 | 88 | 良好 |
设置2020-2021第二学期学生数据作为训练样本数据,设置2021-2022第一学期学生的综合加权平均成绩作为因变量标签。首先对每个学生的德育表现数据以月为单位进行特征提取,学生特征矩阵X的大小为30×42,即总共学生人数30人,提取的特征为42维。对特征数据进行Z-Score标准化,然后进行PCA降维,选择累积方差贡献率大于90%的主成分对应的特征作为降维后的特征,降维后特征数据集为Xd (t),矩阵大小维42*4。
设置标签矩阵Y,大小为30×5。按照表1对每个学生的学业表现维度进行初始化,然后按照表现类别进行独热编码,设置如下: 。其中,Y1=[1 0 0 0 0]对应[90 ,100),Y2=[0 1 0 0 0]对应[80 ,90),Y3=[0 0 1 0 0]对应[70 ,80),Y4=[0 0 0 1 0]对应[60 ,70),Y5=[0 0 0 0 1]对应(0 ,60)。
以每个月份特征矩阵Xd (t)作为输入,Y作为输出,训练长短时记忆网络模型,采用交叉熵损失函数,优化器采用随机梯度下降算法(SGD)。此时输入网络的序列长度为6,输入维度为3。通过网格搜索法进行参数寻优,获得的优化参数如下:批输入大小为32,网络隐层单元为32,网络隐藏层层数为1,SGD中的动量参数为0.7,学习率设置为1×10
-3, dropout层的丢弃比率为0.6。
获取学生某个学期某个阶段的学业数据作为测试,按照图1所示步骤进行特征提取,标准化降维后输入训练完成的网络中进行测试,最终得到每个学生的每个维度的学业评估状况,评估的五维结果通过雷达图可以进行可视化,如图2所示。
此外,根据学业评估表现可以实现对学生的预警管理。对每个学生的评估成绩所处分段,按照平均分进行转化,然后计算该学生上一学期学业表现与本学期的学业表现差值获得预警率,筛选预警率大于30%的学生,辅导员、班主任可以相应学生进行谈话预警。
图2 学生A的学业表现五维评价雷达图
四、总结
本文提出了基于德智体美劳的五维精准学业评价方法。对学生在校学业表现各类数据进行收集汇总,建立学生在校档案的立体数据库,通过该数据库可以了解学生在校学习生活的全方位信息。基于深度学习算法建立LSTM模型,将学生学业表现数据输入模型,进行德智体美五维的评估,评估结果通过雷达图展示。最后,以汽车专业学生为例,进行学业精准评价,实现了学生学业预警管理、学风评价。
参考文献
[1]谢于晨.基于大数据的高校学生学业评价体系探讨[J].无线互联科技,2021,18(04):167-168.
[2]左晶,代爱萍,刘向荣等.基于教育数据挖掘的学生学业发展评价研究[J].当代教育实践与教学研究,2019(05):28-29.
[3]夏金存.基于大数据的学业预警模型分析[J].电子技术,2022,51(09):85-87.
[4]黄方亮,许欢庆,沈同平等.基于数据挖掘的智能学习效果预警管理系统设计与实验研究[J].通化师范学院学报,2022,43(12):84-89.
课题来源:2021年浙江省高等教育学会课题(项目编号:KT2021310);2021年浙江省教育规划课题(项目编号:2021SCG131);
作者简介:
林龙,男,1989年7月生,讲师,硕士,研究方向:教育大数据、智能诊断。
[1] 课题来源:2021年浙江省高等教育学会课题(项目编号:KT2021310);2021年浙江省教育规划课题(项目编号:2021SCG131);
作者简介:林 龙(1989—),讲师,硕士,研究方向:教育数据挖掘,模式识别。E-mail:dragon.lin611@163.com