Perspective Based on Skewed Normal Distribution: Exploring the Optimization of Course Grade Evaluation Methods in Higher Education
Traditional assessment of university course grades has relied on the normal distribution model, yet this approach shows limitations when handling skewed data in high or low score segments. This study explores the optimized application of skew-normal distribution in student performance analysis. Through empirical analysis of grade data from four courses at Shenzhen Technology University (Fundamentals of Programming A, Advanced Mathematics A, Discrete Mathematics, and Object-Oriented Programming), we compared the fitting effectiveness between normal distribution and skew-normal distribution. Results demonstrate that the skew-normal distribution, by incorporating a skewness parameter, more accurately captures the asymmetric characteristics of grade data, with significantly better goodness-of-fit (AIC and BIC values) than normal distribution and more precise confidence intervals. The study further proposes improvement strategies: distinguishing qualifying examinations from selective assessments, integrating formative and summative evaluations, enhancing grading transparency, and appropriately utilizing big data technology to optimize teaching evaluation. This research provides new perspectives for academic performance assessment, supporting the scientific and diversified development of educational evaluation systems, thereby facilitating the cultivation of innovative talents.
Normal Distribution
在教育统计学领域,学生成绩数据的分析一直是一个重要的研究课题。传统上,正态分布因其数学上的简洁性和在自然界中的广泛存在性常被用作描述学生成绩分布的基本模型。然而,随着教育数据的日益丰富和复杂化,研究者们逐渐发现许多实际情况下的成绩数据并不完全遵循正态分布,特别是成绩在低分或高分段往往表现出明显的偏斜性
为了更准确地描述和分析这种具有偏斜特性的成绩数据,本文尝试探索其它统计分布模型。偏正态分布作为一种能够调整分布偏斜程度的扩展正态分布,因其数学表达上的灵活性和实际应用中的有效性逐渐受到关注。偏正态分布通过引入偏度参数来控制分布的偏斜方向和程度,从而能够更精细地刻画成绩数据的实际分布情况。
本文旨在探讨偏正态分布模型在大学生成绩数据分析中的应用与拟合效果。通过实证分析高校课程的学生成绩数据,比较偏正态分布与标准正态分布在拟合成绩数据方面的差异,并评估偏正态分布模型的拟合优度。本文的研究不仅有助于深入理解学生成绩数据的内在特性,还为教学评估、成绩预测及个性化学习推荐等领域提供了新的统计方法和分析方式。
在高等教育体系中,课程考试成绩是教学评估的关键要素。它不仅直接体现学生对课程知识的掌握程度,还间接反映了教学质量、教学方法的有效性及学习环境的支持度。
对课程考试成绩的管理,成为了提升教学质量、优化教学评价流程的重要基石。这一过程涵盖了从考试设计、实施、评分到结果分析的全链条管理,要求教育者既要确保考试的公平性、公正性和科学性,又要能够高效地收集、整理和分析考试成绩数据,以数据为驱动,洞察教学过程中的优势与不足。长期以来,教育者认为正态分布是自然界和社会中最常见、应用最广的一种分布,并广泛应用于学生成绩评定中
当在大量随机变量上重复很多次实验时,它们的分布总和将非常接近正态分布。大量研究表明,凡符合教学规律的考试,其总体成绩应服从或接近服从正态分布,成绩特别好的和特别差的分数所占的比例小,处于中间状态的分数所占的比例大
第一,影响成绩分布的因素具有随机性。学生的学习能力、努力程度和学习环境等多种因素都具有一定的随机性。这些随机因素相互作用,使得学生的成绩呈现出一种随机的分布状态。当这种随机性足够大时,成绩分布就趋向于正态分布。
第二,教育系统具有标准化特点。在高校教学中通常包含标准化的教学内容、教学方法和评价标准。这些标准化措施有助于减少个体差异对成绩分布的影响,使得大多数学生的成绩能够集中在一定的范围内,从而形成正态分布。
第三,正态分布具有稳定性。正态分布具有一种“稳定性”或“自相似性”,无论初始条件如何,只要系统受到足够多的随机因素影响,其最终结果往往趋向于正态分布。这种稳定性使得高校学生的成绩分布中能保持正态分布的形态。
第四,对成绩进行正态分布检验,一方面可以据此了解考试命题是否合理、成绩评定是否科学、考试组织是否有问题;另一方面可以进一步挖掘成绩中存储的信息资料,发现教学中存在的问题和不足。
第五,正态分布能够增强成绩区分度,提升评价准确性。正态分布模型的应用,在一定程度上能够减少人为因素对成绩评定的干扰,能够自然地体现出学生之间的能力差异和成绩分布特点,扩大了高分段成绩与低分段成绩的差距,有效地增强了成绩之间的区分度。
长期以来,我国高校在本科生课程考试的管理与评价中,仍存在一些不甚合理的管理规定,例如“成绩录入需反映学生整体学习水平的差异,过程成绩和期末成绩应呈现‘两头小,中间大’的近似正态分布”,不少管理者认为唯有此种分布才是科学的,甚至以是否遵循正态分布来评判考试及教师教学工作质量
大学生考试成绩到底普遍遵循什么样的分布,或者说什么样的分布更适合度量大学生考试成绩分布,目前还没有定论
偏正态分布是一种连续概率分布,用于描述具有偏斜特性的数据。它是正态分布的推广,通过引入偏斜参数来控制分布的偏斜程度。偏正态分布的概率密度函数为
(1)
其中, 为标准正态分布的累积密度函数; 为标准正态分布的概率密度函数; 是位
置参数,用来描述均值位置;
是尺度参数,用来控制分布的宽度;
是偏斜参数,当
时退化为正态分布。当
时,分布向左偏斜;
时,分布向右偏斜。
由于偏正态分布的实用性,下面分别讨论一下该分布的一些重要性质和最大似然参数估计方法。
证明:
由于 相互独立,则有
则
因此
同理可证
(2)
证明:由期望的计算公式 可得:
再由方差公式 计算,可证(2)式成立。
性质3:如果 ,则 服从半正态分布,即 。
证明:将 代入偏正态分布的概率密度函数可得
因此 的分布函数为
得到
又因为 ,所以可得 ,即 服从半正态分布。
性质4:如果 ,则 。
证明:令 ,对于 ,
性质5:如果 ,且 相互独立, ,则 ,其中 。
证明:由题意可知, 是 和独立正态随机变量 的线性组合。
设 ,则 的条件分布为: ,因此 的联合密度函数为
得 的边缘分布为
将变量 代入积分可得
取 ,可知
因此, 。
最大似然估计是一种在统计学中估计模型参数的方法,它通过最大化观测数据在给定参数下的似然函数来实现。给定一组观测数据 ,假设这些数据均服从偏正态分布 且相互独立,则似然函数为
(3)
对(3)式取对数似然函数得到
(4)
为了找到使似然函数最大化的参数值,需要求解对数似然函数关于每个参数的偏导数,并设置它们等于零,即
(5)
偏正态分布的概率密度函数其对数似然函数的导数可能非常复杂,由于Python具有强大的数学计算库(如 NumPy、SciPy等)与数据可视化库(如Matplotlib、Seaborn等),可以用于数学建模和仿真
下文以上述四门课程为例,探讨偏正态分布在不同课程中分析学生成绩的合理性,以及使用偏正态分布相对于正态分布的优势。
对四门课程的学生成绩分别进行正态分布拟合和偏正态分布拟合,拟合结果如
赤池信息准则(AIC)和贝叶斯信息准则(BIC)是衡量拟合效果的参数,AIC和BIC越小,说明模型的拟合效果越好。AIC建立在信息熵的概念基础上,可以表示为AIC = 2k − 2ln (L),其中k是参数的数量,L是似然函数。BIC是基于贝叶斯决策理论的一种准则,其计算方式是BIC = kln (n) − 2ln (L),与AIC相似,BIC也用似然函数和参数数量来衡量模型的拟合优良性,不同的是BIC的惩罚项比AIC的大。同时BIC考虑了样本数量,当样本数量过多时,可有效防止模型精度过高造成的模型复杂度过高。
利用极大似然估计估计出偏正态分布的参数,并根据拟合结果分别计算正态分布拟合与偏正态分布拟合的赤池信息准则(AIC)和贝叶斯信息准则(BIC),如
课程 |
程序设计基础A |
高等数学A |
离散数学 |
面向对象程序设计 |
||||
分布参数 |
偏正态 |
正态 |
偏正态 |
正态 |
偏正态 |
正态 |
偏正态 |
正态 |
μ |
88.0 |
75.5 |
90.7 |
74.8 |
89.9 |
78.3 |
94.3 |
77.7 |
σ |
17.2 |
13.4 |
20.8 |
15.4 |
10.0 |
22.3 |
15.0 |
|
α |
−2.20 |
- |
−4.42 |
- |
−3.44 |
- |
−6.70 |
- |
AIC |
1234.4 |
3459.7 |
1288.0 |
3886.2 |
804.6 |
2201.8 |
757.4 |
2527.9 |
BIC |
1246.7 |
3467.9 |
1300.6 |
3894.6 |
815.6 |
2209.1 |
768.5 |
2535.2 |
本文选取的四门课程均为课程难度适中、选课人数较多的课程,具有一定参考性。相对于正态分布拟合,偏正态分布拟合的AIC和BIC均更小,可见对于上述四门课程偏正态分布的拟合效果更好。同时,通过上表可以看出偏正态分布的偏移度均为负数,可知上述课程学生成绩分布均服从负偏态分布。
在进行正态分布或偏正态分布拟合后,计算置信区间是一个非常重要的步骤。当我们通过数据拟合得到正态或偏正态分布的参数时,这些参数具有不确定性。置信区间给出了这些参数真实值可能落入的范围,从而帮助我们评估这些参数的可靠性。通过计算可得出以下四门课程偏正态分布拟合95%置信水平的置信区间,如
程序设计基础A、高等数学A、离散数学、面向对象程序设计四门课程的偏正态分布置信区间为(49, 96)、(44, 94)、(55, 94)、(44, 96),实际置信区间内人数与总人数之比为94.58%、94.21%、95.93%、94.12%;正态分布的置信区间分别为(52, 99)、(49, 101)、(59, 98)、(48, 107),实际置信区间内人数与总人数之比分别为96.16%、95.04%、96.27%、94.44%。
通过上述数据所知,正态分布与偏正态分布的置信区间均与理论值相近,说明使用偏正态分布拟合学生成绩分布是合理的,能体现出大部分同学的水平。另外与正态分布相比,偏正态分布拟合所计算置信区间更加精确。
对比本文选取的四门课程,在学分构成方面,面向对象程序设计包含2学分的课堂讲授、3学分的课内实践、1学分的课外实践;程序设计基础A包含2学分的课堂讲授、2学分的课内实践,无课外实践;高等数学A和离散数学的学分构成均只有课堂讲授,无实践内容。考核方式方面,面向对象程序设计期末考试成绩占比50%;程序设计基础A期末占比40%,平时成绩以实验报告、课程设计为主;而高等数学A和离散数学课程均为期末成绩占比60%的课程,平时成绩以期中考试、课堂检测等书面考核为主,且期末占比相对较高。
从培养目标来看,四门课程均为合格性考试,学生达到培养要求即可通过。但学校对优秀率进行了控制,每门课程总评93分以上的同学人数不能超过教学班级人数的10%,总评85分以上的同学人数不能超过教学班级人数的30%。因此实际学生成绩分布中达到60分及格线以上的同学较多,但优秀分段的人数较少,导致总体呈现负偏态分布。
通过实证数据发现,课程类型、考核方式及班级规模显著影响成绩分布的偏斜方向与程度,如
课程名称 |
课程类型 |
期末占比 |
班级规模 |
偏态参数α |
程序设计基础A |
实践课 |
40% |
45 |
−2.20 |
高等数学A |
理论课 |
60% |
60 |
−4.42 |
离散数学 |
理论课 |
60% |
55 |
−3.44 |
面向对象程序设计 |
实践课 |
50% |
50 |
−6.70 |
如果强行将成绩分布调整为正态分布,可能会导致优秀学生的成绩被压低,而学习较差的学生成绩被人为提高,从而扭曲了成绩的真实性。通过本文研究可知,具体到某一门课程或某一批学生的成绩分布时,往往容易偏离完全的正态分布,更多时候呈现出偏正态分布或其他非标准形态。研究结果显示,深圳技术大学的大部分课程通常使用平时成绩和期末考试成绩占比加权的考核方式。平时成绩包含考勤、小测、课堂作业、期中考试、实验报告等部分。考勤、课堂作业的存在使得课程合格率普遍较高,不再满足正态分布,而是更倾向于负偏正态分布。因此教师在评价学生等级时,可考虑使用负偏态分布来分析学生成绩。
本文选取的四门课程主要为基本通识课程和专业基础课程,主要以检验学生掌握课程内容是否达到课程要求,为合格性考试。高校考试类型以合格性考试为主,合格性考试的主要目的是检查学生是否达到预定的教学目标或学习标准,当所有学生都达到预定标准时即可全部通过,对于这类考试不必强求成绩的正态分布。而高考等选拔考试的目的是对学生学习水平的高低进行区分,以选出相对更为优秀或更符合某种特定要求的学生。这类考试可以设计试题难度或控制优秀率以增加区分度,使学生成绩尽量满足近似正态分布。
正态分布一般适合于连续的分值评价,并不适合于相对等级和完成性评价
在高校评价学生成绩时,应增强评价过程的透明度,及时向学生公开解释评分标准和结果。同时建立有效的沟通机制,高校之间互相沟通学习,及时根据试题难易程度调整评分方式,避免因试题难度过大或过小而导致学生成绩失真,不断优化评价方法。通过合理运用计算机,收集并分析学生的学习数据,学校能够更精准地评估学生的学习状态与成效,及时调整评分方式,确保评价结果的客观性与准确性。
在信息化的今天,合理借助大数据和人工智能技术,对学生的学习数据进行深度挖掘和分析,可以发现学生潜在的学习规律和趋势。这有助于教师更准确地了解学生的学习状态和需求,为教学和调整成绩评价方式提供科学依据。通过分析不同课程或不同教学资源的成绩表现,学校和教育部门可以了解学生集体的普遍问题,从而进行有针对性的优化和调整。同时大数据分析还可以预测学生的学习表现,为教师提供预警信息,以便及时干预和调整教学策略。
通过使用偏正态分布分析学生成绩,可以得到更准确的学生成绩评价,更确切地反映学生的实际学习情况和掌握知识的程度,减少因强行追求正态分布而导致的成绩扭曲现象。另外,通过对成绩分布形态的深入分析(如偏斜方向、峰度、偏度等),教师可以更准确地识别学生在学习过程中存在的问题和难点,为教学决策提供有力支持,促进教师更加关注学生的学习需求和个体差异,从而增强教学的针对性和有效性。另外,通过引入更加科学合理的成绩评价方法,可以推动教育评价体系的多元化发展。
本文旨在探讨偏正态分布在大学生成绩数据分析中的应用与拟合效果。针对传统正态分布假设可能无法充分捕捉成绩数据中存在的非对称性特征,本研究引入偏正态分布模型,在“‘101计划’和新工科”背景下,充分结合计算机编程语言,通过实证分析大学生成绩数据,验证其相较于标准正态分布的优越性。
研究结果表明,偏正态分布模型能够更准确地描述大学生成绩数据的实际分布情况,并捕捉成绩数据的非对称特性,特别是在处理低分或高分段数据偏斜时表现出色。相较于正态分布,偏正态分布模型不仅提高了拟合精度,还避免了对高分或低分学生成绩的误判,使得学生成绩得到更合理的评价。
习总书记在全国教育大会上指出,“建成教育强国是近代以来中华民族梦寐以求的美好愿望,是实现以中国式现代化全面推进强国建设、民族复兴伟业的先导任务、坚实基础、战略支撑”,强调“我们要建成的教育强国,是中国特色社会主义教育强国”。当前,我国正在为实现建成社会主义现代化强国、教育强国的奋斗目标而努力,创新人才的培养则是实现第二个百年奋斗目标、实现中华民族伟大复兴的重大议题
基金项目
广东省教育科学规划课题(高等教育专项):“101计划”和新工科背景下数学教学的研究和探索(2024GXJK280)。深圳技术大学教学改革项目:计算机“101计划”背景下的数学课程教学改革的探索(20241010)。
*通讯作者。