针对普遍认为的高等数学难的情况,采集了不同专业120名学生学习高数的情况与高等数学的综合成绩,利用粗糙集理论中上下近似的相关理论对采集的数据进行分析,得到数据之间的依赖程度,最终得到高等数学是否能通过的主要影响因素与得高分的主要影响因素。
With the view that higher mathematics is difficult, 120 students’ situation from different majors to study high mathematics and the grades of higher mathematics are collected. By using the related theory of upper and lower approximation in rough set theory, the degree of dependence between the data is obtained, and the main influencing factors of whether higher mathematics can pass or not and the main influencing factors of high scores are finally obtained.
针对普遍认为的高等数学难的情况,采集了不同专业120名学生学习高数的情况与高等数学的综合成绩,利用粗糙集理论中上下近似的相关理论对采集的数据进行分析,得到数据之间的依赖程度,最终得到高等数学是否能通过的主要影响因素与得高分的主要影响因素。
粗糙集,上下近似,影响因素,支持度,重要性
Qiaoyun Liu
College of Mathematics and Statistics, Qinghai Minzu University, Xining Qinghai
Received: Nov. 10th, 2021; accepted: Dec. 13th, 2021; published: Dec. 20th, 2021
With the view that higher mathematics is difficult, 120 students’ situation from different majors to study high mathematics and the grades of higher mathematics are collected. By using the related theory of upper and lower approximation in rough set theory, the degree of dependence between the data is obtained, and the main influencing factors of whether higher mathematics can pass or not and the main influencing factors of high scores are finally obtained.
Keywords:Rough Set, Upper and Lower Approximation, Influence Factors, Support Degree, Significance
Copyright © 2021 by author(s) and beplay安卓登录
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
http://creativecommons.org/licenses/by/4.0/
粗糙集理论是一种处理信息的方法,可以从先验信息中发现规律和一些潜在的知识。学习成绩的影响因素具有不确定的特点,范娟 [
《高等数学》是高等院校理工科专业的专业基础课、必修课。这门课的学习情况关系到后续专业课程的学习。自参加工作以来,一直在从事高等数学课程的教学工作,在期末考试结束后,考试结果不尽人意。从这个事实出发,选择在高等数学学习过程中对成绩有影响的8个因素作为对象,随机收集了本校不同专业120名学生的情况与成绩并进行一系列的分析。本文的安排如下:第1部分简要阐述粗糙集理论中的相关概念;第2部分对采集到的数据进行分析;第3部分给出主要结论。
这部分介绍与本文研究内容相关的基本概念.
定义1 [
定义2 [
定义3 [
X的R上近似集: R _ X = ∪ { x ∈ U | [ x ] R ⊆ X } ,
X的R下近似集: R ¯ X = ∪ { x ∈ U | [ x ] R ∩ X ≠ ∅ } 。
称 pos R ( X ) = R _ X 为X的正域, neg R ( X ) = U − R ¯ X 为X的负域。 R ¯ X 或 R _ X 是根据知识R判断U中一定属于X的元素组成的集合; R ¯ X 是根据知识R判断U中可能属于X的元素组成的集合;negR(X)是根据知识R判断U中一定不属于X的元素组成的集合。
定义4 [
从采集到的120个样本数据看,得到下面的统计数据:认为自己数学基础好的有10个,占总样本的8.3%;认为数学基础中等水平的有84个,占总样本的70%;认为数学基础不好的有26个,占总样本的21.7%。为了描述更简洁,列表如下表1。
因素 | 情况 人数与占比 | 因素 | 情况 人数与占比 | ||||
---|---|---|---|---|---|---|---|
数学基础 | 好 | 中 | 差 | 课后作业 | 独立 | 基本独立 | 抄袭或不写 |
10 | 84 | 26 | 55 | 62 | 3 | ||
8.3% | 70% | 21.7% | 45.8% | 51.7% | 2.5% | ||
课前预习 | 经常 | 偶尔 | 从不 | 干部、成员 | 是 | 否 | - |
13 | 98 | 9 | 95 | 25 | - | ||
10.8% | 81.7% | 7.5% | 79.2% | 20.8% | |||
上课效率 | 高 | 中 | 低 | 兴趣 | 有 | 没有 | - |
11 | 94 | 15 | 105 | 15 | - | ||
9.2% | 78.3% | 12.5% | 87.5% | 12.5% | |||
课后复习 | 经常 | 偶尔 | 从不 | 做题情况 | 是 | 否 | - |
17 | 97 | 6 | 44 | 76 | - | ||
14.2% | 80.8% | 5% | 36.7% | 63.3% |
表1. 样本数据统计表
从表1可以看出,学生普遍课前不预习,导致在课堂上漫无目的的学习,学习效率不高;大部分都是社团协会成员或者班干部,本校学生参加活动的热情与积极性较高;很大一部分学生对数学都是有兴趣的;大部分学生只做了课上的例题和课后作业,没有做其他的题目。
从通过率来看,在这120个样本中,有21个综合测评成绩没有达到60,占调查人数的17.5%。从成绩的分布来看,16人成绩在85以上,占13.3%,48人成绩在75~85,占40%,35人成绩在60-75,占29.2%。成绩分布基本合理。
利用传统粗糙集理论中的属性约简方法,将考试成绩作为决策属性,研究列出来的8个因素对最后的考试成绩的影响程度。
首先,需要对数据做预处理。将成绩分为5段:85~100分,75~85分,60~75分,50~59分,50以,并分别用1、2、3、4、5来进行表示,即决策属性D1= {1, 2, 3, 4, 5}。将通过考试(成绩高于60)用1表示,没有通过考试(低于60)用0表示,即决策属性D2={0, 1}。将影响因素数学基础、课前预习、听课效率、课后复习、完成作业方式、班团干部或者协会成员、对数学的兴趣、是否做其他题目分别记为x1, x2, x3, x4, x5, x6, x7, x8,即条件属性C = { x1, x2, x3, x4, x5, x6, x7, x8}。取值情况列表如下表2。
其次,计算等价类U/C (表示调查对象根据所有的条件属性进行划分等价类)、U/D1(表示调查对象根据D1即考试是否通过这一决策属性进行划分等价类)、 U / ( C − { x i } ) ( i = 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 ) (表示调查对象依次去掉某一条件属性后进行划分等价类),并计算出每一个条件属性的重要性。
属性 | 取值情况 | 属性 | 取值情况 | ||||
---|---|---|---|---|---|---|---|
1 | 2 | 3 | 1 | 2 | 3 | ||
x1 | 好 | 中 | 差 | x5 | 独立 | 基本独立 | 抄袭 |
x2 | 经常 | 偶尔 | 从不 | x6 | 是 | 否 | - |
x3 | 高 | 中 | 低 | x7 | 有 | 没有 | - |
x4 | 经常 | 偶尔 | 从不 | x8 | 是 | 否 | - |
表2. 取值情况表
经计算,得 γ C ( D 1 ) = | pos C ( D 1 ) | | U | = 93 120 = 0.775 ,说明考试通不通过与这8个因素的依赖度为77.5%。
σ CD 1 ( x 1 ) = γ C ( D 1 ) − γ C − { x 1 } ( D 1 ) = 93 120 − 81 120 = 0.100
σ CD 1 ( x 2 ) = γ C ( D 1 ) − γ C − { x 2 } ( D 1 ) = 93 120 − 81 120 = 0.100
σ CD 1 ( x 3 ) = γ C ( D 1 ) − γ C − { x 3 } ( D 1 ) = 93 120 − 75 120 = 0.150
σ CD 1 ( x 4 ) = γ C ( D 1 ) − γ C − { x 4 } ( D 1 ) = 93 120 − 89 120 ≈ 0.033
σ CD 1 ( x 5 ) = γ C ( D 1 ) − γ C − { x 5 } ( D 1 ) = 93 120 − 73 120 ≈ 0.167
σ CD 1 ( x 6 ) = γ C ( D 1 ) − γ C − { x 6 } ( D 1 ) = 93 120 − 83 120 ≈ 0.083
σ CD 1 ( x 7 ) = γ C ( D 1 ) − γ C − { x 7 } ( D 1 ) = 93 120 − 92 120 = 0.008
σ CD 1 ( x 8 ) = γ C ( D 1 ) − γ C − { x 8 } ( D 1 ) = 93 120 − 91 120 = 0.017
计算等价类U/D2(将调查对象根据成绩高低进行划分等价类),并计算出8个因素整体与各个因素的重要性,得到下面的结果:
γ C ( D 2 ) = | pos C ( D 2 ) | | U | = 54 120 = 0.45
σ CD 2 ( x 1 ) = γ C ( D 2 ) − γ C − { x 1 } ( D 2 ) = 54 120 − 41 120 = 13 120 ≈ 0.108
σ CD 2 ( x 2 ) = γ C ( D 2 ) − γ C − { x 2 } ( D 2 ) = 54 120 − 39 120 = 15 120 = 0.125
σ CD 2 ( x 3 ) = γ C ( D 2 ) − γ C − { x 3 } ( D 2 ) = 54 120 − 40 120 = 14 120 = 0.117
σ CD 2 ( x 4 ) = γ C ( D 2 ) − γ C − { x 4 } ( D 2 ) = 54 120 − 39 120 = 15 120 = 0.125
σ CD 2 ( x 5 ) = γ C ( D 2 ) − γ C − { x 5 } ( D 2 ) = 54 120 − 37 120 = 17 120 ≈ 0.142
σ CD 2 ( x 6 ) = γ C ( D 2 ) − γ C − { x 6 } ( D 2 ) = 54 120 − 36 120 = 18 120 = 0.15
σ CD 2 ( x 7 ) = γ C ( D 2 ) − γ C − { x 7 } ( D 2 ) = 54 120 − 42 120 = 12 120 = 0.10
σ CD 2 ( x 8 ) = γ C ( D 2 ) − γ C − { x 8 } ( D 2 ) = 54 120 − 49 120 = 5 120 = 0.042
从2.1描述性分析来看,任课教师应该在激发学生的学习积极性方面更加努力,比如怎么让学生能在课前主动进行预习、在课后及时巩固复习等。目前我校正在采用线上线下结合的模式教学,希望学生能动起来,不管是高数还是其他课程期末考试成绩都能提高。
从2.3粗糙集理论分析结果看,上述8个因素对高等数学课程的影响程度为77.5%,总体对成绩影响较大。从单个因素看,这八个因素的重要性从数据看都比较小,可能我们问问题的方式不太准确,学生在回答的时候也有一定的隐瞒,不太符合真实情况。数学的基础对能否通过高数考试与考高分的影响不大。当学生干部等对能否通过考试影响不大,但是对考高分有一定的影响。课前预习与课后复习这两个因素对考试能否通过与考高分影响也较大。从这些样本分析得到做题多少对二者影响都不大,这个可能与期末考试题目偏简单有一定关系,在以后的出题过程中要注意这个问题。是否独立完成课后作业对二者影响都较大。
综合起来,以后在教学过程中要注意对学生学习积极性的培养,利用各种教学平台让学生课前预习、课后能复习并独立完成作业,在期末考试题目的难度方面,适当增加一些难度。
青海民族大学校级项目(2021XJGH26)。
刘巧云. 基于粗糙集对高等数学课程成绩的影响因素分析Influence Factors of Higher Mathematics Course Grades Based on Rough Set Theory[J]. 理论数学, 2021, 11(12): 2087-2091. https://doi.org/10.12677/PM.2021.1112232