现有某高校评教数据(pjsj.xls),共计842门课程,属性包括:课程名称、评价人数、总平均分以及10个评价指标Index1-Index10。以此为研究数据,利用数据挖掘的技术实现评价指标的筛选,即从10个指标中剔除对教学评价无用的指标。具体实现的内容应至少包括以下几个方面但不限于: (1)数据描述:利用盒图对每个指标数据进行描述性分析,画出10个指标的盒图:标注孤立点(如有)、最小值、Q1、中位数、Q3、最大值; (2)数据预处理:将每个连续型指标数据离散化为三个区间,级别从高到低分别为Excellent(用“E”表示)、Good(用“G”表示)、Fair(用“F”表示);将总平均分离散为“A”、“B”、“C”三个等次,作为每门课程的类标签; (3)模型构建与评估:利用决策树算法对上述数据进行分类,构建决策树并进行性能评估:包括Recall(召回率)、Precision(精度)、F1和Accuracy(准确率); (4)结果讨论:对研究结果(剔除的指标,即未出现决策树中的指标)进行讨论分析; (5)总结与展望:对全文研究过程进行总结并指出存在的不足或努力方向。
2022-06-20 14:07:48 8.74MB 数据挖掘 weka 期末大作业 决策树
在评估工作中,指标体系的构建是关键环节。文中将对指标体系构建的一般过程进行深入研究,总结了指标体系构建需遵循的原则,介绍了指标体系构建的流程,最后对指标的筛选进行重点研究,为指标体系的构建提供了理论依据。
2021-10-18 11:07:10 717KB 指标体系 指标筛选 区分度 相关度
1