项目1:基于sklearn的数据分类挖掘 一、项目任务 熟悉sklearn数据挖掘的基本功能。 进行用朴素贝叶斯、KNN、决策树C4.5、SVM算法进行数据分类分析。 二、项目环境及条件 sklearn-0.18.0 python-2.7.13 numpy-1.11.3+mkl-cp27-cp27m-win_amd64 scipy-0.19.0-cp27-cp27m-win_amd64 matplotlib-1.5.3-cp27-cp27m-win_amd64 三、实验数据 Iris数据集 Iris数据集是常用的分类实验数据集,由Fisher, 1936收集整理。Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。数据集包含 150个数据集,分为3类,每类50个数据,每个数据包含4个属性。可通过花萼长度,花萼 宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于(Setosa,Versicolour,Virgin ica)三个种类中的哪一类。 Digits数据集 美国著名数据集NIST的子集,模式识别常用实验数据集,图像属于灰度图像。分辨率 为8x8 四、项目内容及过程 1.读取数据集 从sklearn中读取iris和digits数据集并测试打印 "from sklearn import datasets " " " "iris = datasets.load_iris() " "digits = datasets.load_digits() " "print 'iris:',iris.data,'\ndigits:',digits.data " 打印的数据集存在numpy.ndarray中,ndarray会自动省略较长矩阵的中间部分。 Iris数据集的样本数据为其花瓣的各项属性 Digits数据集的样本数据为手写数字图像的像素值 2.划分数据集 引入sklearn的model_selection使用train_test_split划分digits数据集,训练集和测 试集比例为8:2 "from sklearn.model_selection import train_test_split " "x_train,x_test,y_train,y_test=train_test_split(digits.data,digits.t" "arget,test_size=0.2) " "print " "'x_train:',x_train,'\nx_test:',x_test,'\ny_train:',y_train,'\ny_tes" "t:',y_test " 3.使用KNN和SVM对digits测试集分类 引用sklearn的svm.SVC和neighbors.KNeighborsClassifier模块调用算法,使用classi fication_report查看预测结果的准确率和召回率 "from sklearn.metrics import classification_report " " " "from sklearn import neighbors " "clf = neighbors.KNeighborsClassifier() " "clf.fit(x_train,y_train) " "y_pred=clf.predict(x_test) " "print classification_report(y_test, y_pred) " " " "from sklearn.svm import SVC " "clf = SVC() " "clf.fit(x_train,y_train) " "y_pred=clf.predict(x_test) " "print classification_report(y_test, y_pred) " KNN的预测结果:所有数字的预测正确率几乎达到了100% SVM的预测结果:对部分数字的预测误差较大,基本情况不如KNN 考虑SVM分类器的特性,在分类前对特征值进行标准化后再分类: "from sklearn import preprocessing " "min_max_scaler = preprocessing.MinMaxScaler() " "x_train = min_max_scaler.fit_transform(x_train) " "x_test = min_max_scaler.fit_transform(x_test) " 标准化数据后SVM的预测结果达到了KNN的准度: 4.使用贝叶斯和决策树对iris数据集分类 "from sklearn.model_selection import train_test_split " "x_train,
2023-05-08 21:28:51 285KB 文档资料
1
本文介绍了贝叶斯网络在 Matlab 中的应用,以及参数学习的实验。实验中使用了“草地潮湿原因模型”,首先建立了贝叶斯网络并手动构造了条件概率表,然后使用 BNT 中的函数进行样本生成和参数学习。该实验展示了贝叶斯网络在实际问题中的应用价值。
2023-05-08 09:31:48 483KB (完整word版)贝叶斯matl
1
直流电机VS交流电机VS步进电机VS伺服电机
2023-05-05 22:55:11 2.84MB 电机
1
测绘资料-《基础地理信息公开表示内容的规定(试行)》.doc
2023-05-03 18:02:25 1.06MB 测绘 资料 工具
1
本文介绍了中小型企业网络规划设计和实施方案,包括网络系统设计概述、需求分析和网络系统设计等三个章节。在网络系统设计概述中,介绍了项目背景、项目流程和项目调查与分析等内容;在需求分析章节中,详细阐述了设计网络需求、网络功能、企业办公网主干和信息点需求与分布以及投资预算等方面;在网络系统设计章节中,介绍了网络设计依据、设计要求、设计目标、设备分析、网络拓扑结构设计和部网络设计等内容。本文旨在为中小型企业提供网络规划设计和实施方案的指导。
2023-05-03 15:10:37 1.89MB 互联网
1
基于plc风力发电控制系统的设计.doc
2023-05-03 12:36:46 236KB 互联网
1
VC字符串分割成数组.docVC字符串分割成数组.docVC字符串分割成数组.docVC字符串分割成数组.docVC字符串分割成数组.docVC字符串分割成数组.docVC字符串分割成数组.docVC字符串分割成数组.docVC字符串分割成数组.docVC字符串分割成数组.docVC字符串分割成数组.docVC字符串分割成数组.docVC字符串分割成数组.docVC字符串分割成数组.docVC字符串分割成数组.doc
2023-05-02 21:44:26 32KB 字符串 分割 数组
1
本固件根据官方原版固件修改而成,保留了原版的IMS菜单模式,集成了优朋、VST、好IMS、HDPFANS、BESTV、非常高清、天天在线、浦东高清、RPEW、IMAX等常用在线平台,
2023-05-02 15:54:57 21KB 1185固件
1
本文介绍了差分编码移相键控(2DPSK)调制解调系统的仿真设计。通过设计工作流程图和利用Matlab软件进行动态模拟仿真,可以从基带信号的波形图衡量数字信号的传输质量,并且通过输入和输出波形图可以看出仿真实验的良好结果。该仿真设计为基于Matlab的通信实验仿真系统的进一步研究奠定了坚实的基础。关键词:调制解调、差分移相编码、仿真设计。
2023-05-02 14:07:27 911KB 2DPSK信号调制解调的matl
1