matlab 10折交叉验证知识代码CSE-5334-数据挖掘 lin_regression_Matlab.txt包含线性回归Matlab代码。 lin_regression_Python.txt包含线性回归Python代码。 在ATNT50目录中,我们有 trainDataXY.txt 它包含45张图像。 来自类别1的图像1-9。来自类别2的图像10-18,以此类推。每个图像都是一列。 第一行是类别标签。 testDataXY.txt 它包含5张图片。 每个图像都是一列。 第一行是类别标签。 您使用训练数据训练分类器。 训练完分类器后,您就可以对testData中的数据进行分类,并将获得的类标签与那里提供的地面标签进行比较。 这两个数据是简单的训练和测试数据。 它们是预热数据,因此您可以看到分类器如何处理此简单数据。 数据集:ATNT-face-image400.txt: 文本文件。 第一行是群集标签。 第二端行:每列是一个特征向量(向量长度= 28x23)。 总计40个班级。 每个班级有10张图片。 总计40 * 10 = 400张图像 数据集:Hand-writing-26-le
2022-06-01 14:09:49 440KB 系统开源
1
matlab 10折交叉验证知识代码简介:预测和可视化的结果位于“结果”文件夹下。 那些ML模型预测的是每条记录的位置,而html文件可视化的是车辆加速和访问的前10个位置。 这些html文件由Python脚本生成,将位置速度限制与汽车记录进行比较,并计算所有位置的频率。 原始数据集(位于文件夹“ 1-data-preprocessing”中): linkinfo-copy.csv:包含传感器信息的excel文件 traffic-csv文件夹:该文件夹包括从04/2015到12/2016的所有流量记录 源代码: 1-data-preprocessing文件夹:该文件夹包括有关数据预处理的所有脚本(步骤1) 2-ml-model:包含所有机器学习脚本的文件夹(第2步) 3-可视化:该文件夹包括有关可视化的所有脚本(第3步) 补充材料: 纸文件夹:包含我用作参考的所有纸的文件夹 结果文件夹:该文件夹包含屏幕截图和ML预测和可视化结果的输出 ================================================== =========================
2022-05-20 14:20:55 141.36MB 系统开源
1
优化knn代码matlab ############################################### ################### PROJECT 2: COMP 551 - LANGUAGE CLASSIFICATION author: AMAR KUMAR[amar.kumar@mail.mcgill.ca] LITA FAN [lita.fan@mail.mcgill.ca] DEKLAN CHUNG [deklan.chung@mail.mcgill.ca] ############################################### ################### 文件说明: ***naive bayes.py [语言:python] - 使用朴素贝叶斯算法生成预测。 --> 输入文件: 1)输入文件必须是一个文件“train_set_x_features.csv”,它的所有列都是从训练数据中提取的特征。 该文件可以通过将 Language Classification.py 中的“savefile”变量设
2022-05-14 09:55:18 23KB 系统开源
1
knn这个库主要用来计算三维空间中最近点,或最近几个点
2022-01-09 19:50:24 603KB knn库
1
matlab 10折交叉验证知识代码贷款违约模型 基于ML的贷款违约预测模型。 该项目使用了不同的机器学习技术-1. Logistic回归,KNN,分类树,合奏(分类方法),套索(正则化技术),10折交叉验证(ML技术,用于有效地训练我们的分类器,将总体分为训练)和测试样本)。 1.初步要求 为了利用该项目,用户应在其PC上安装Matlab版本R2016b,以便他们可以编译和运行此存储库中包含的代码。 2.入门 为了运行模型,用户需要遵循以下简单步骤: 将信息从名为LCloanbook.rar的文件LCloanbook.rar到本地目录中(确保所有文件都保存在一个位置) 打开并运行名为loan_Default_Model.m的文件 所有测试结果应显示在屏幕的左下角(工作区) 享受! :) 3.仓库组成 loan_Default_Model.m -Matlab代码,包括此模型中使用的不同机器学习技术的定义。 LCloanbook.rar实际的基础贷款数据和变量描述 README.md您当前正在读取的文件 5.执照 MIT许可证涵盖了此存储库中包含的文件。 6.作者 斯韦特洛萨尔·斯托耶夫
2021-12-09 16:51:12 8.87MB 系统开源
1
matlab中knn代码 HSIC_RPNet An improved RPNet for HSI classification 软件环境 本代码通过MATLAB R2018a软件编写。 使用前,必须先安装一个MATLAB降维算法工具包 文件夹介绍 存储所有的数据集文件 存储程序生成的所有的图片以及论文中的相关实验数据作的折线图(为方便latex作图,以pdf文件保存) 存储libsvm函数包以及一些子函数实现 代码用途 绘制数据集的地面真值图 Indian_pines数据集的KNN分类 Indian_pines数据集的SVM分类 KSC数据集的SVM分类 Salinas数据集的SVM分类 paviaU数据集的KNN分类 paviaU数据集的SVM分类 记录了所有的实验数据以及相关的原始折线图 代码中的参数设置 此文件可绘制paviaU,Indian Pines,KSC,Salinas四种数据集的地面真值图,可直接运行,不用修改参数。 以RPNet开头的matlab脚本文件 在实验时都需要在开头修改参数,具体为: repeat 实验的重复次数,注意太小则实验结果不具备普遍性,太大则运行
2021-11-01 15:07:50 123.24MB 系统开源
1
matlab 10折交叉验证知识代码KNN算法方法 针对数据挖掘课程设计了不同的KNN算法。 有一个与患者的癌症状况相关的数据集,具有10个不同的特征,并且是用于诊断的类部分。 “ 1”用于诊断疾病,“ 0”反之亦然。 在家庭作业中,我将种子函数用作rng(3)。 Fitcknn 使用Matlab的fitcknn作为内置函数。 代码步骤如下: a)使用randperm函数对数据集进行混洗,然后将其分为训练数据和验证数据两类。 该分区的形式为:火车集为80%,验证集为20%。 b)对于距离测量,使用欧几里得距离。 c)此分配没有交叉验证。 d)为了预测验证类别,使用了从1到100的100个不同的knn值。 e)通过使用绘图函数,我们可以观察到如何通过更改knn值来区分值。 f)最佳knn = 41且错误率选择为0.0614 Fuzzyknn,r_radius_neighbour实现 我想出了我自己的KNN函数,例如Fuzzyknn和rnearest knn。 a)我用欧几里得距离实现了模糊算法。 我在另一个脚本中编码了Fuzzyknn函数,然后将其调用到主脚本中以查看不同knn值的结果。
2021-10-20 19:38:12 59KB 系统开源
1
matlab 10折交叉验证知识代码分类算法评估 介绍 该项目的目标是基于以下内容评估一组分类器: 准确性 敏感性和 特异性 资料集 该项目使用的数据集是从乳腺癌数据库中获得的,可以找到。 快速描述如下: 实例数为699。 每个实例具有2种可能的类别之一:良性(65.5%)或恶性(34.5%),分别由2和4表示,稍后用-1和1代替。 每个实例具有9个按[1-10]比例缩放的属性以及类标签。 缺失的属性(总共16个)被替换为最常出现的值。 分类器 在此项目中评估的分类器以及为其属性设置的值是: 贝叶斯 概率分类器,通过基于实例具有的属性值来估计该实例最有可能属于哪个类,从而为该实例分配一个类标签。 先验概率根据data-description.txt,将良性和恶性分别设置为0.655和0.345的那些 K最近邻居 在这种情况下,对象通过其邻居的多次投票进行分类。 打破领带 如果是平局,则使用最接近的级别。 k选择 为了优化性能,将k设置为训练集大小的平方根。 通常,较大的k值会减少噪声对分类的影响,但会使类别之间的界限不那么明显。 邻居效应 为了使距离较近的邻居比距离较远的邻居贡献更多,
2021-09-03 09:14:16 33KB 系统开源
1
matlab中knn代码 Improved-KNN-for-predication KNN进行预测 转载使用请注明出处(●'◡'●),还请多多star~ 使用MATLAB进行基本KNN的建模以及改进KNN的建模 后期论文发表后可参考文章使用相应代码,文章预计今年6月左右发表! 部分代码里的空间预测/时间预测是适用于某项目,可自行决定是否使用该变量 基本KNN KNNbasedist是基础款KNN的两向量距离计算 KNNbasetrain是基础KNN在K值下的训练误差的计算 KNNbaseopt是基础款KNN最优K值的探索 KNNbasepred是基础KNN预测 内权重算法两个: wC45是C4.5算法计算内权重值 hdeter是AFW分类算法h值的输入(附属于wAFW) wAFW是AFW分类算法计算内权重值 外权重算法两个: Wprobe是基于概率的外权重值计算 Wdist是基于距离的外权重值计算 改进KNN KNNwdist是具有内权重的两向量距离计算 KNNWtrain是具有内外权重的KNN在K值下的训练误差的计算 KNNWwopt是具有内外权重的KNN最优K值的探索 KNNWwp
2021-07-17 11:25:32 13KB 系统开源
1