面向高维数据的分层特征选择算法软件工程研究.docx
2021-10-15 16:03:05 148KB C语言
目前对高维数据进行挖掘的方法大多是基于数学理论而非可视化的直觉。为便于直观分析和评价高维数据,提出引入随机森林(RF)方法对高维数据进行数据可视化。首先,采用RF进行有监督学习得到样本间的相似度度量,并采用主坐标分析法对其进行降维,将高维数据的关系信息变换到低维空间;然后,在低维空间中采用散点图进行可视化。在高维基因数据集上实验结果表明,基于RF有监督降维的可视化能够较好地展现高维数据的类分布规律,且优于传统的无监督降维后的可视化效果。
2021-10-14 17:59:24 527KB 工程技术 论文
1
“要处理14维空间中的超平面,请可视化3D空间并大声说出“十四”。每个人都这样做。 ”-杰夫·欣顿(Geoff Hinton) 总览 HyperTools旨在促进基于降的高维数据可视化探索。 基本管道是输入一个高维数据集(或一系列高维数据集),并在单个函数调用中降低数据集的维数并创建图。 该软件包建立在许多熟悉的朋友之上,包括 , 和 。 我们的软件包最近在。 对于一般概述,您可能会觉得很有用(作为达特茅斯一部分提供)。 试试吧! 单击徽章以启动示例实例的活页夹实例: 要么 在HyperTools检查Jupyter笔记本的。 安装 要安装最新的稳定版本,请运行: pip install
2021-09-29 08:31:23 14.75MB visualization python time-series data-visualization
1
[COEFF,分数,隐藏,特例] = fastpca(数据) 非常高维数据的快速主成分分析(例如神经影像数据的体素级分析),根据 C. Bishop 的书“模式识别和机器学习”,第 10 页实施。 570.对于高维数据,fastpca.m比MATLAB的内置函数pca.m快得多。 根据 MA​​TLAB 的 PCA 术语,fastpca.m 需要一个输入矩阵,每行代表一个观察(例如主题),每列代表一个维度(例如体素)。 fastpca.m 返回主成分 (PC) 载荷 COEFF、PC 分数 (SCORE)、PC 以绝对值 (LATENT) 和百分比 (EXPLAINED) 解释的方差。 此外,fastpca 返回小协方差矩阵 (COEFF) 的 PC 负载。 计算时间的减少是通过从转置的输入矩阵“数据”的(较小)协方差矩阵而不是原始输入矩阵的大协方差矩阵中计算出PC来计算的,然后将这
2021-09-19 01:01:01 2KB matlab
1
PCA_高维数据可视化.ipynb
2021-09-07 19:05:51 19KB 主成分分析 PCA
1
isodata的matlab代码博客F_ISODATA 基于模糊主成分分析(FPCA)聚类的高维数据可视化”
2021-08-16 23:07:22 457KB 系统开源
1
matlab代码粒子群算法Hybrid-K-means-Pso(MATLAB) K-Means的高级版本,使用粒子群算法对高维数据集进行聚类,可以更快地收敛到最佳解决方案。 “聚类”是一种用于对数据集中的元素进行分区的技术,以便将相似的元素分配给相同的群集,而将具有不同属性的元素分配给不同的群集。 快速,高质量的文档聚类算法在有效地导航,汇总和组织信息方面起着重要作用。 分区聚类算法更适合于对大型数据集进行聚类。 在此项目中,我们将实现带有K-means文档聚类算法的混合粒子群优化(PSO),该算法执行快速文档聚类,并且可以避免陷入各种高维数据集的局部最优解中。 PSO与K-means混合算法结合了PSO算法的全局搜索能力和K-means算法的快速收敛性。 对获得的结果进行分析,并比较该算法在大型数据集上的准确性和性能。 数据集:IRIS,扑克,心脏,避孕方法选择数据集(取自UCI存储库) 如果还需要gui和代码,请复制所有gui文件。 否则,只需复制您所需数据的各个Kmeans.m,KPSO.m和KPSOK.m文件,然后以相同的顺序执行即可。 还包括所有数据文件。 完整的信息,背景和
2021-07-05 12:24:48 2.48MB 系统开源
1
为确保高维数据的神经网络分类精度,提出了先降维后分类的方法。采用主成分分析(PCA)法实现高维数据的降维。通过分析传统BP算法,提出分两步来更新网络权值的扰动BP学习方法。采用MATLAB对降维分类算法的分类精度和误差收敛速度进行分析。仿真结果显示:先降维再采用扰动BP网络进行高维数据分类可大大提高数据的分类精度和训练速度。
2021-05-23 14:28:34 1.77MB 高维数据
1
针对高维数据聚类的问题,许多有效的方法已经被提出,级联的子空间聚类算法CSC就是一种有效的解决法案。但是CSC算法定义的聚类损失可能破坏特征空间,从而取得非代表性的无意义特征,进而损害聚类性能。为了解决这一问题,提出了一种结合自编码器保留数据结构的改进算法。具体地说,使用聚类损失作为引导,分散特征空间数据点,同时采用一种欠完备的自动编码器作为重构损失,约束操作和维护数据生成分布的局部结构。将两者结合,共同优化聚类标签的分配,学习适合聚类的局部结构保留特征。使用自适应矩估计(Adam)和小批量随机梯度下降(mini-batch SGD)两种优化方法调整模型参数。在多个数据集上,使用聚类结果准确率(ACC)、标准互信息(NMI)和调整rand指数(ARI)三个评价指标验证了该算法的有效性和优越性。
2021-04-30 17:03:09 1.31MB 高维数据聚类 自编码器 聚类损失
1
fcm高维数据聚类.
2021-04-29 10:51:48 1KB fcm
1