Note:由房价预测例子的学到,用Stacking的思维来汲取两种或者多种模型的优点 ipython的代码和数据集在我的GitHub中,链接在下面,下面的代码是在pycharm里运行的,差别不大。 #Step 1: 检视源数据集 import numpy as np import pandas as pd from sklearn.linear_model import Ridge from sklearn.model_selection import cross_val_score from sklearn.ensemble import RandomForestRegressor imp
2022-06-17 15:08:54 131KB kaggle le 分类
1
常规相似度测量方法的性能受到高维数据维数诅咒的严重影响,原因是稀疏维数和噪声维数之间的数据差异占据了很大一部分相似度,从而导致任何结果之间的差异。提出了一种基于归一化净格子空间的高维数据测量方法,将每个维的数据范围划分为几个区间,将不同维的分量映射到对应的区间上,只有相同或相邻区间的分量为了验证该方法,为验证该方法,使用了三种数据类型,并比较了七种常见的相似性测量方法。 实验结果表明,该方法的相对差异随维数的增加而增加,比常规方法高出约两个或三个数量级。此外,该方法在不同维度上的相似范围为[0,1 ],适合进行降维后的相似性分析。
2022-05-16 13:24:21 1.75MB high-dimensional data the curse of
1
高维数据的惩罚复合分位数回归,李玉杰, 胡涛,在不同的科学领域中, 经常会遇到厚尾的高维数据. 此时经典的最小二乘回归的结果将变的很差. 本文章考虑模型假设为线性模型时, 模型�
2022-05-08 14:32:24 280KB 首发论文
1
大数据-算法-高维数据子空间聚类算法研究.pdf
2022-05-05 14:05:17 1.97MB 算法 聚类 big data
大数据-算法-高维数据的降维理论及应用.pdf
2022-05-05 09:07:02 7.09MB big data 算法 文档资料
大数据-算法-高维数据的聚类方法研究.pdf
2022-05-05 09:07:02 6.37MB 算法 聚类 文档资料 big
大数据-算法-高维数据分析中的降维方法研究.pdf
2022-05-05 09:07:01 2.82MB big data 算法 数据分析
大数据-算法-高维数据集合索引技术.pdf
2022-05-05 09:07:00 2.26MB big data 算法 文档资料
大数据-算法-高维数据几何分析理论算法与应用研究.pdf
2022-05-05 09:06:59 5.69MB 算法 big data 文档资料
大数据-算法-高维数据索引及其查询处理技术研究.pdf
2022-05-05 09:06:59 5.94MB 文档资料 big data 算法