Web2.0时代的信息共享和在线协同让每个用户不但可以从互联网上获取各种信息,还能自由地发布各种信息或对已有数据添加标注。一种普遍的应用就是对论坛上发布的文章添加标签以方便分类和检索,这种加标签的方式称为社会化标注(Social Annotation)。互联网上大量用户的标注使得这些信息成为检索的重要手段。目前这种标注大多以简单添加词或短语tag为主,对文本数据(例如博客文章、论坛帖子)来说,这些简单的标签足以提高检索效率,但在互联网中还存在大量如图像、地理信息等高维数据,简单标签并不能真实地反映这类数据的内容及结构化信息。因此,对互联网上高维数据提供新的标注模型,将人们对高维数据的认识真实的反映在标注上,对于这类数据的有效检索是十分必要的。 在分析现有研究工作的基础上,本文根据高维数据、社会化标注和多人协同标注的特点,对Web2.0环境下高维数据社会化协同标注的一致性维护问题和利用结构化语义标注的检索问题进行了深入的分析和研究。主要工作如下: Web2.0环境下高维数据的社会化协同标注及一致性维护。建立了高维数据的协同标注模型——结构化语义标注模型,并对标注信息进行抽象,提出冲突检...
1
高维数据SVM实现+降维可视化 是更改别人的代码的,使用软间隔最大化,SMO优化算法,t-sne降维可视化,发现数据是否是容易线性可分的。
2021-04-14 19:23:08 71KB svm
1
通过kpca进行降维,根据网上的程序改的,内含数据,数据为西储大学轴承数据,希望可以帮助到刚学的同学,有错误的地方请多多指教。
2021-04-14 18:37:03 44KB kpca 降维
1
最小噪声分离变换(Minimum Noise Fraction Rotation,MNF Rotation)维度压缩,使用matlab写成
2021-04-13 15:34:47 2KB MNF 维度压缩 matlab 最小噪声分离
1
数据可视化、从最少1维到最高6维,包含、箱图、直方图、密度图、折线图、平行图、散点图、立体图等;
2021-03-18 16:16:49 2.25MB 数据可视化 高维数据可视化
耶鲁大学马双鸽老师的高维数据统计分析的ppt,在国科大的暑期学校里使用的
2021-03-06 16:04:27 13.86MB BD
1
DBSCAN是一种经典的基于密度的聚类技术,在发现任意形状的聚类和处理噪声方面广为人知。 但是,面对高维数据时,密度计算非常耗时,这使得它在许多领域都效率低下,例如多文档摘要,产品推荐等。因此,如何有效地计算高维数据的密度成为了基于DBSCAN的群集技术的一个关键问题。 在本文中,我们提出了一种基于DBSCAN的高维数据聚类的快速算法,称为Dboost。 在我们的算法中,一种名为WAND#的分级检索技术改编被新颖地应用于改进密度计算而没有精度损失,并且我们通过减少WAND#的调用时间来进一步提高了这种加速。 对电线电压数据,Netflix数据集和微博语料库进行了实验。 结果表明,线电压数据和Netflix数据集可实现50倍以上的加速,而微博客数据可望实现100倍以上的加速。
2021-03-02 13:06:06 513KB DBSCAN high dimensionality WAND
1
数据可视化 医学
2021-02-17 14:03:15 509KB 医学 数据可视化
1
分类介绍了目前具有代表性的数据降维方法,重点阐述了一种新的数据降维方法 - 压缩感 知,在此基础上,分析了各种数据降维算法的优缺点,并对数据降维研究中存在的问题进行了剖析.
2020-01-27 03:16:08 362KB 压缩感知  数据降维
1
matlab的t-sne算法,完美实现t-sne算法,已经过检验可以使用,可放心下载运行。
2019-12-21 21:41:11 11.87MB t-sne算法 降维 matlab 高维数据
1