目前,已有许多高效的字符串相似性连接算法被提出,但是这些算法在过滤的过程中利用的往往是字符串本身的局部信息,而忽略了字符串集合的整体信息,故性能没有得到充分的提高。为此,提出了一种基于划分的算法Part-Join,它从频率向量、字母表、频率分布三方面对数据集进行子集划分,并给出子集间的过滤策略用于排除不相似的字符串对。扩展实验表明,Part-Join比已有算法Pass-Join效率提高了10%~15%。
2021-10-27 10:35:55 557KB 相似性连接 划分 频率 编辑距离
1
本程序致力于解决识别图形形状的问题。对于本程序所涉及的图形形状相似性问题,本程序实现了五个基本要求: 1.对于任意两个图形的相似程度必须得出一个量化的结果,在此称为图形相似度。 2.对图形形状的检测必须忽略 大小、旋转、轴对称、连线顺序的影响。 3.对于相同的图形,形状相似度必须为1;对于不相同的图形,形状相似度必须小于1。 4.两个图形的形状相似度必须与其相似程度成严格单调性,即对于同一个基准图形,越相似的图形相似度越高,越不相似的图形相似度越低。 5.必须能在可接受的时间与空间耗费内求解出结果。 本程序可以求解出闭合图形或非闭合图形的相似度(或混合图形的相似度)。并在极低的空间和时间耗费水平上求解出结果。 本程序暂时最多可以检测有100个节点的矢量图形。对于使用到的参数和运算方法暂不提供详细说明。
2021-10-26 10:24:40 4.17MB 矢量图 图形 形态 相似性
1
为适应数据集分布形状多样性以及克服数据集密度问题,针对已有算法对离群簇检测效果欠佳的现状,提出了一种基于K-近邻树的离群检测算法KNMOD(outlier detection based on K-nearest neighborhood MST)。算法结合密度与方向因素,提出一种基于K-近邻的不相似性度量,然后带约束切割基于此度量构建的最小生成树从而获得离群点。算法可以有效地检测出局部离群点以及局部离群簇,与LOF、COF、KNN及INFLO算法的对比结果也证实了算法的优越性能。
1
语音处理指定了一个由 Lawrence Rabiner 教授(罗格斯大学和加州大学圣巴巴拉分校)、Ronald Schafer 教授(斯坦福大学)、Kirty Vedula 和 Siva Yedithi(罗格斯大学)组成的团队。 此练习是一组语音处理练习之一,旨在补充LR Rabiner和RW Schafer编写的教科书“数字语音处理的理论和应用”中的教材。 这个 MATLAB 练习实现了 Verhelst 和 Roelands 的 Waveform Similarity and Overlap Add (WSOLA) 方法(An Overlap-Add Technique Based on Waveform Similarity (WSOLA) for High Quality Time-Scale Modification of Speech,Werner Verhelst 和 Mar
2021-10-14 14:43:13 4.54MB matlab
1
基于局部敏感哈希和结构化P2P网络的相似性图像检索的计算机研究.docx
2021-10-08 23:11:54 88KB C语言
由于用户评分标准存在差异,基于打分的协同过滤推荐算法在近邻选择过程中存在误差。针对以上问题,提出考虑用户间消极相似性的排序推荐算法 (NS-TauRank),该算法不经过对拟推荐项目的预测评分过程。定 义 DP函 数 表 示 项目对相关属性,充分利用用户间的消极相似性,即相似性为负的用户之间的爱好相反,改进目标用户的近邻选择过程,采用舒尔茨方法进行偏好融合,优化目标用户拟推荐项目的排序。在 Eachmovie和 movielens数据集上对改进算法进行验证,以 NDCG作为评价函数,验证结果表明,该算法在两个数据集上的 NDCG@1-2值较对比算法有4%-7%的提高,产生了更可靠的拟推荐序列。
1
图数据库的相似性搜索是一个非常重要的研究内容,图的相似性匹配属于图同构的判定问题,是NP完全问题,传统的高开销搜索的方法已经不能满足复杂图查询的需要;另外,由于图数据库的复杂性和特殊性,已有的优化算法不能直接使用。为了提高图数据库的搜索效率,提出了一种基于索引的相似性搜索算法,通过数据库中的频繁结构建立特征索引,算法可高效准确地滤除大量的非相似图集合,避免了图之间精确匹配即图同构的计算,最后将本算法应用于化学数据库,实验结果证明了该方法的有效性和可行性。
2021-10-07 11:41:35 650KB 图查询 图特征 索引 图同构 相似性搜索
1
wolfe函数MATLAB代码高维相似性学习 HDSL 是我们介绍的相似性学习方法的 Matlab/MEX 实现(另请参见较长的 )。 HDSL 允许在高维数据上对稀疏双线性相似函数进行可扩展的学习。 HDSL 在 GNU/GPL 3 许可下分发。 入门 要安装和运行演示,请在 Matlab 控制台内使用 install demo_HDSL 参考 如果您在科学工作中使用此代码,请引用: K. Liu、A. Bellet 和 F. Sha。 高维稀疏数据的相似性学习。 人工智能与统计国际会议 (AISTATS),2015 年。 K. Liu 和 A. Bellet。 逃避相似性学习中的维度诅咒:高效的 Frank-Wolfe 算法和泛化边界。 神经计算 333:185-199, 2019。
2021-10-03 21:11:41 1.39MB 系统开源
1
包含了基于层间相似性的特征向量中心性度量的原文和中文翻译。 部分摘要: 在这篇文章中,我们提出了一种改进的基于特征向量的时序网络中心性度量方法(IECM),将相邻层间的耦合强度视为层间相似度。通过对两个真实网络节点的时间全局效率影响的结果进行比较,发现该方法比传统的ECM方法能更准确地识别出具有影响力的节点。
1
一种局部相似性特征描述符,经典的图像特征描述符,可用于图像匹配
2021-09-28 17:07:52 1.08MB 局部相似性 局部相似性描述符