只为小站
首页
域名查询
文件下载
登录
首页
开发技术
其它
simhash:一种有效的文本相似度计算算法
simhash:一种有效的文本相似度计算算法
上传者:
42144199
|
上传时间: 2022-03-16 16:35:17
|
文件大小: 2.05MB
|
文件类型: -
Java
simhash 高效的文本相似度去重算法实现 simhash是什么 Google发明的的文本去重算法,适合于大批量文档的相似度计算 主要步骤 对文本分词,得到N维特征向量(默认为64维) 为分词设置权重(tf-idf) 为特征向量计算哈希 对所有特征向量加权,累加(目前仅进行非加权累加) 对累加结果,大于零置一,小于零置零 得到文本指纹(fingerprint)
文件下载
立即下载
评论信息
其他资源
BP神经网络手写数字识别完整代码matlab
清除fragment页面数据(重新加载布局)
模拟电子电路及技术基础 第二版 教学指导书 孙肖子
奇异值分解(SVD)C语言源代码
PCLDebug.props
修改IMEI APP
DirectX修复工具V3.9增强版
Kalman滤波在视频图像目标跟踪中的应用
西山 DOS 4.03 + WPS 1.2 + DOSBOX 0.73
罗伯塔斯-源码
vc学生管理系统 vc实例
IP新技术专题.pdf
YJV电缆载流量表(1).xlsx
CS424-项目1-源码
2016年10月高等教育自学考试全国统一命题考试现代管理学试卷和答案.doc
gsl_lib.zip
keepalived + nginx组建高可用负载平衡Web server集群
asp.net网上商城系统(原创)(数据库课程设计)
Java 并发编程实战.pdf
java 图书馆管理系统 mysql
山东大学数据库课程设计——在线图书馆管理系统(附加实验报告)
2019年最新OCP053通关整理真题(711+36+60),本人3月30号考试亲测分数80%,百分百通关
iview后台框架
python+django练手项目
xlsx.full.min.js
免责申明
【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明
个人信息
点我去登录
购买积分
下载历史
恢复订单
相关资源标签
Actionscript
C
C#
C++
Delphi
Java
Javascript
Perl
PHP
Python
VB
Web开发
硬件开发
其它
热门下载
拾荒者扫描器.rar
通过svm cnn knn对高光谱数据集PaviaU进行分类(matlab)
云视通端口扫描器.rar
MATLAB之LSTM预测
DBSCAN算法Matlab实现
Matpower中文使用手册(原名《MATPOWER手册(中文版)》).rar
csma/ca和csma/cd的matlab仿真源代码带有详细的注释
科研伦理与学术规范 期末考试2 (40题).pdf
2020年数学建模国赛C题论文
中国地面气候资料日值数据集(V3.0)2014-2019.zip
pytorch实现RNN实验.rar
stm32f103+OLED12864+FFT音乐频谱(多种显示效果 提供原理图)
大学生网页设计大作业-5个网页设计制作作品自己任选
采用K-means聚类,实现多维矩阵的聚类,并进行可视化展示(matlab)
狂神说全部笔记内容.zip
最新下载
DbVisualizer10.0.20 32位和64位(内含破解文件)
YOLOv4人头检测器训练数据集
stm32+cjson库实现json格式创建与解析
orabf-v0.7.6.zip
麒麟版firefox.zip
使用AnyLogic多方法仿真建模-中文官方培训教程 ppt
光学仿真TracePro下载
window 下直接运行的 labelImg.exe
华为公司硬件设计规范合集
ANYLOGIC用户手册