只为小站
首页
域名查询
文件下载
登录
kmeans中文文本聚类java源码(包括对文本tf,idf的计算,
文本相似度
计算)
算法思想:提取文档的TF/IDF权重,然后用余弦定理计算两个多维向量的距离来计算两篇文档的相似度,用标准的k-means算法就可以实现文本聚类。源码为java实现
2019-12-21 20:02:37
9KB
kmeans
中文
文本聚类
tf
1
java
文本相似度
对比
使用java调用HanLP分词器实现两个
文本相似度
对比,可以很快对比出百分率(1=100%)
2019-12-21 19:59:35
15KB
文本比对
相似度
HanLP
1
word2vec词向量训练及中文
文本相似度
计算 【源码+语料】
该资源主要参考我的博客:word2vec词向量训练及中文
文本相似度
计算 http://blog.csdn.net/eastmount/article/details/50637476 其中包括C语言的Word2vec源代码(从官网下载),自定义爬取的三大百科(百度百科、互动百科、维基百科)中文语料,涉及到国家、景区、动物和人物。 同时包括60M的腾讯新闻语料,是一个txt,每行相当于一个新闻。 国家包括了Python的Jieba分词代码,详见博客。 免费资源希望对你有所帮助~
2019-12-21 19:41:38
142.09MB
word2vec
源码
中文预料
词向量
1
JAVA编写的基于
文本相似度
匹配的文本聚类
使用JAVA编写的,分词、TFIDF相似度计算,K临近法聚类
2019-12-21 19:23:29
10KB
JAVA
TFIDF计算
K临近聚类
1
word2vec词向量训练及中文
文本相似度
计算
用来得到TXT文本中词语的相关性的深度学习模型,需要分词,text8为样例,运行脚本可以直接开始训练。最后得到.bin模型
2019-12-21 18:59:02
31.81MB
word2vec
深度学习
1
文本相似度
系统-java版本
java实现的
文本相似度
系统,使用向量空间模型以及余弦相似度距离公式,实测可以实现2篇文本的相似度计算且有一定的效果。
2019-12-21 18:56:02
46.37MB
文本相似度
1
中文
文本相似度
匹配算法
中文
文本相似度
匹配算法 simHash 海明距离 IK分词 完整的可运行的示例代码 包含simHash 算法,使用IK 对中文文本进行分词处理
2019-12-21 18:54:18
4.73MB
simHash
海明距离
中文文本
相似度匹配
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
鲸鱼优化算法 WOA matlab源代码(详细注释)
算法设计(中文版)和习题解答 Jon_Kleinberg著,张立昂译
随机森林用于分类matlab代码
中国地面气候资料日值数据集(V3.0)2014-2019.zip
基于MATLAB的Filter使用,低通、带通和高通滤波器的仿真
android开发期末大作业.zip
IBM.ILOG.CPLEX.Enterprise.Server.v12.10.0.Win64.rar CPLEX下载
华为结构与材料工程师-知识点总结【by詹姆斯申易登】.pdf
画程(版本6.0.0.127)setup个人版
基于傅里叶算子的手势识别的完整源代码(Python实现,包含样本库)
东南大学英语技术写作慕课所有答案
MVDR,Capon波束形成DO估计.zip
《MIMO-OFDM无线通信技术及MATLAB实现》高清PDF及源代码
多机器人编队及避障仿真算法.zip
voc车辆检测数据集(已处理好,可直接训练)
最新下载
Vivado暗黑主题配置文件
5G NR_ Architecture, Technology - 5G NR, Architecture, Technology.zip
Altium designer 2019年最新封装库(5/6)
Altium designer 2019年最新封装库(4/6)
Altium designer 2019年最新封装库(3/6)
Altium designer 2019年最新封装库(2/6)
Altium designer 2019年最新封装库(1/6)
Dataset之LFW人脸数据库
蓝牙虚拟串口源程序
uboot-imx-rel_imx_4.1.15_2.1.0_ga_20180806.tar.gz
其他资源
《ABAQUS 6.6基础教程与实例详解》-刘展-源代码-5245
低速 TTL 光模块
RTL8304MBI开发设计包.rar
lottery.zip
高精度时间测量芯片TDC-GP2在激光测距中的应用
25175学生作业提交管理系统 v2.1.1
S19文件解析
软件工程 医院挂号系统大作业
毕业设计选题管理系统
3DMAX 大作业
《数字图像处理-刚萨雷斯》图片素材
手把手教你学DSP--基于TMS320C55x光盘 含电路图+代码
Python爬虫框架Scrapy_200页操作过程
精炼瞬态电磁散射分析:基于磁场积分方程的新方法
An improved collaborative recommendation algorithm based on optimized user similarity
gradle-4.4-all.zip
LATTICE可编程器件烧写程序操作规程.docx
CCNA网络工程师培训PPT,适合于网络培训讲师、学生使用
ajax+webservice跨域实现文件上传
基于RFID的停车场管理
原生JavaScript飞机大战
FusionCharts for Delphi(Korp Chart)
Spartan-6原理图设计指南
jstl-1.2和standard-1.1.2.jar.rar