MapReduce程序 完整实验报告 和 jar包 和简单实验数据
2021-06-22 16:08:41 1.59MB HADOOP 倒排索引 MapReduce程序
1
Inverted_Index_Generator 使用斯坦福 NLP 模块创建倒排索引。 在此处找到所有 JAR 文件: : 克兰菲尔德收藏: : 该项目的详细信息: :
2021-06-11 11:06:19 11KB Java
1
大数据 文档倒排索引算法
2021-05-27 13:04:04 4KB java
1
倒排索引的java实现,对于已经转化为txt的网页文档使用IK分词,然后建索引 倒排索引的java实现,对于已经转化为txt的网页文档使用IK分词,然后建索引
2021-05-19 17:59:34 13KB 倒排 IK java实现倒排 java
1
对所给的Tweets数据集建立倒排索引; 实现Boolean Retrieval Model,使用TREC 2014 test topics进行测试; Boolean Retrieval Model中支持and, or ,not,查询优化可选做;
2021-05-16 20:34:29 7.27MB python 倒排索引 布尔查询
1
这个是个人实验室做的ppt,主要讲了一下倒排索引,实践词典,bag of features,对比了一下mser和Mscr,其中含有mser与mscr的论文,有兴趣的童鞋可以下载,我本人是做搜索的
1
信息检索系统 利用倒排索引和向量空间模型实现的信息检索系统。 完成工作: 带位置信息的倒排索引 转化空间模型 TOP K查询 BOOL查询 初步查询 拼写矫正 名词查询 拼写矫正(以下) 运行 环境要求:python3 在初次运行程序前请下载词干还原依赖的语料库 在SearchSystem/main.py中已经注释掉下载语料库的命令 nltk . download ( "wordnet" ) nltk . download ( "averaged_perceptron_tagger" ) nltk . download ( "punkt" ) nltk . download ( "maxnet_treebank_pos_tagger" ) 取消注释后运行一次即可,语料库下载完成立即正常运行 Windows下如果嫌弃弃语料库下载比较慢,可以直接转到目录下的nltk_data文件夹nltk_d
2021-04-30 11:39:21 65.66MB 系统开源
1
编写程序实现为给定目录下txt文件建立倒排索引文件il.txt 运行后会自动生成 1.txt,2.txt,4.txt,其中 1.txt,2.txt需要你自己输入需要排序的文档(如莎士比亚的文集),排序结果输出在il.txt中
2021-04-14 21:06:34 7KB 信息检索 倒排索引 C++
1
读入文本集,建立倒排索引,内含有的TXT文本可以替换,源代码可以直接运行
2021-04-14 19:20:52 4KB C++ 倒排索引 信息检索
1
绝对是最简单的,仅供参考,希望大家不要吐槽,不足之处希望大家指出=。=
2021-04-11 15:26:23 849B C++ 倒排索引
1