Java使用结巴分词时,必须应用的 jar包。应用于 分词器
2019-12-21 20:16:32 2.09MB 资源包
1
使用Python,对爬取微博的评论,进行jieba分词,统计词频,修改路径即可。
2019-12-21 19:33:13 835B jieba 分词 微博评论
1
Python Jieba中文分词工具实现分词功能,Python Jieba中文分词工具实现分词功能
2019-12-21 18:57:53 126.01MB jieba Python
1
金融方面的常见词汇形成的词典/语料库,jieba.load_userdict()即可使用
2019-12-21 18:53:33 15KB NLP 语料库 jieba 分词词典
1
因为比赛需要用到结巴分词,所以写了一个关于结巴分词、词性标注以及停用词过滤的python程序。
2019-12-21 18:53:25 7.15MB python jieba
1
jieba和百度分词词库;
2019-12-21 18:53:13 2.51MB jieba词库 百度分词词库 分词词库
1
搜狗实验室新闻数据精简版,将xml文本进行处理后分类如下: 奥运 5595个txt 房产 14695 个txt 互联网 2200个txt 健康 1153个txt 教育 2075个txt 旅游 1802个txt 汽车 1405个txt 商业 12465个txt 时尚 3490 个txt 体育 17237 个txt 文化 628个txt 娱乐 6757个txt 招聘 18个txt 由于是个人xml文本处理过的,处理了部分文档,如果需要更多可以联系我。 免费下载链接:https://share.weiyun.com/X0prakLr
2019-12-21 18:52:17 83.69MB 搜狗语料库 jieba分词 文本分类
1