分享自然语言处理课程——自然语言处理NLP企业级项目课程合集(实体关系抽取+情感分析+新闻文本分类+火车票识别+命名实体识别),视频,源码,数据,课件,资料完整
2023-07-21 10:33:18 287B 自然语言处理 NLP
1
Dataset We use preprocessed data (See Xiang Zhang's folder) AG's news, Sogou, DBpedia, Yelp P., Yelp F., Yahoo A., Amazon F., Amazon P. Experiment # Download a spacy "en_core_web_lg" model $ python3 -m spacy download en_core_web_lg --user # Download datasets (select your os (mac or ubuntu)) $ sh
2023-07-12 08:29:36 613.88MB nlp
1
哈工大和复旦大学的情感词典语料的结合,并且人工过滤了一些歧义词,用传统的svm和lr做情感分析f1指标达到96%以上,是情感分析非常好的词典语料
2023-06-04 23:11:49 368KB NLP
1
chop Python 中文分词工具包 欢迎 GitHub: Pypi: 依赖 Python3 使用说明 代码对 Python 3 兼容 全自动安装: easy_install chop 或者 pip install chop / pip3 install chop 接口 from chop.hmm import Tokenizer as HMMTokenizer from chop.mmseg import Tokenizer as MMSEGTokenizer sentence = "工信处女干事每月经过下属科室都要亲口交代24口交换机等技术性器件的安装工作。" def main(): HT = HMMTokenizer() MT = MMSEGTokenizer() print('HMM Tokenizer:', ' '.join(HT.cut(senten
2023-05-16 14:07:58 7.81MB nlp segment parser chinese-nlp
1
自然语言处理技术之知识图谱的两篇入门文章,包括简介和进阶,PDF格式,文章不长,可以作为入门读物
2023-04-30 21:59:30 1.58MB 知识图谱 自然语言处理 NLP
1
SharpNLP是C#实现的一个开源的自然语言处理工具集,它提供了如下功能: * 句子分割 * 分词 * 词性标注(POS tagging) * a chunker (used to "find non-recursive syntactic annotations such as noun phrase chunks") * a parser * a name finder * a coreference tool * 访问wordent数据库的借口
2023-04-24 17:23:24 603KB NLP sentiment wordnet segmentation
1
本文是自动化科学与电气工程学院电子信息专业学生朱远哲在深度学习与自然语言处理课程中完成的第三次大作业,题目为LDA模型。该文首先描述了问题的背景和目的,然后介绍了LDA模型的原理和应用,包括主题模型和文本分类等方面。接着,作者详细阐述了LDA模型的实现过程和结果分析,包括数据预处理、模型训练和评估等方面。最后,作者总结了LDA模型的优缺点和未来研究方向,并对本次大作业的收获和不足进行了反思和展望。
2023-04-24 09:08:38 957KB
1
这是本人通过网上博文整理的文本挖掘知识体系思维导向图,便于理解和整理思路。后续的朋友可以根据自己的知识进行对其删除或增加完善它。
2023-04-23 21:49:49 50KB 文本挖掘 NLP DeepNLP 数据挖掘
1
jLDADMM:用于LDA和DMM主题模型的Java包 jLDADMM已发布,它为普通或短文本上的主题建模提供了替代方法。 概率主题模型,例如潜在狄利克雷分配(LDA)[1]和相关模型[2],被广泛用于发现文档集中的潜在主题。 但是,由于数据稀疏性以及此类文本中的上下文有限,将主题模型应用于短文本(例如Tweets)更具挑战性。 一种方法是在训练LDA之前将短文本组合成长的伪文档。 另一种方法是假设每个文档只有一个主题[3]。 jLDADMM提供了LDA主题模型[1]和每个文档一个主题的Dirichlet多项式混合(DMM)模型(即,字母组合的混合)[4]的实现。 LDA和DMM的实现分别使
2023-04-18 11:35:19 133KB nlp topic-modeling lda short-text
1
利用rnn网络和lstm网络进行下一个字的预测 eg: `输入`:**我觉得这个【向后输出20个字】** `输出`:**我觉得这个地方便,但是一个人的,但是一个人的,但是一个**
2023-04-17 01:30:45 3.88MB nlp rnn lstm
1