该资料是2020年美赛C题题目,内涵亚马逊评论购物评级数据集合。数据格式为数据库格式。希望有需要的伙伴学习下载。
2022-01-22 15:21:01 5.09MB 美赛 C题题目 亚马逊评论数据
1
LSTM官方例程的电影评论数据集 imdb.pkl
2022-01-19 22:20:11 31.67MB LSTM 数据集 imdb.pkl
1
亚马逊美食评论 Amazon Fine Food Reviews数据集包含568,454条亚马逊用户截至2012年10月的食品评论。 该分析的目的是建立一个预测模型,在此模型中,我们将能够预测推荐是肯定的还是否定的。 在此分析中,我们将不关注分数,而仅关注建议的积极/消极情绪。 涉及程序 该项目是关于文本数据使用的情感分析 nltk库,其中包括PorterStemmer()和word_tokenize(),可将非结构化文本数据更改为结构化文本 使用countvectorizer(将文本文档的集合转换为令牌计数矩阵),TfidfTransformer(以缩小在给定语料库中频繁出现的令牌的影响,因此,从经验上讲,其信息量少于一小部分的功能)来自sklearn库的训练语料库以进行特征提取 朴素的贝叶斯(MultinomialNB,BernoulliNB) 逻辑回归 使用roc曲线,confc
2022-01-11 17:59:05 101KB JupyterNotebook
1
Amazon 食品评论数据.zip
2022-01-03 19:34:00 239.21MB 食品评论数据
1
酒店评论数据集7000+条,外卖评论数据集11000+条,有正负标签
2021-12-29 10:55:25 1.41MB 数据集 情感分析
1
京东20万条评论数据.rar
2021-12-28 17:13:24 85.38MB 数据
1
【Python爬虫实例学习篇】——5、【超详细记录】从爬取微博评论数据(免登陆)到生成词云 个人博客地址:ht/tps://www.asyu17.cn/ 精彩部分提醒: (1)微博评论页详情链接为一个js脚本 (2)获取js脚本链接需要该条微博的mid参数 (3)获取mid参数需要访问微博主页 (4)访问微博主页需要先进行访客认证 (5)微博主页几乎是由弹窗构成,所有html代码被隐藏在FM.view()函数的参数中,该参数是json格式 工具: Python 3.6 requests 库 json 库 lxml 库 urllib 库 jieba 库(进行分词) WordCloud 库(产生词
2021-12-28 01:38:49 3.65MB 学习 数据 爬虫
1
重庆武隆酒店评论数据集重庆武隆酒店评论数据集重庆武隆酒店评论数据
2021-12-23 09:28:19 1000KB 评论数据集
1
IMDB_Sentiment_Analysis 鉴于大量的在线评论数据(Amazon,IMDB等),情绪分析变得越来越重要。 在这个项目中,建立了一个情感分类器,用于评估一段文字的极性是正还是负。 情感分析是在Keras随附的IMDB数据集上完成的。 它由25,000个训练样本(其中20%是验证样本)和25,000个测试样本组成。 数据集中的所有单词均已预先标记。 使用自训练的单词嵌入(Keras嵌入层)。 我训练了不同的模型,其中一个模型包含一个LSTM层。 它在10个时元上的准确度为84%。 第二个示例由两组Conv1D和MaxPooling1D图层组成,后面是标准GRU图层。 观察到85%的准确性。 我已经将CuDNN层用于LSTM和GRU,因为它们在GPU上的速度比标准LSTM和GRU层快得多。 所有实现都是使用Keras进行的。 另一个具有RMS Prop精度的示例为84%,而
2021-12-21 16:05:55 95KB JupyterNotebook
1
微博评论数据集7962条,其中包含积极和消极情感倾向
2021-12-14 09:08:26 5.29MB SVM 情感分析
1