微博爬虫,一个基于Scrapy框架的轻量微博爬虫,Sina Weibo Spider.zip
2024-03-03 02:49:49 647KB 爬虫 scrapy
1
很久之前的android 新浪微博源码,时间太久,应该是完整的:)给热爱学习的孩子 :) http://blog.csdn.net/mkrcpp/article/details/12995615
2022-06-09 11:56:14 7.28MB android demo sina weibo
1
新浪微博互动预测 介绍 比赛的详细信息可以在找到竞争主要是分析用户在中国微博平台上发布的行为和消息,并预测每条消息的转发,评论和喜欢的次数。 该项目主要使用python和pandas。 这项比赛的第二阶段仍在进行中。 这是我为第1阶段构建的数据基准线。 设计 这是一个自行设计的数据基准线。 主要思想是模块化数据项目的流程。 用户编写方法来生成功能,其存储数据帧中大熊猫在功能的文件夹,并feature.log会自动记录所有现有的功能和它们的参数。 用户可以在Train方法中组合不同的功能并选择不同的模型,模型将存储在models文件夹中,模型的信息将存储在train.log中。 用户选择不同的功能和参数组合进行测试,结果将存储在结果文件夹中,而测试信息将存储在test.log中 笔记本文件夹中的Ipython笔记本用于播放数据,迭代地查看日志。 该代码位于weiboPredict
2021-12-11 21:15:37 31.29MB Python
1
微博公众意见数据集 不断更新新浪微博舆论数据集(仅用于研究) 更新:一站式科研数据服务平台已全面启动!! 只需单击几下即可实现数据采集,数据分析和数据应用。 欢迎尝试与合作 :clapping_hands: :clapping_hands: :clapping_hands: 介绍 新浪微博是中国最大的公共社交媒体平台。 最新和最受欢迎的社交活动将尽快在微博上公开和讨论。 因此,建立一个实时,全面的微博舆情数据集具有重要意义。 目前,在给定指定关键词和指定期限的情况下,微博推文数据集的构建方法有两种:(1)应用微博提供的高级搜索API; (2)遍历所有微博用户,收集指定时间段的所有推文,然后使用指定的关键字过滤推文。 但是,对于第一种方法,由于微博搜索API的限制,一次搜索的结果最多包含1000条推文,这使得构建大型数据集变得困难。 至于第二种方法,尽管我们可以构建几乎没有遗漏的大规模数据集,但是遍历数十亿微博用户需要非常长的时间和大量的带宽资源。 另外,大量的微博用户
2021-11-23 20:05:20 447KB
1
sina-weibo-crawler-master
2021-08-23 13:13:24 184KB sina-weibo 微博爬虫
从新浪微博爬虫下来的数据,评论语料库,可以作为情感分析的数据来源
2021-05-06 15:47:07 1.18MB sina weibo comment sentiment
1