包含微博爬虫、LDA主题分析和情感分析三个部分。 1.微博爬虫 实现微博评论爬取和微博用户信息爬取,一天大概十万条。 2.LDA主题分析 实现文档主题抽取,包括数据清洗及分词、主题数的确定(主题一致性和困惑度)和最优主题模型的选择(暴力搜索)。 3.情感分析 实现评论文本的情感值计算,准确率超过97%,处于0到1之间。
2021-11-30 09:07:39 79KB 微博
股市舆情情感分类可视化系统 最后更新2018年7月16日 此Web基于Django + Bootstrap + Echarts等框架,个股交易行情数据调用了Tushare接口。关于舆情文本数据采取先爬取东方财富网股吧论坛标题标题设置机器学习训练集,在此基础上运用scikit-learn机器通过Django Web框架,将所得数据传递到前端通过Bootstrap渲染过的html,对数据使用Echarts进行图表可视化处理。 不足之处或交流学习欢迎通过邮箱联系我 目前的功能: 个股历史交易行情 个股相关词云展示 情感字典舆情预测 朴素贝叶斯舆情预测 去做 Web UI优化 横向拓展多股吧 横向拓展多分类器 完善训练集 约会金融模型 系统结构 快速开始 在项目当前目录下: $ python manage.py runserver浏览器打开127.0.0.1:8000 PC端实例: 移动端: 运行效果 情感字典舆情预测: 机器学习舆情预测:
2021-11-28 20:25:06 5.73MB javascript python bootstrap machine-learning
1
火锅作为中国历史悠久,老少皆宜的美食,一直以来备受人们青睐,火锅餐饮行业不断发展。就目前的火锅市 场而言,大致可以分为川派、北派和海派火锅三类火锅品牌,其中又以海底捞为代表的川派火锅为行业主力军。 但总体来说,人们对火锅的口味更趋于多样化、综合化,对服务要求更个性化,火锅行业从口味上来说综合性 更强,而在经营管理上则趋精细化。
1
微博公众意见数据集 不断更新新浪微博舆论数据集(仅用于研究) 更新:一站式科研数据服务平台已全面启动!! 只需单击几下即可实现数据采集,数据分析和数据应用。 欢迎尝试与合作 :clapping_hands: :clapping_hands: :clapping_hands: 介绍 新浪微博是中国最大的公共社交媒体平台。 最新和最受欢迎的社交活动将尽快在微博上公开和讨论。 因此,建立一个实时,全面的微博舆情数据集具有重要意义。 目前,在给定指定关键词和指定期限的情况下,微博推文数据集的构建方法有两种:(1)应用微博提供的高级搜索API; (2)遍历所有微博用户,收集指定时间段的所有推文,然后使用指定的关键字过滤推文。 但是,对于第一种方法,由于微博搜索API的限制,一次搜索的结果最多包含1000条推文,这使得构建大型数据集变得困难。 至于第二种方法,尽管我们可以构建几乎没有遗漏的大规模数据集,但是遍历数十亿微博用户需要非常长的时间和大量的带宽资源。 另外,大量的微博用户
2021-11-23 20:05:20 447KB
1
基于舆情事件的词汇关联分析,既是面向网络舆情的情报研究中的一项关键技术,也是保证和提高网络舆情分析质量的一个重要途径。文章研究基于词跨度的关键词获取算法,对候选关键词进行权重计算。研究计算词汇之间的共现率算法,通过限定范围和结果组配的方法识别词汇间的关系。实验测试取得了良好效果,对于提高网络舆情事件分析的质量有重要意义和应用价值。
2021-11-19 23:21:56 340KB 工程技术 论文
1
情感倾向 新浪 微博 舆情分析 本体 情感倾向 新浪 微博 舆情分析 本体
2021-11-18 16:38:55 881KB 情感倾向 新浪 微博 舆情分析
1
网络舆情信息自动侦测软件,输入关键词及网址运行,即可间歇性自动搜索关键词出现的页面,保存链接,可以点击查看
2021-11-11 16:24:24 31.22MB 舆情 监控 软件
1
股票信息型操纵中上市公司舆情演化机理之金融学研究.docx
2021-10-20 10:02:13 113KB
之前做过的项目 陆续还会上传一些代码资源 程序真实能运行 有问题可以进行咨询 大桃子技术
2021-10-13 16:08:05 564.36MB python
探索者互联网舆情监测系统根据关键词策略对指定的网站、论坛、贴吧、微博、微信公众号文章进行扫描和源码分析,同时可抓取特征号码,并通过系统界面、邮件、短信三种模式进行舆情预警,并可提供多种图形化舆情分析。同时系统支持多层级部门和多用户定义,部署
1