bilibili-barrage-analysis bilibili弹幕分析,包含爬虫、词云分析、词频分析、情感分析、构建衍生指标,可视化 主要依赖库 selenium pandas lxml json requests pyecharts jieba snownlp wordcloud 信息爬取   1.1 爬取bilibili某一个分区(可通过url定义)特定日期下按照视频热度降序排序的视频信息,包含:href、视频时长、名称、BV号、播放量、弹幕数、up主、up主id   1.2 通过BV号获取视频评论Cid,解析xml网页,简单获取各个视频的弹幕内容(注意:条数有限制,xml的弹幕条数不超过1000条)   1.3 通过up主id,获取up主在爬取时的粉丝数,此粉丝数可以精确到个位数   1.4 通过BV好获取视频评论Cid,获取详细的弹幕内容,包括:弹幕出现时间、弹幕模式、字号、
2021-09-20 19:37:22 26.06MB python selenium pandas wordcloud
1
用r语言做词频分析,使用的是mix混合模型 library(jiebaR) library(wordcloud) text<-scan('C:\\Users\\gk01\\Desktop\\1.txt',what='') mixseg <- worker() seg <- mixseg[text]
2021-09-05 13:04:07 280B 词频分析
1
Excel词频分析工具+启用“宏”功能(对应各种Excel版本) (内含教程,包会,点击直接使用)
2021-08-13 20:19:16 8.34MB 词频分析工具 WPS启用“
1
WinDecrypto是一个非常轻量的分析软件,意在用于分析词频,解决基于古典概型的密码学问题
2021-07-16 19:59:13 2.8MB WinDecrypto 词频分析 古典密码
1
用于文件出现频率统计和分析
2021-06-23 09:05:32 2.32MB 词频分析工具
1
bilibili弹幕分析,包含爬虫、词云分析、词频分析、情感分析、构建衍生指标,可视化 **** **主要依赖库** > selenium > pandas > lxml > json > requests > pyecharts > jieba > snownlp > wordcloud **信息爬取**   1.1 爬取bilibili某一个分区(可通过url定义)特定日期下按照视频热度降序排序的视频信息,包含:href、视频时长、名称、BV号、播放量、弹幕数、up主、up主id   1.2 通过BV号获取视频评论Cid,解析xml网页,简单获取各个视频的弹幕内容(注意:条数有限制,xml的弹幕条数不超过1000条)   1.3 通过up主id,获取up主在爬取时的粉丝数,此粉丝数可以精确到个位数   1.4 通过BV好获取视频评论Cid,获取详细的弹幕内容,包括:弹幕出现时间、弹幕模式、字号、弹幕颜色、弹幕池、发送者加密id、弹幕id **数据分析--词云**   2.1 全区弹幕词云分析,可以通过自己编写剔除单字、去除停用词、调整分词模型进行优化   2.2 分频道弹幕词云分析 **数据分析--弹幕条数**   3.1 分析全区弹幕前十视频,使用pyecharts柱状图进行可视化   3.2 分析各频道平均/最高视频弹幕数 **数据分析--指标构建**   构建指标:互动指数:弹幕数 / 播放量 * 100               粉丝响应指数:up主粉丝数 / 播放量   4.1 全区互动指数最高前十视频   4.2 各频道最高/平均互动指数   4.3 全区粉丝响应指数最高前十视频   4.4 各频道最高/平均粉丝响应指数 **数据分析--情感分析**   5.1 分析全区所爬取的所有视频的所有弹幕的情感分布情况,获取总体情感指数印象   5.2 分析各个视频的情感分析,对每一条弹幕进行情感分析,输出弹幕的情感分析指数Excel表   5.3 分析各个频道的情感分析指数分布图
2021-06-22 19:18:59 25.68MB bilibili 词云分析 爬虫 词频分析
通过python及其jieba三方库,筛选关键词,整合《红楼梦》人物出场排名,也可整合《红楼梦》词汇使用情况,从而分析《红楼梦》的角色戏份及用语习惯。
2021-06-22 19:14:29 2KB python jieba
1
分词、词频分析软件。我自己基于csws开发的。拿走不谢。有用的记得给个好评
2021-05-29 09:51:34 18.67MB 分词 csws gui 词频分析
1
适合数据分析人群对文档进行词频分析,可自定义文档地址、输出词云形状模板
2021-05-10 15:03:08 28KB Python 词云 数据分析
WinDecrypto是一个用于分析词频,解决基于古典密码学问题。可用于古典密码的破解,也可用于CTF解题。可以作为线词频分析网站http://quipqiup.com/的离线版使用。文章比较长的情况下可能跑得比较慢,可以直接使用在线网站。 使用说明:解压后是个exe文件,双击直接安装。如果提示Java not installed,可以在C:\Program Files (x86)\目录下安装java 1.6即可。如果在C:\Program Files\目录下安装java 1.8还是会报错。也可以用7-zip直接解压exe文件后直接运行,无需安装。
1