python 文本聚类分析案例说明摘要1、结巴分词2、去除停用词3、生成tfidf矩阵4、K-means聚类5、获取主题词 / 主题词团 说明 实验要求:对若干条文本进行聚类分析,最终得到几个主题词团。 实验思路:将数据进行预处理之后,先进行结巴分词、去除停用词,然后把文档生成tfidf矩阵,再通过K-means聚类,最后得到几个类的主题词。 实验说明:如何用爬虫获取数据可以参考其他博客,这里我们直接用一个周杰伦的歌词文本为例进行分析,把28条歌词聚成3个类。 摘要 实验源数据放在文件sourceData中,中间文件放在resultData中。 源文件: 结果: 1、结巴分词 直接上代码,
2021-03-14 19:24:10 1.31MB python 文本聚类 聚类
1
该资源是2020参加美赛所用代码,主要是做的文本分析,LDA,词云,分类统计,时间序列。内含原始数据和代码说明。
2021-03-12 18:11:15 21.15MB R语言 文本分析 LDA 词云
1
案例背景:目前在我国移动通讯行业基本呈现三足鼎立的局势,市场份额由中国移动、中国联通和中国电信三家运营商瓜分。客户流失问题非常严重,从近5年的统计数字来看,三家运营商的移动客户数增长缓慢,中国联通在2015年甚至出现了负增长。因此建立一套系统的客户流失预警体系已是燃眉之急。案例原文详见某移动通讯公司客户流失预警分析
2021-03-03 16:10:55 5KB R语言 机器学习
1
tableau可视化分析-案例集锦-地图变形图
2021-02-07 18:02:20 6.56MB 地图变形图 tableau可视化分析
tableau可视化分析-案例集锦-城市教育水平评估
tableau可视化分析-案例集锦-表盘小案例
2021-02-07 18:02:19 1.09MB 仪表盘 tableau可视化分析
tableau可视化分析-案例集锦-北京公交线路图
2021-02-07 18:02:19 3.2MB 北京公交线路图 tableau可视化分析
tableau可视化分析-案例集锦-北京城区域图
2021-02-07 18:02:18 63KB
tableau可视化分析-案例集锦--The Spice of Life-旋风图
2021-02-07 18:01:48 244KB 旋风图 tableau可视化分析