流行性感冒是一种传染性疾病,传播Swift而广泛。 流感的爆发给社会带来了巨大的损失。 本文设置了流感关键词的四个主要类别,即“预防阶段”,“症状阶段”,“治疗阶段”和“常用短语”。 使用Python网络爬虫从国家流感中心的流感监测每周报告和百度索引中获取相关的流感数据。 通过机器学习建立支持向量回归(SVR),最小绝对收缩和选择算子(LASSO),卷积神经网络(CNN)预测模型,并考虑了流感的季节性特征,还建立了时间序列模型(ARMA) )。 结果表明,基于网络搜索数据预测流感是可行的。 机器学习在基于Web搜索数据的流感预测中显示出一定的预测效果。 今后它将在流感预测中具有一定的参考价值。 ARMA(3,0)模型可预测更好的结果并具有更大的概括性。 最后,给出了本文的研究不足和今后的研究方向。
2023-03-13 14:46:15 2.23MB 数据挖掘 网络搜索 机器学习 百度指数
1
3.1 通过爬虫对淘宝服饰的销量、评分、评价等数据进行爬取 3.2 数据清洗 3.3 对评价内容进行取样分词统计出关键词 3.4 运用hive以关键字对总体数据的统计
2023-03-13 11:03:16 2.36MB 数据挖掘
1
云南大学软件工程专业的数据挖掘各个实验(包含7个实验) 实验一: 一、 实验目的 1. 掌握朴素贝叶斯算法。 2. 选择一种编程语言应用朴素贝叶斯算法。 二、 实验内容 1.在一个简单的、虚拟的数据集(训练集)上应用离散型朴素贝叶斯模型。该数据集如下: 2.构建预测数据集,并在数据集上应用离散型朴素贝叶斯模型。 帅,不好,矮,不上进,不嫁 不帅,好,矮,上进,不嫁 帅,好,矮,上进,嫁 不帅,好,高,上进,嫁 帅,不好,矮,上进,不嫁 不帅,不好,矮,不上进,不嫁 帅,好,高,不上进,嫁 不帅,好,高,上进,嫁 帅,好,高,上进,嫁 不帅,不好,高,上进,嫁 帅,好,矮,不上进,不嫁 帅,好,矮,不上进,不嫁
2023-03-10 16:02:57 3.55MB 云南大学 软件工程 数据挖掘
1
数字化转型方法论PPT,很值得解决方案、架构师、产品经理的学习,如需要其它顾问咨询资料和数字化转型资料可以加我QQ409238113,免费发送
1
Python 豆瓣书评 bs4多页爬虫 jieba中文分词 tf-idf向量化 kmeans聚类+统计词频 +停用词 douban图书评价 浏览器多页爬虫 jupyter notebook numpy pandas sklearn 数据分析 数据挖掘
2023-03-09 10:46:03 1.57MB 爬虫 NLP kmeans 数据挖掘
1
原始数据处理并归一化后的数据 配套: 航空大数据——由ADS-B报文系统预测飞机坐标(飞行轨迹)(二) https://blog.csdn.net/qq_39291503/article/details/117742694
2023-03-08 09:03:07 539.88MB 大数据 信号处理 数据挖掘 数据分析
1
含代码,处理过数据文件,结果文件整理,以及详细报告近一万字。 这是我的期末大报告,完全是自己写的,可以按需下载。其中关于实现的过程描述方法详实,步骤详细,形式多样。数据来自Kaggle。 含有1. 绪论,2. 相关理论与技术,3. FP-growth算法关联规则分析算法,4. 结论5. 课程体会。 这次我的选题便是从关联规则视角出发,以使公司能够最大化下一次营销活动的利润为立足点,建立了基于FP-Growth的营销策略关联规则分析算法,并从宏观角度提出将营销活动与客户的个人特征与选择相结合的最大化下一次营销活动的利润营销策略。
2023-03-07 21:39:00 362KB 数据挖掘 FP-Growth 营销策略 关联规则
1
自然语言处理+2020年初微博数据(疫情相关)+适用于nlp、数据挖掘模型训练
2023-03-06 00:53:02 2.37MB 数据挖掘 NLP
1
数据挖掘 概念与技术(原书第3版)配套PPT(英文) CS 412 Intro. to Data Mining Jiawei Han, Computer Science, Univ. Illinois at Urbana-Champaign, 2106
2023-03-05 23:23:05 54.65MB 数据挖掘  ppt 原书第3版 概念与技术
1
房地产数字化转型.pdf
2023-03-05 14:50:59 8.57MB 数据分析 数据挖掘
1