电子科技大学数据挖掘课程 第一次实验 认识数据与对数据进行预处理 实验报告
1
数据预处理从CSV文件导入数据,python源代码
2021-03-19 15:04:52 243B 数据预处理 python
使用集成学习模型xgboost、lightGBM、Catboost以及深度学习模型LSTM预测目标变量(因子),通过丰富的EDA、数据预处理、特征工程、特征选择、参数调优、模型对比分析、可视化分析(箱图、密度图、pair plot、)等步骤来进行整体的合理评估和分析。
时序数据数据预处理、特征提取代码。分段特征、统计特征、熵特征。时间序列.rar
1
python 快速合并同一文件夹下相同类型的文件,且可以以间隔距离采点合并
2021-03-10 14:08:35 856B python 数据预处理
1
数据仓库数据预处理
2021-03-09 14:11:56 7.75MB 数据仓库
1
高质量的决策依赖于高质量的数据,数据预处理是数据挖掘至关重要的环节.传统的数据预处理系统并不能很好的适用于大数据环境,企业现阶段主要使用Hadoop/Hive对海量数据进行预处理,但普遍存在耗时长、效率低、无交互等问题.提出了一种基于Spark的交互式数据预处理系统,系统提供一套通用的数据预处理组件,并支持组件的扩展,数据以电子表格的形式展现,系统记录用户的处理过程并支持撤销重做.本文从数据模型、数据预处理操作、交互式执行引擎以及交互式前端四个方面描述了系统架构.最后使用医疗脑卒中的真实数据对系统进行验证,实验结果表明,系统能够在大数据场景下满足交互式处理需求.
2021-03-07 22:11:57 765KB 大数据
1
gfzrnx.exe软件,《GFZRNX 1.07 Users Guide》gfzrnx使用方法,rinex格式批量转换的具体操作
2021-03-06 13:04:46 2.8MB gnss gfzrnx gnss格式转换 批量格式转换
1
tensorflow2.0 对实体命名识别的数据预处理 1
2021-03-04 08:47:46 1.86MB tensorflow2.0 bert NER
1
在常见的机器学习/深度学习项目里,数据准备占去整个分析管道的60%到80%。市场上有各种用于数据清洗和特征工程的编程语言、框架和工具。它们之间的功能有重叠,也各有权衡。数据整理是数据预处理的重要扩展。它最适合在可视化分析工具中使用,这能够避免分析流程被打断。可视化分析工具与开源数据科学组件之间,如R、Python、KNIME、RapidMiner互为补充。避免过多地使用组件能够加速数据科学项目。因此,在数据准备步骤中利用流式获取框架或流式分析产品会是一个不错的选择。机器学习和深度学习项目在大多数企业中变得越来越重要。一个完整的项目流程包括数据准备(datapreparation)、构建分析模型
1