获取和清理数据 Coursera 项目 本自述文件描述了如何使用 run_analysis.R 脚本对 UCI HAR 数据集执行一些基本操作。 从链接解压缩数据并将解压缩的文件夹重命名为数据集。 run_analysis.R 文件应该放在数据集文件夹上一级的文件夹中。 将您的工作目录设置为 run_analysis.R 所在的文件夹和数据集文件夹。 使用 source("run_analysis.R") 运行脚本。 脚本创建 2 个文件。 第一个文件名为 final_data.txt 并包含合并的数据集。 文件 tidy_data.txt 包含 tidy 数据,其中包含所有变量中每个主题和每个活动的均值。 您可以使用 read.table("tidy_data.txt") 将整齐的数据读入 R。
2021-07-23 15:53:50 86KB R
1
数据科学 - 获取和清理数据课程项目 由于我在 John Hopkin 的在线数据科学课程中学习数据科学的旅程而创建了这个 repo 数据源 数据源可。 运行分析.R 该脚本由一个函数runAnalysis()组成,该函数执行以下操作: 合并训练集和测试集以创建一个数据集。 仅提取每个测量值的平均值和标准偏差的测量值。 使用描述性活动名称来命名数据集中的活动。 使用描述性变量名称适当地标记数据集。 根据步骤 4 中的数据集,创建第二个独立的 tidy 数据集,其中包含每个活动和每个主题的每个变量的平均值。 要运行脚本,请键入: source('run_analysis.R') runAnalysis() 输出: reading train data... reading test data... reading other required files.. mergi
2021-07-17 12:03:13 22KB R
1
数据清洗实战 非常详细的 英文原版教程 高清pdf SAS软件实现
2021-05-19 11:13:29 4.46MB 数据清洗
1
家居清洁机器人
2021-04-01 10:05:18 1KB
1
数据清洁与统计
2021-03-07 21:04:12 121KB JupyterNotebook
1