图 6.19 四个多重比较检验的比较环 等价性检验 等价性检验试图确认均值之间并无差异,由于这是不可能的,因此您需要选择一个差阈值 (更小的差异被认为实际上是等效性)。要构建的最直接检验将使用差区间两侧的双单侧 t 检验。如果两个检验均被拒绝,表明这些组是等效的。等价性检验命令将会使用这种双单侧 检验 (TOST) 方法。 例如,假设您想知道男性与女性的高度差是否小于 6(使用大班.jmp 数据表)。在运行以 X 拟合 Y 命令(其中身高作为 Y 变量而性别作为 X 变量)之后,请选择等价性检验命令。在出 现的对话框中输入 6 作为差异的阈值,然后单击确定,则得到如图 6.20 所示的输出。 图 6.20 实际等效性输出 实际差异为 3.02,检验表明此差 p 值为 0.01。在上述的设定之下您可以断言本问题的 差异是 0。
2021-12-15 21:11:33 11.69MB 大数据 数据挖掘 数据分析 SAS
1
图 4.2“性能分析”对话框 所有性能分析均使用相同的公式。这些选项的不同点在于计算 sigma 的方法。这些 sigma 选 项可解释为: • 长项使用全部 sigma 并与 JMP 之前的默认输出相同。此选项用于 Ppk 统计量, sigma 的计 算公式如下: • 指定 Sigma 允许用户输入特定的已知 Sigma 以用于性能分析计算。显然, Sigma 是由用 户指定且尚未计算的值。此选项用于控制图表生成性能分析,其中用于图表的 Sigma 是 输入(对话框中)的指定 Sigma。 • 短项,按固定子组大小分组可用于使用以下公式计算 σ。在此情况下,如果 r 为子组数且 每个第 i 个子组均按数据顺序定义,则 sigma 的计算公式如下: σ xi x–( ) 2 n 1– -------------------- i 1= n ∑= σ xi. 2 ni ----- x.. 2 n i -----– i 1= n ∑ r 1– -----------------------------=
2021-12-15 20:59:15 11.69MB 大数据 数据挖掘 数据分析 SAS
1
R in action中文版及代码 《R in action》 是公认的R语言经典教材。跟着书上的代码仔细的敲一笔遍,你不需要全部看完这本书,只需要学会前8章左右就差不多了。 学完后你会对统计学有一个更深的认识~
2021-12-14 20:40:52 16.68MB 数据挖掘 数据分析
1
从安居客上爬取的二手房信息,格式是.xlsx,可以作为数据挖掘和分析的学习和教学案例数据。
1
数据挖掘课程一般会让学生做数据挖掘的课程作业,主要是使用WEKA来实现,这里提供了使用WEKA做数据分析的数据源,包括测试集和训练集
2021-12-06 20:17:38 139KB weka 数据挖掘 数据源
1
自己亲手全手打了一套系统的代码,帮助朋友完成设计,做了贵阳市几个区的房屋价格爬取以及数据清洗和可视化操作,代码细细道来: 原创文章 14获赞 142访问量 2万+ 关注 私信 展开阅读全文 作者:周小夏(cv调包侠)
2021-12-04 21:57:16 142KB 可视化 大数据 实战
1
用于数据分析,可视化
2021-11-30 09:04:10 297KB 数据挖掘 数据分析
1
数据挖掘:数据清洗——数据噪声处理 一、什么是数据噪声? 数据噪声(Noise):数据集中的干扰数据(对场景描述不准确的数据),即测量变量中的随机误差或方差。 二、噪声数据与离群点的区别 观测量(Measurement) = 真实数据(True Data) + 噪声 (Noise):而离群点(Outlier)属于观测量,既有可能是真实数据产生的,也有可能是噪声带来的,但是总的来说是和大部分观测量之间有明显不同的观测值。 数据噪声与离群点有很多相同的地方。之间没有太过明确的定义,主要看应用的场景。如在信用卡诈骗中,我们通常会关注那些少量的异常数据,此时数据是具有探索意义的。而在一般的场景下,离
2021-11-24 14:57:50 422KB 大数据 数据 数据挖掘
1
微软数据挖掘实例数据库2008版本,内有ldf和mdf文件,直接附加即可,用于数据仓库与数据挖掘实验
2021-11-21 18:27:39 8.97MB SQL Server 数据挖掘 数据仓库
1
这是web数据挖掘的数据集,需要的同学可以下载
2021-11-10 21:46:12 50KB web数据集 数据挖掘数据集
1