使用非参数统计检验进行分析的指南

5月 22, 2020 火狐体育网址

使用非参数统计检验进行分析的指南

1980年代末,汉斯拉伊大学(Hansraj College)经济学荣誉毕业生的平均薪酬约为每年100万印度卢比。这一数字大大高于80年代初或90年代初毕业的人们。

他们平均水平如此之高的原因是什么呢?沙鲁克·汗是印度收入最高的名人之一,1988年毕业于汉萨拉吉学院,当时他在那里攻读经济学荣誉学位。

这一点,以及还有很多的例子都会告诉我们,平均并不是很好的可以指示出数据的中心在哪里。它可能会受到异常值的影响。在这种情况下,查看中位数是更好的选择。 它是一个很好的数据中心的指示器,因为一半数据位于中间值以下,另一半位于中间值上方。

到目前为止,一切都很好——我相信你已经看到人们早些时候提出了这一点。问题是没有人告诉你如何进行像假设检验这样的分析。

统计检验用于制定决策。为了使用中位数进行分析,我们需要使用非参数检验。非参数测试是分布独立的检验,而参数检验假设数据是正态分布的。说参数检验比非参数检验更加的臭名昭著是没有错的,但是前者没有考虑中位数,而后者则使用中位数来进行分析。

**注意:**本文假定你具有假设检验,参数检验,单尾检验和双尾检验的先决知识。

当总体参数的信息完全已知时使用参数检验,而当总体参数的信息没有或很少使用非参数检验,简单的说,参数检验假设数据是正态分布的。然而,非参数检验对数据没有任何分布。

但是参数是什么?参数不过是无法更改的总体特征。让我们看一个例子来更好地理解这一点。

看上面给出的公式,老师在计算总分时已经考虑了所有学生的分数。假设学生的分数是准确的,并且没有遗漏的分数,你是否可以更改学生的总分数?并不可以。因此,平均分被称为总体的一个参数,因为它不能被改变。

1.比赛的获胜者由决定,而名次是根据越过终点线来进行排名的。现在,第一个越过终点线的人排名第一,第二个越过终点线的人排名第二,依此类推。我们不知道获胜者是以多远的距离击败了另一个人,因此区别是未知的。

2.有20人接受了一个疗程的治疗,并且通过调查记录他们的症状。遵循治疗过程后,要求患者在5个类别中进行选择。调查看起来像这样:

现在,如果你仔细查看上述调查中的值可以发现,值是不可以扩展的,它是基于病人的经验来判断的。而且,评分是被分配的而不是被计算的。在这种情况下,参数检验无效。

3.检测极限是值通过给定的分析方法可以检测到的物质的最低数量,但是不一定要将其定量为精确值。例如,病毒载量就是你血液中的HIV含量。病毒载量可以超出检测极限,也可以更高的数量。

4.在上面的平均薪酬方案的例子中,沙鲁克的收入是一个离群值。什么是离群值?沙鲁克的收入与其他经济学专业毕业生的收入相距异常。因此,沙鲁克的收入在这里变得异常,因为它与数据中的其他值之间存在异常距离。

数据不遵循任何概率分布数据由顺序值或等级构成数据中有异常值数据具有检测极限这里要注意的一点是,如果存在一个针对问题的参数检验,则使用非参数检验将产生非常不准确的答案。

在上面的讨论中,你可能已经注意到,我提到了使用非参数测试可能有利或不利的几点,因此现在让我们共同来看一下这些点。

2.非参数检验的临界值表未包含在许多计算机软件包中,因此这些测试需要更多的手工计算。

现在你知道非参数检验对总体参数无所谓,因此它不对父级总体的均值、标准差等做出任何假设。这里的零假设是一般的,因为两个给定的总体是相等的。

假设:我的预测是Rahul会赢得比赛,另一个可能的结果是Rahul不会赢得比赛。这些都是我的假设。我的备择假设是Rahul将赢得比赛,因为我们将让备择假设等于我们想要证明的。零假设是相反的假设,通常零假设是没有差异的陈述。例如,

显著性水平:它是做出错误决定的可能性。在上述假设陈述中,零假设表示样本和总体均值之间没有差异。假设样本均值和总体均值之间没有差异时,拒绝零假设的风险为5%。这种拒绝零假设成立的风险或可能性称为显著性水平。

要了解什么是统计量,让我们看一个例子。一位老师计算了A部分学生的平均成绩,例如36分,她使用A部分学生的平均成绩来表示B,C和D部分学生的平均成绩。这里要注意的是,老师没有使用学生在所有部分中获得的总成绩,而是使用了A部分的平均成绩。在这里,平均成绩被称为统计信息,因为老师没有使用整个数据。

也称为曼惠特尼威尔科克森(Mann Whitney Wilcoxon)和威尔科克森和检验(Wilcoxon rank sum test),是独立样本t检验的一种替代方法。让我们通过一个例子来理解这一点。

一个制药组织创造了一种新的药物来治疗梦游,一个月后对5名患者进行了观察。另一组5人已经服用了旧药物一个月。然后,该组织要求个人记录上个月的梦游病例数。结果是:

理解这个问题了吗?我们来看看Mann Whitney U测试是如何工作的。我们很想知道服用不同药物的两组报告的梦游病例数是否相同。假设如下:

$$其中r1为第一组的秩和,r2为第二组的秩和,n1为第一组的大小,n2为第二组的大小。

秩是非参数检验的非常重要的组成部分,因此,学习如何为样本分配秩非常重要。让我们学习如何分配秩。

1.我们将两个样本合并,并按升序排列。我分别对旧药和新药使用OD和ND来代替。

但是请注意,数字1、4和8在组合样本中出现了多次。因此分配的秩是错误的。

联系基本上是一个样本中出现多次的数字。排序数据后,查看样本中数字1的位置。在这里,数字1出现在第一和第二位置。在这种情况下,我们取1和2的平均值(因为数字1出现在第一和第二位置),并将平均值分配给数字1,如下所示。我们对数字4和8遵循相同的步骤。这里的数字4出现在第5位和第6位上,它们的均值为5.5,因此我们将数字5.5分配给数字4。沿这些行计算数字8的等级。

当样本中存在联系时,我们分配,以确保每个大小为n的样本的秩和相同。因此,秩和将始终等于\frac{n(n+1)}{2}2n(n+1)2.下一步是计算组1和组2的秩和。

现在,我们使用临界值表来确定临界值(用p表示), 该值是从检验的显著性水平得出的一个点 ,用于拒绝或接受无效假设。在Mann Whitney U test中,检验标准为

U 临界值,因此,我们拒绝零假设,并得出结论,没有重要证据表明两组报告的梦游病例数目相同。

一位老师在课堂上教了一个新题,并决定在第二天进行突击测验。一共有6名学生接受了测试,满分为10分,第一次测试分数如下:

学生第一次测试第二次测试差异(第二次分数-第一次分数)188-4-166104

在上表中,在某些情况下,学生的得分比以前低,并且在某些情况下,学生4的进步相对较高。这可能是由于随机效应。我们将使用此测试分析差异是系统的还是偶然的。

下一步对差值的绝对值进行排序。请注意,只有在按升序排列数据后才能执行此操作。

在Wilcoxon sign-rank test中,我们需要符号,基本上是将与差异相关的符号分配给秩,如下所示。

假设可以是单侧的,也可以是双侧的,我使用单侧假设,使用5%的显著性水平。因此,α=0.05

在这里,如果W 1 与W 2 相似,那么我们接受零假设。否则,在中,如果差异反映出学生得分的提高,则我们拒绝原假设。

**在这里,W临界值= 2,因此我们接受零假设并得出结论,两个检验的分数之间没有显著差异。 **

在这里,W临界值= 2,因此我们接受零假设并得出结论,两个测试的标记之间没有显着差异。

该检验与Wilcoxon Sign-Rank Test相似,如果数据违反正态性假设,也可以用它代替配对t检验。我将使用在Wilcoxon Sign-Rank Test中使用的相同例子(假设它不遵循正态分布)来解释符号测试。

在Sign Test中,我们没有考虑大小,因此忽略了等级。假设与以前相同。

在这里,如果我们看到相同数量的正差和负差,则零假设成立。否则,如果我们看到更多的正号,则拒绝零假设。

在这里,+&–符号的较小数目= 2 临界值=6。因此,我们拒绝零假设,并得出结论,没有明显的证据表明中位数差为零。

当你处理两个以上的独立群体时,该测试是非常有用的,它可以比较k个群体的中位数。当数据违反了正态分布的假设并且样本量太小时,此测试可以替代单因素方差分析。注意:Kruskal-Wallis Test可用于连续和有序级别的因变量。

登革热患者分为3组,并给予三种不同类型的治疗。经过3天的疗程后,患者的血小板计数如下。

请注意,三种治疗的样本量不同,可以使用Kruskal-Wallis Test来解决。

H的值计算出来是6.0778,临界值为5.656。因此,我们拒绝零假设,并得出结论,没有重要证据表明这三个总体中位数相同。

注意:在Kruskal-Wallis Test中,如果有3个或更多独立的比较组,每组中有5个或更多观察值,则检验统计量H近似为k-1自由度的卡方分布。因此,在这种情况下,你可以在卡方分布表中找到检验的临界值作为临界值。

假如我去市场买了一条裙子,巧合的是,我的朋友从她附近的市场上买了同一条裙子,但她为此付出了更高的价钱。与我的朋友相比,我朋友家附近的市场更加昂贵。那么,地区会影响商品价格吗?如果确实如此,那么该地区与商品价格之间便存在联系。我们在这里使用斯皮尔曼等级相关性是因为它确定两个数据集之间是否存在相关性。

蔬菜的价格因地区而异。我们可以使用斯皮尔曼等级相关性来检查蔬菜价格和面积之间是否存在关系。这里的假设是:

在这里,趋势线表明蔬菜价格与面积之间呈正相关。但是,应使用斯皮尔曼等级相关性检查相关方向和强度。

斯皮尔曼等级相关性是皮尔逊相关系数的非参数替代,用Rs表示。Rs的取值范围(-1,1),其中

让我们通过一个例子来理解这些公式的应用。下表包括学生的数学和科学的的分数。

零假设表示标记之间没有关系,假设指出标记之间有关系。选择5%的显著性水平进行测试

现在计算和d,d是秩和n之间的差值,而n是样本大小=10。执行以下操作:

现在,使用该公式计算斯皮尔曼等级相关系数。因此,斯皮尔曼等级相关性为0.67,这表明在数学和科学测试中获得的学生排名之间呈正相关,这意味着你在数学中的排名越高,你在科学中的排名越高,反之亦然。

你也可以通过使用显著性水平和样本量确定临界值来检查此情况。拒绝或接受零假设的标准为:

当参数检验的假设被违反时,非参数检验将更强大,并且可以用于所有数据类型,例如标称,有序,区间以及数据具有离群值的情况。如果任何参数检验对问题是有效的,则使用非参数检验将给出非常不准确的结果。

Mann Whitney U Test用于检验两组独立组间的差异,分别为有序因变量和连续因变量

Wilcoxon sign rank test用于检验两个相关变量之间的差异,该差异考虑了差异的大小和方向,但是Sign检验忽略了大小,仅考虑了差异的方向。

Kruskal-Wallis Test通过使用中位数比较了两个以上独立组的结果。

Spearman Rank Correlation技术用于检查两个数据集之间是否存在关联,还可以说明关联的类型。

作者 yabo1152.com

发表评论

电子邮件地址不会被公开。 必填项已用*标注