【非参数假设检验】 非参数假设检验题目

时间:2021-11-14 10:43:13 浏览量:

篇一:实验八 非参数假设检验

实验八 非参数假设检验

? 单样本非参数检验

? 两个独立样本非参数检验

? 多个独立样本非参数检验

? 两个配对样本非参数检验

? 多个配对样本非参数检验

一、 单样本非参数检验

选择:分析Analyze==>非参数检验Nonparametric Tests ==>……

1、基本功能

对单个总体的分布形态进行推断的方法。

其中方法包括:卡方检验、二项分布检验、K-S检验以及变量值随机性检验等。

2、方法简介

2.1 卡方检验

? 卡方检验可以进行拟合优度的检验,即可以根据样本数据,推断

总体分布与期望分布或某一理论分布是否存在显著差异,可检验样本是否服从正态、均匀、 Poisson等分布。

卡方检验是一种吻合性检验,通常适用于多项分类值总体分布的分析。

? 零假设H0:样本来自的总体分布与期望分布或某一理论分布无显

著差异。

? 操作步骤

1、选择分析Analyze==>非参数检验Nonparametric Tests ==>χ检验Chi-Square;2

2、将待检验的变量选择到Test Variable 框;

3、在Expected Range框选项中确定参与分析的样本范围,其中Get from data表示所有样本都参与分析;
Use Specified Range表示只有在取值范围内的样本才参与分析;

4、在Expected Values框中给出各个pi值,其中All categories equal表示所有子集的pi都相同,即期望分布为均匀分布;
Value框后可依次输入pi值,并可单击进行增加、修改和删除。

2.2 二项分布检验

? 二项分布检验是要通过样本数据检验样本来自的总体是否服从指

定的概率值为p的二项分布。

? 零假设H0:样本来自的总体与指定的二项分布无显著差异。

? 操作步骤

1、选择分析Analyze==>非参数检验Nonparametric Tests ==>二项式Binomial;

2、将待检验的变量选择到Test Variable List框;

3、在Define Dichotomy框中指定如何分类,如果检验变量为二值变量,则选Get from data选项;
如果检验变量不是二值变量,则可在Cut Point框后输入具体数值,小于等于该值的观察值为第一组,大于该值的为第二组;

4、在Test框中输入二项分布的检验概率值p。

至此,SPSS将自动将第一组作为检验类,检验该类出现的概率是否与输入的检验概率值存在显著差异

2.3 单样本K-S检验

? 单样本K-S检验是以俄罗斯数学家柯尔莫哥洛夫和斯米尔诺夫命名的一种非参数检验方法。是一种拟合优度性检验。

? 该方法利用样本数据推断样本来自的总体是否服从某一理论分布,这种检验可以确定是否有理由认为样本的观察结果来自该理论分布的总体。

? 适用于探索连续型随机变量的分布。

? 零假设H0:样本来自的总体分布与指定的理论分布无显著差异 ? SPSS的理论分布主要包括:正态分布、均匀分布、指数分布和泊松分布。

? 操作步骤

1、选择分析Analyze==>非参数检验Nonparametric Tests ==>单样本K-S检验1-Sample K-S;

2、将待检验的变量选择到Test Variable List框;

3、在Test Distribution框中选择理论分布,其中Normal为正态分布,Uniform为均匀分布,Poisson为泊松分布,Exponential为指数分布。

至此,SPSS将自动计算K-S检验统计量和对应的概率p值,并将结果显示到输出窗口中。

2.4 变量值随机性检验

? 变量值随机性检验通过对样本变量值的分析,实现对总体变量值出现是否随机进行检验。也称为游程检验。

? 零假设H0:总体变量值出现是随机的。

? 操作步骤

1、选择分析Analyze==>非参数检验Nonparametric Tests ==>游程检验Runs;

2、将待检验的变量选择到Test Variable List框;

3、在Cut Point框中确定计算游程数的分界值,其中Median表示以样本中位数为分界值;
Mode表示以样本众数为分界值, Mean表示以样本均值为分界值, Custom表示以用户输入的值为分界值。SPSS将小于该分界值作为一组,将大于或等于该分界值得所有变量值作为另一组,然后计算游程数。

至此,SPSS将自动计算游程数、检验统计量和对应的概率p值,并将结果显示到输出窗口中。

二、 两独立样本非参数检验

选择:分析Analyze==>非参数检验Nonparametric Tests ==>两独立样本检验2 Independent Samples

1、基本功能

对两独立样本是否具有相同的分布进行推断的方法。

其中方法包括:曼-惠特尼U检验、K-S检验、W-W游程检验和极端反应等等。

2、方法简介

零假设H0:两组独立样本来自的两总体分布无显著差异;

2.1曼-惠特尼U检验

? 曼-惠特尼U检验可通过对两组样本平均秩的研究来实现推断;

? 秩简单说就是变量值排序的名次;

2.2 两独立样本的K-S检验

? 与单样本K-S检验的基本思路大体一致,主要差别在于:这里是

以变量值的秩作为分析对象,而非变量值本身。

2.3 两独立样本的游程检验

? 与单样本K-S检验的基本思路大体一致,不同的是计算游程数的

方法。两独立样本的游程检验中,游程数依赖于秩。

2.4 两独立样本的极端反应检验(Moses Extreme Reactions) ?极端反应检验的基本思想是,将一组样本作为控制样本,另一组样本作为实验样本。以控制样本作为对照,检验实验样本相对于控制样本是否出现了极端反应。

? 如果实验样本没有出现极端反应,则认为两总体分布无显著差异;

? 相反,如果实验样本存在极端反应,则认为两总体分布存在显著

差异。

3、操作步骤

准备工作:设置两个变量,一个变量存放样本值,另一个存放组标记值。

1、选择分析Analyze==>非参数检验Nonparametric Tests ==>两独立样本检验2 Independent Samples;

2、将待检验的变量选择到Test Variable List框;

篇二:实验报告2——基于SPSS的假设检验、方差分析、非参数检验

中央财经大学

实 验 报 告

实验项目名称 假设检验、方差分析、非参数检验 所属课程名称 统计学 实 验 类 型 型、综合型实验实 验 日 期

成 绩

实 验 报 告

数据准备。从500个人中随机抽取大约30%。

1、用SPSS Statistics软件进行参数估计和假设检验。(以下假设检验中限制性水平设为5%)

(1)计算总体中上月平均工资95%的置信区间(分析?描述统计?探索)。

下表为SPSS软件进行对“平均工资”变量进行描述统计分析所得。从表中可以直接得

(2)检验能否认为总体中上月平均工资等于2000元。(单个样本t检验)

根据题目要求,这里采用双侧假设。零假设和备择假设为:H0=2000,H1≠

2000。

由上表得,p=0.000<0.05=α,所以,拒绝原假设,即可以认为中体中上月平均工资不等于2000元

(3)检验能否认为男生的平均工资大于女生。(两个独立样本t检验)

检验的零假设和备择假设为:
H0:男生的平均工资不大于女生 H1:男生的平均工资大于女生

如上表所示,方差检验的p值等于0.092>0.05,因此不拒绝方差相等的原假设,认为男女平均工资的方差相等。所以t检验选取方差相等的一列,其中双侧检验的p值为0.000,因此右侧检验的p值为0.000/2=0.000<0.05(显著性水平),所以拒绝原假设,因此认为男生的平均工资大于女生。

(4)一些学者认为,由于经济不景气,学生的平均工资今年和去年相比没有显著提高。检验这一假说。(匹配样本t检验)。

H0:μ1-μ2≤0;
H1:μ1>μ2 双侧检验的p值为0.932,,因此右侧检验为0.466>0.05。所以不拒绝原假设,即学生的平均工资今年和去年相比没有显著提高

2、方差分析。

(1)使用单因素方差分析的方法检验:能否认为不同学科的上月平均工资相等。如果不能认为全相等,请做多重比较。

H0:不同学科的上月平均工资相等;
H1:不同学科的上月平均工资不全相等。

由上表得,P值为0.945>0.05,因此拒绝零假设,即不同学科的上月平均工资不全相等。所以再进行多重比较:

H0:两类差异不显著;

H1:两类差异显著

由上表得,经济类和管理类:p=0.738>0.05;
经济类和其他类:p=0.878>0.05;

管理类和其他类:p=0.858>0.05。因此拒绝原假设,任意两类差异都是显著的。

(2)在方差分析中同时考虑学科和性别因素,用双因素方差分析模型分析学科和性别对上月平均工资的影响。

篇三:参数假设检验

3.2 参数假设检验

假设检验与参数股估计都属于统计推断的范畴,但它们的提法是不同的,处理问题的方法也各具特色.我们看下面的例子:

“某班语文课教学采用研讨式方法后,对其中10名同学测验,平均成绩为85分.已知这个班过去测验成绩服从正态分布,其均值保持在82分左右,这意味着总体参数?是给定的,那么现在问采用研讨式方法后,其平均成绩是否和原来一致?”显然这不是估计问题.如果我们假设和原来一致,则需要判断这种假设对不对?如果对,对的把握性有多大?如果不对,那么平均成绩比原来是增加还是减少?当然,我们不能只看到85分高于82分就认为比原来高了,这是因为抽取样本时受到随机因素的干扰,我们不能以样本参数对总体参数进行单纯比较而简单的下结论.

这个例子所反映问题的一般提法是:总体分布已知,对总体参数的取值作一假设,用统计理论来判断这一假设正确与否,统计学上称此为参数假设检验.

“某地6岁男童的身高是一个总体,那么这个总体确切的理论分布是什么?”由样本数据绘制直方图,如果图形呈现中间高,两头低,对称,我们可以认为这个总体是近似于正态分布的.如果我们假设这个总体服从正态分布,根据样本信息来判断这样个假设正确与否,这就是所谓非参数检验.简单的说,参数假设检验是检验未知参数的假设成立与否, 非参数检验是检验未知总体分布的假设成立与否.

一、假设检验的概念

1. 假设

假设可以看作为一种设想,看法或假定,假设分为参数假设和非参数假设.

参数假设指总体分布已知,关于未知参数的假设,研究中用的最多的是已知总体服从正态分布,对总体均值?,总体方差?2做出假设.

例如,某校学生期末语文成绩X~N??,?2?,方差?2在原有状况下不变,而均值?在过去常规教学下为82分.为了提高教学质量,采用新的教学法后抽测10名同学,其平均成绩为85分,这时我们提出总体均值?为82分的假设,记为

H0:??82

称H0为原假设或零假设,相对于H0,还要给出一个备选假设,记为

H1:??82

对这个例子我们不提?小于82这样的假设,这是因为这样的假设是没有根据的,原因在于样本均值85大于82.

非参数假设包括的范围很广,可以说,一个假设如果不是参数假设就称为非参数假设, 非参数假设一般指关于总体分布的假设.

例如,某地6岁男童的身高X为一总体,若给出样本数据,基本呈现正态性,我们提出假设

H0:X~正态分布,

H1:X为非正态分布.

如果肯定H0,自然就否定H1.

2. 假设检验

对于一个假设,我们关心的是”假设”是否成立.判断假设成立与否的方法叫假设检验,最简单的检验是显著性检验.所谓显著性检验是指只对一个假设H0进行检验.例如,已知X~N??,1?,对H0:??0进行检验而不是提出备选假设

H1:??0.尽管没有提出H1,但我们可以认为H1:??0,这样备选假设就没有

必要明确提出来了,本章将集中讨论显著性检验方法.

无论"假设"的类型多么复杂,进行检验的基本思想却是很简单的.为此,我们先讨论一个为人们所接受的,否合客观规律的原理—小概率原理.

3. 小概率原理(实际推断原理)

首先明确什么叫小概率事件,顾名思义,概率很小的事件叫小概率事件. 概率小到何种程度才算小?这是一个相对概念,一般统计学中,概率值如低于0.01,0.05或0.10,0.25则认为小,把这些值统一记为?,称为显著性水平.在区间估计中我们已经看到,那里的?称为置信水平.

例如,从10万张奖票中买一张中头奖(设10万张奖票中只有一个头奖),这个事件发生的概率只有十万分之一,当然是小概率事件.乘一次飞机发生事故,这也是一个小概率事件.不知其号码锁号码,拨一次就能把锁打开这同样是一个小概率事件.

所谓小概率原理是说:小概率事件在一次试验是实际上不可能发生的,同样,大概率事件在一次试验中是实际上必然发生的.这个原理是客观存在的,我们可以做这样的设想,如果小概率事件在一次试验中发生,那么买一张奖票就能中头奖,坐一次飞机必定会发生事故,比一次号码就能把锁打开,显然这是不切合实际的.

我们再看一个例子来说明实际推断原理在假设检验中所起的作用:
“箱中有白、黑球共100个,设H0:其中有99个白球.如果H0是对的,则

从箱中任取一球为黑球(记为事件A)的概率只有1/100.”显然A是一个小概率事件,而根据实际推断原理,抽一个球是黑球实际上是不可能发生的,如果从箱中抽一个球恰好是黑球,说明小概率事件发生了,这样,自然要怀疑H0的正确

性,也就是说有很大的可能H0是不对的,这时就要做出否定H0的结论.那么作

出这样的结论是完全正确的吗?回答是未必的,这是因为小概率事件本来就有可能发生,只是发生的可能性很小而已.如果H0成立,那么箱中有一个黑球,当然

就有可能抽一次球正好抽到黑球.同样的道理,10万张奖票中尽管只有一个头奖,但总有一个“走运”的人得到头奖,坐一次飞机发生事故的可能性很小,但总有一个“倒霉”的人在某次乘机中丧生.

通过以上分析,想通过一次试验来否定H0而要完全正确是不可能的,也就

是说在检验中要允许犯错误,才能通过次试验来否定H0或接受H0.当然我们要

求犯错误的概率尽可能小,至于小到什么程度,怎样确定这个概率,我们在下一节讨论.但这里如果?给定,我们可以说否定H0,有?的可能性犯错误,有1??

的可能性是正确的.上例中??0.01,那么如果否定H0,犯错误的可能性只有

0.01.

一个检验允许犯错误,但错误的性质一般是不同的,这需要我们区分错误的不同类型,从而针对不同的后果确定犯错误可能性的大小.

4. 两类错误

统计学上有两类错误:

第一类错误是, H0符合实际情况,但检验结果却否定了H0,称为"弃真",记

其概率为

P(否定H0/H0为真)??.

实际上,显著性水平?就是犯第一类错误的概率, ?取的越大,发生否定H0的可能性就越大.

通俗的理解第一类错误,即把”对”说成”不对”,把"真"说成”假”.

第二类错误是, H0不符合实际情况,但检验结果却肯定了H0,称为”取

伪”,”伪”即为”假”的意思, 记其概率为

P(接受H0/H0为假)??.

犯这两类错误的后果通常是不一样的,例如,我们检验某人是否患某种疾病,若设H0:该人患有此种疾病,则第二类错误(无病当作有病)造成由于使用不必

要的药物而引起该人的痛苦和经济上的损失,但第一类错误(有病当作无病)就有可能使该人延误病情而发生意外.可见犯第一类错误的后果较第二类错误的后果严重.又如检验一批降落伞的质量,设H0:这批伞质量合格,则第二类错误(次

品当正品)会导致使用降落伞的人出现生命危险,而第一类错误(正品当次品)至多报废一部分产品造成一些经济上的损失,可见犯第二类错误的后果较第一类错误的后果严重,也就是说宁愿犯第一类错误也不犯第二类错误.当然我们希望所做出的检验使犯这两类错误的可能性尽可能小,最好全为零,但实际上这是不可能的,当样本数据取定后,犯这两类错误的概率不能同时被控制.对一定样本容量n,一般来说,?减小,?则增大,?减小, ?则增大.同时,对于固定的?,适当增加样本容量n可以减小?.

通常情况下,样本容量n如果固定,需要平衡两类错误的后果,如第一类错误后果严重,则显著性水平?取的小一些.一般,?取为0.05或0.01,而n不能太小,最好大于10.

综上,我们要检验一个假设成立与否,先给出假设H0,然后在此假设成立

条件下,借助于统计量的概率分布,选择一个合适水平?,找出一个小概率事件A,再抽取一组样本数据,如果A发生,则出现矛盾,违反实际推断原理,矛盾的来源在于原假设,这是我们做出否定H0的结论,但可能犯错误,而犯错误的


《》 相关热词搜索: [db:gjc]