卡方分布以及单一族群变方相等性检定

发布时间:2020-06-21

浏览量:626

一、前言

统计学家 Karl Pearson 在 1990 年提出了卡方分布,基于卡方分布的重要统计方法主要用于计数型资料的分析,例如卡方适合度检定、同质性检定、McNemar 检定等等。今天要探讨的族群变异数检定也同样是以卡方分布为基础,但该检定的前提假设是母体为服从常态分布的连续型资料。

此检定用于当我们对母体变异数是否等于某个特定的值感兴趣时,例如我们已经知道女性大学生的体重服从常态分布,且变异数为 \(4\),当我们想要知道喝含糖饮料之后对女性大学生体重的变异程度,和一般女性大学生相比是否有增加,便可以用该检定。本篇主要介绍卡方分布的性质、查表方法以及族群变异数的检定,其余统计方法将在其他章节介绍。

二、卡方分布的性质

卡方分布为一连续型的机率分布,其机率密度函数 \((\mathrm{p.d.f.})\) 如下:

\(\displaystyle f(x)=\frac{e^{-\frac{1}{2}}x^{\frac{n}{2}-1}}{\Gamma\left(\frac{n}{2}\right)2^{\frac{n}{2}}}\),\(x>0\)、\(n>0\)

\(\Gamma()\) 为 gamma 函式,\(\Gamma(\alpha)\int\limits^{\infty}_0x^{\alpha-1}e^{-x}dx\),\(x>0\)

卡方分布有一个参数为自由度。今令 \(X\) 为一连续型随机变数,若 \(X\) 服从一自由度为 \(r\) 的卡方分布,则可表示为  \(X\sim\chi^2_{(r)}\)。卡方分布为一右偏歪 (skew to the right) 的分布,当其自由度越大时,其 \(\mathrm{p.d.f.}\) 的图形会渐渐趋于对称(见图一)。

卡方分布以及单一族群变方相等性检定

图一 自由度为 \(5,10,15,30,40\) 的卡方分布。(绘图者:赖薇云)

在做变异数检定的过程中,常会看到 \(\chi^2_{\alpha(r)}\) 这个符号,意思是 \(\chi^2_{\alpha(r)}\) 的第 \(100 (1-\alpha)\%\) 百分位数,即在自由度为 \(r\) 的卡方分布下, 所涵盖的右尾机率为 \(\alpha\)(见图二)。\(\chi^2_{\alpha(r)}\) 的值可经由查表而得,如何查表将在例题有详细的介绍。

卡方分布以及单一族群变方相等性检定

图二 \(\chi^2_{\alpha(r)}\) 的示意图。(绘图者:赖薇云)

卡方分布有几个重要的性质如下:

① 卡方分布的随机变数可由标準常态分布随机变数的平方产生,若一随机变数 \(Z\sim N(0,1)\),则 \(Z^2\sim\chi^2_{(1)}\)。

② 若 \(n\) 个互相独立的标準常态随机变数的平方相加,则相加后的平方和服从自由度为 \(n\) 的卡方分布,可表为 \(Z_i\sim N(0,1),~~i=1,2,\cdots,n\),则 \(Q=\sum^{n}_{i=1}Z^2_i\sim\chi^2_{(n)}\)。

③ 若 \(k\) 个互相独立的卡方分布的随机变数(数个随机变数的卡方分布分别有自己的自由度 \(r_1,r_2,\cdots,r_k\))相加后所得的数值也会服从一卡方分布,自由度为数个独立随机变数所属的卡方分布自由度的总合。可表示为 \(Q_i\sim\chi^2_{(r_i)},~~i=1,2\cdots,k\),若 \(Q_i\) 互相独立,则 \(\sum^{k}_{i=1} Q_i\sim\chi^2_{(a)}\),\(a=\sum^k_{i=1}r_i\)。

三、母体变异数 \(\sigma^2\) 的估计和检定

假设今天有一服从 \(N(\mu,\sigma^2)\) 的族群,\(\mu,\sigma^2\) 均未知,若是今天我们想要估计 \(\sigma^2\),我们可以由该常态族群随机抽样 \(n\) 个互相独立的样本 \(y_1,y_2,\cdots,y_n\),并计算其样本平均值及样本变异数,表为 \( \overline{Y}\) 及 \(S^2\) \((\overline{Y}=\frac{\sum^{n}_{i=1}y_i}{n},~S^2=\frac{\sum^n_{i=1}(y_i-\overline{Y})^2}{n-1})\),样本变异数 \(S^2\) 即为族群变异数 \(\sigma^2\) 的无偏估式注1。

现在我们来谈谈族群变异数的检定,我们若是想要了解母体变异数是否等于某个特定的值,可以利用以下步骤进行假设检定注2。

该假设检定的虚无假说为:

\(H_0:\sigma^2=\sigma_0^2\)

其中 \(\sigma^2_0\) 为研究者自行定义的固定常数。

对立假说则可依情况分为下列三种:

\(H_a:\sigma^2>\sigma_0^2\)

\(H_a:\sigma^2<\sigma_0^2\)

\(H_a:\sigma^2\ne\sigma_0^2\)

在 \(H_0\) 成立的情况下,检定统计量 \(\chi^2\) 会服从自由度为 \(n-1\) 的卡方分布

\(\displaystyle \chi^2=\frac{(n-1)S^2}{\sigma^2_0}\sim \chi^2_{(n-1)}\)

将显着水準订定为 \(\alpha\),则上述三种假设检定的弃却域为:

\(\chi^2\ge \chi^2_{\alpha(n-1)}\)

\(\chi^2\le \chi^2_{1-\alpha(n-1)}\)

\(\chi^2\le \chi^2_{1-\frac{\alpha}{2}(n-1)}\)   or   \(\chi^2\ge \chi^2_{\frac{\alpha}{2}(n-1)}\)

当计算出来的检定统计量 \(\chi^2\) 落入弃却域时,在显着水準为 \(\alpha\) 的情况下,我们弃却虚无假说。

看了那幺多公式,现在我们来看一个实际例子以便了解:

例:小薇今天做了实验,想要了解老鼠在餵食减肥药品之后的体重变异程度是否较正常老鼠的体重变异程度大。假设今天正常老鼠的体重呈常态分布,变异数为 \(2\),今检验 \(10\) 只餵食减肥药品后的老鼠体重,经计算得样本变异数 \(S^2\) 为 \(9\)。

虚无假说为:

\(H_0:\sigma^2=2\)

对立假说为:

\(H_0:\sigma^2>2\)

订定显着水準为 \(\alpha= 0.05\),该检定的弃却域为:

\(\chi^2\ge \chi^2_{0.05(10-1)}=16.92\)

\(\chi^2_{0.05(10-1)}\) 可由查表而得,在后面有做详细介绍。

检定统计量 \(\chi^2\) 为:

\(\displaystyle\chi^2=\frac{(n-1)S^2}{\sigma^2_0}=\frac{9\times 9}{2^2}=20.25\)

经计算后检定统计量 \(\chi^2\) 落入弃却域,因此在 \(\alpha=0.05\) 的情况下,老鼠在餵食减肥药品之后的体重变异程度较正常老鼠的体重变异程度大。

以 \(\chi^2_{0.05(10-1)}\) 为例介绍如何查表:

根据前述定义,\(\chi^2_{0.05(10-1)}\) 表在自由度为 \(9\) 的卡方分布下,其所涵盖的右尾机率为 \(0.05\)。我们可以藉由下表查得 \(\chi^2_{0.05(10-1)}\)。在表中,栏位 \(P\) 所指的是其所涵盖的右尾面积,在此我们应选 \(0.05\)(红色框起来的部分),而列则代表自由度,在此我们应选 \(9\) (蓝色框起来的部分)。

因此我们便可知道 \(\chi^2_{0.05(10-1)}\) 的值为 \(16.919\)。

卡方分布以及单一族群变方相等性检定

表一 卡方分布表(资料来源

注1、样本变异数的无偏估式请参考《母体变异数v.s.样本变异数》

注2、进行假说检定的详细步骤请参考《假设检定》


参考文献


相关推荐

头脑现实科技|十大网络|视界十大|网站地图 三牛注册平台_sunbet心水博 银河澳门娱乐平台5144_明升国际注册账号 2020下载app送38元彩金_ag8手机登陆 菲赢国际怎么注册注册_三牛娱乐平台app下载 亿发国际ibb下载_万和娱乐官网 t6国际注册_恒峰娱乐下载平台 金沙3983www_兴发娱乐游戏乐 万利彩lottery注册_凯时注册准认来就送38 金海渔下载_星耀娱乐下载链接 澳门新葡亰0066_龙8娱乐官方老虎机