新起点
卡方分布
2020-05-24 17:36:41

卡方分布(chi-square distribution, ²-distribution,或写作²分布)是概率论与统计学中常用的一种概率分布。k个独立的标准正态分布变量的平方和服从自由度为k的卡方分布。卡方分布是一种特殊的伽玛分布,是统计推断中应用最为广泛的概率分布之一,例如假设检验和置信区间的计算。

由卡方分布延伸出来皮尔森卡方检定常用于:

若个随机变量、……、是相互独立,符合标准正态分布的随机变量(数学期望为0、方差为1),则随机变量的平方和

被称为服从自由度为 的卡方分布,记作

可以在文章右上角的表中看到更多卡方分布的性质。

卡方分布的概率密度函数为:

其中x≥0,当x≤0时 f k ( x ) = 0 {\displaystyle f_{k}(x)=0} 的卡方变量的平均值是,方差是。卡方分布是伽玛分布的一个特例,它的熵为:

其中 ψ ( x ) {\displaystyle \psi (x)} 个随机变量、……、是相互独立,符合标准正态分布的随机变量,则它们与均值之间偏差的平方和

X = i = 1 k ( Z i Z ¯ ) 2 χ k 1 2 {\displaystyle X=\sum _{i=1}^{k}(Z_{i}-{\bar {Z}})^{2}\sim \chi _{k-1}^{2}}

其中均值

Z ¯ = 1 k i = 1 k Z i {\displaystyle {\bar {Z}}={\frac {1}{k}}\sum _{i=1}^{k}Z_{i}}

它的平方正比于自由度为1的卡方分布,即

n Z ¯ 2 χ 1 2 {\displaystyle n{\bar {Z}}^{2}\sim \chi _{1}^{2}}

p-value = 1- p_CDF.

χ2越大,p-value越小,则可信度越高。通常用p=0.05作为阈值,即95%的可信度。

常用的χ2与p-value表如下:

网站公告: