【x检验的计算公式】在统计学中,x²检验(卡方检验)是一种常用的假设检验方法,用于判断实际观测值与理论期望值之间的差异是否具有统计学意义。它常用于分类数据的分析,如列联表、独立性检验或拟合优度检验等。
为了更好地理解x²检验的计算过程,以下是对该检验公式的总结,并通过表格形式展示关键步骤和内容。
一、x²检验的基本原理
x²检验的核心思想是:通过比较观察频数(O)与期望频数(E)之间的差异,计算出一个x²统计量,再根据x²分布表判断该差异是否显著。
公式如下:
$$
\chi^2 = \sum \frac{(O - E)^2}{E}
$$
其中:
- $ O $ 表示实际观察到的频数;
- $ E $ 表示在原假设下预期的频数;
- $ \sum $ 表示对所有单元格进行求和。
二、x²检验的计算步骤
步骤 | 内容说明 |
1 | 收集并整理数据,形成列联表或频数表 |
2 | 计算每个单元格的期望频数 $ E = \frac{行合计 \times 列合计}{总样本数} $ |
3 | 计算每个单元格的 $ (O - E)^2 / E $ 值 |
4 | 将所有单元格的 $ (O - E)^2 / E $ 相加,得到 x² 统计量 |
5 | 根据自由度(df)查找 x² 分布表,确定临界值或 p 值 |
6 | 根据结果判断是否拒绝原假设 |
三、示例说明(以独立性检验为例)
假设我们有如下列联表:
类别A | 类别B | 合计 | |
男性 | 30 | 20 | 50 |
女性 | 25 | 25 | 50 |
合计 | 55 | 45 | 100 |
计算每个单元格的期望频数:
- 男性+类别A: $ \frac{50 \times 55}{100} = 27.5 $
- 男性+类别B: $ \frac{50 \times 45}{100} = 22.5 $
- 女性+类别A: $ \frac{50 \times 55}{100} = 27.5 $
- 女性+类别B: $ \frac{50 \times 45}{100} = 22.5 $
然后计算每个单元格的 $ (O - E)^2 / E $:
单元格 | O | E | $ (O - E)^2 / E $ |
男性+类别A | 30 | 27.5 | $ (2.5)^2 / 27.5 ≈ 0.227 $ |
男性+类别B | 20 | 22.5 | $ (-2.5)^2 / 22.5 ≈ 0.278 $ |
女性+类别A | 25 | 27.5 | $ (-2.5)^2 / 27.5 ≈ 0.227 $ |
女性+类别B | 25 | 22.5 | $ (2.5)^2 / 22.5 ≈ 0.278 $ |
将这些值相加:
$$
\chi^2 = 0.227 + 0.278 + 0.227 + 0.278 = 1.01
$$
查 x² 分布表,自由度为 $ (2-1)(2-1) = 1 $,若显著性水平为 0.05,则临界值为 3.841。由于 1.01 < 3.841,因此不能拒绝原假设,即性别与类别之间无显著关联。
四、总结
x²检验是一种基于频数差异的非参数检验方法,适用于分类变量的数据分析。其核心公式为:
$$
\chi^2 = \sum \frac{(O - E)^2}{E}
$$
通过计算观察频数与期望频数的差异平方除以期望频数,最终得到一个x²统计量,并与临界值对比,从而判断数据是否符合原假设。
如需进一步了解不同类型的x²检验(如拟合优度检验、独立性检验、同质性检验等),可参考相关统计学教材或工具书。