χ2乗分布、χ2乗検定とは? χ2乗(カイにじょう)の一番わかりやすい説明

χ2乗とは何でしょうか?χ2乗分布、χ2乗検定とは? χ2乗(カイにじょう)に関して一番わかりやすく解説。

χ2乗検定とは、χ2乗分布に従う検定統計量に関するいくつかの検定方法の総称です。まずはχ2乗分布とは何かから押さえておく必要があります。

χ2乗分布とは

χ2乗分布の定義(数式)は別の解説に譲るとして、一番馴染みやすい言い方をすれば、χ2乗分布(chi-square distribution)とは、標準正規分布N(0,1)から標本をいくつか取り出したときに、それらの標本の各々の値のの2乗を足し合わせた合計値が従う分布になります(これは、定義から導かれる定理)。

少し堅い言い方で言い直せば、標準正規分布N(0,1)に従う独立な確率変数Z1,Z2,…, Znがあったときに、それら確率変数の2乗和

S^2=Z1^2 + Z2^2 + … + Zn^2

が従う分布のことです。この分布を自由度nのχ(かい)2乗分布と呼び、χ2nと書きます。

  1. Step1. 基礎編22. 母分散の区間推定 22-1. カイ二乗分布  BellCurve 統計WEB
  2. 稲垣宣生 数理統計学 1990年11月20日 裳華房 106ページ 6.3 正規分布から誘導される分布

χ(かい)2乗分布は、標準正規分布から数学的に導かれます。様々な分布は互いに関連しているので、どの分布からどの分布が導かれるのかを押さえておくと、数学的な理解の見通しが良くなると思います。

ベルヌーイ分布B(1,p) → 二項分布B(n、p) → 正規分布N(μ、σ^2) → 標準正規分布N(0,1) → χ2乗分布χ2(n) →F分布 F(n1, n2)

また、

二項分布B(n、p) → ポワソン分布P(m)

二項分布B(n、p) ←→ 超幾何分布H(n,p,N)

ポワソン分布P(m)→ 正規分布N(μ、σ^2)

正規分布N(0,1) および χ2乗分布χ2(n) → t分布t(n)

F分布 F(n1, n2) ←→  t分布t(n)

t分布t(n) → 標準正規分布N(0,1)

  1. 宮川公男 基本統計学 第5版 2022年4月1日 有斐閣 212ページ 図7.15 いろいろな確率分布と標本分布の間の関係

χ2乗検定とは

χ2乗分布に従う統計量の検定が、χ2乗検定と呼ばれ、いくつかの種類があります。

9.4 分散の検定ーーーχ2分布の応用 269ページ~

9.5 適合度の検定ーーーχ2分布の応用 270ページ~

9.6 分割表の検定ーーーχ2分布の応用 272ページ~

宮川公男『基本統計学 第5版』有斐閣

χ2乗検定を用いた独立性の検定

単にχ2乗検定というと、「χ2乗検定を用いた独立性の検定」(分割表クロス集計表ともいう)の検定)を指すことが多いようです。その場合は、検定したい内容は「フィッシャーの正確確率検定」と全く同じです。

関連記事:フィッシャーの正確検定(Fisher’s exact test)とは

χ2乗検定とフィッシャーの正確確率検定との使い分けですが、得られたデータの数値の期待度数(下記参照)が5以下のものが含まれている場合にはχ2乗検定では正確ではないため、フィッシャーの正確確率検定が使われます。

さて、カイ二乗検定による独立性の検定(分割表の検定)の説明で、一番わかりやすいと自分が思ったのは『基礎医学統計学』(加納、高橋 共著 南江堂)(改訂第6版 69ページ~)です。

この教科書の説明に則ってカイ二乗検定をわかりやすく説明すると以下のようになります。

2x2の分割表があったときに、それぞれのセルの「期待度数」を考えます。行と列が独立であれば、単純な掛け算になります。

Σ (セルの値ーそのセルの期待度数)^2 / そのセルの期待度数  という統計量が、カイ2乗分布に従うことから、この統計量がどれくらい生じやすいかを調べることにより、行と列が独立(これが帰無仮説)だったかどうかを判断しようというわけです。これがカイ二乗検定の考え方になります。自由度は、列の数だけあるセルの合計したものを固定して考えるので、列の数ー1、行に関し得も同様に、行の数ー1の自由度があります。そのため、R行xC列の場合は、その組み合わせで(R-1)x(C-1)が自由度になります。

  1. 25-5. 独立性の検定 統計WEB
  2. カイ二乗検定とは?検定手法を解説 2023年08月10日 GMOリサーチ t検定は平均値の差に意味があるのかを検定するもので、カイ二乗検定は割合の差に意味があるのかを検定するもの

適合度の検定

例えば100回何かを観測したときに、その観測値がある既知の分布(正規分布など)に従うかどうかを検定します。観測値から標本平均と標本標準偏差(不偏標準偏差とも呼ばれる。nでなくn-1で割ったほう)を求めて、

(標本平均-標本標準偏差)未満

(標本平均-標本標準偏差)から標本平均の間

標本平均から(標本平均+標本標準偏差)までの間

(標本平均+標本標準偏差)より上

の4つの区間を考えますと、それぞれの区間に標本が観察される確率は、16%、34%、34%、16%になります。100回分の観測値のそれぞれの区間での数(度数と呼ぶ)が15個、30個、38個、17個だったとします。ここで

Σ(観測された度数-期待される度数)^2 / 期待される度数

という統計量(この式により値が一つ定まる)がχ2と呼ばれるもので、文字通りχ2分布に従います。

  1. 尾畑伸明 数理統計学の基礎 230ページ 定理8.19 証明は省略する。
  2. 日本統計学会編 統計検定1級対応  統計学 269ページ ピアソンはクロス表のデータに関して(O-E)法という方法を編み出した。
  3. Chapter 56 – Karl Pearson, paper on the chi square goodness of fit test (1900). M.E. Magnello Landmark Writings in Western Mathematics 1640-1940 2005, Pages 724-731 This technique is “chi-square contingency coefficient” to test differences between observed cell frequencies and theoretically expected cell frequencies.

今の場合自由度3(区間の数-1)のχ2乗分布に従います。よってχ2乗分布の表を参照すると、それがどれくらい起こりやすいのか起こりにくいのかの確率がわかります。

区間をどうわけるかは自由ですが、度数が少なすぎる(5未満)にならないようにします。また区間の数は4以上にします。つまり、5x4=20で、最低でも20回以上の観察をした場合でないと、そもそもカイ2乗検定はできません。

今の例は正規分布でしたが、実際には既知の分布であれば何でも構いません。その観測で得られる値がどんな分布に従いそうかが分かっていることが大事です。

  1. J. R. Taylor 計測における誤差解析入門 2000年3月16日 東京化学同人 264ページ  12.分布に対するカイ二乗検定
  2. 統計WEB BellCurve Step1. 基礎編25. さまざまな検定 25-4. 適合度の検定
  3. 調査・統計用語集 カイ二乗検定 日経リサーチ
  4. 適合度検定とは?カイ二乗検定を使う理由や独立性の検定との違いを解説! いちばんやさしい、医療統計 適合度検定とカイ二乗検定(独立性の検定)の計算方法はほとんど同じです。唯一違うのは、理論値の定め方だけです。適合度検定の理論値→事前に決めた値 独立性の検定の理論値→2群の差がないと仮定した時の値

χ2乗検定における95%信頼区間の求め方

95%信頼区間の求め方は、検定の種類によらず同じ考え方でできます。ある検定統計量(検定するためにつくった統計量)とその検定統計量が従う確率分布(t分布やχ2乗分布、正規分布など)があったときに、95%を含む区間(両端で2.5%を含む区間)の境界の値(a, b)をまず知る必要があります(t分布や分布が左右対称だったのに対して、χ2乗分布は左右対称ではないという違いがありますが、本質的ではありません)。そうすれば、

a≦検定統計量≦b という式が立ち、検定統計量の式の中に自分が知りたい値が未知数として一つだけ存在しているので、それについてこの不等式を解けば

下限値≦未知の数≦上限値

として求まります。

カイ二乗検定に関する参考サイト

  1. 独立性の検定―最もポピュラーなカイ二乗検定 2017/08/13 統計WEB BellCurve
  2. 25-5. 独立性の検定 統計WEB BellCurve
  3. カイ二乗検定 日経リサーチ

ウェブ統計計算ツール

  1. js-STAR XR release 1.1.6j 

 

その他参考

  1. Pearson, K. (1900) On the Criterion That a Given System of Deviations from the Probable in the Case of a Correlated System of Variables Is Such That It Can Be Reasonably Supposed to Have Arisen from Random Sampling. Philosophical Magazine Series, 5, 157-175. https://doi.org/10.1080/14786440009463897 https://zenodo.org/records/1430618/files/article.pdf
  2. KARL PEARSON’S CHI-SQUARED GOODNESS-OF-FIT TEST Book Author(s):Prakash Gorroochurn First published: 17 March 2016 Classic Topics on the History of Modern Mathematical Statistics: From Laplace to More Recent Times Chapter 3 https://doi.org/10.1002/9781119127963.ch3
  3. PROFESSOR KARL PEARSON AND T H E METHOD O F MOMENTS BY R. A. FISHER, Sc.D., F.R.S. https://onlinelibrary.wiley.com/doi/pdf/10.1111/j.1469-1809.1937.tb02149.x
  4. Karl Pearson and the Chi-Squared Test R. L. Plackett International Statistical Review / Revue Internationale de Statistique Vol. 51, No. 1 (Apr., 1983), pp. 59-72 (14 pages) https://www.jstor.org/stable/1402731 https://www.floppybunny.org/robin/web/virtualclassroom/stats/basics/articles/chi_square/chi_square_review_plackett_1983.pdf
  5. A Note on Karl Pearson’s 1900 Chi-Squared Test: Two Derivations of the Asymptotic Distribution, and Uses in Goodness of Fit and Contingency Tests of Independence, and a Comparison with the Exact Sample Variance Chi-Square Result 8 Dec 2018 Timothy Falcon Crack https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3284255