クラスカル・ウォリス検定 (Kruskal-Wallis test) に関するわかりやすい説明を纏めました。
クラスカル・ウォリス検定は、ノンパラメトリック検定の一つです。ノンパラメトリック検定とは、パラメトリック検定に対する言葉で、パラメトリック検定とは、母集団として正規分布など何かしらの分布を仮定しておき、その仮定のもとでなにがしかの検定統計量を計算し、その検定統計量が従う分布を用いて仮説検定を行うものです。それに対して、ノンパラメトリック検定は、そのような母集団の分布の仮定を置きません。ノンパラメトリック検定における基本的なやり方は、観察された値(データ)を大きさの順に並べて、その順位を使った検定統計量を計算し、その検定統計量が従う分布を利用して仮説検定を行うところに特徴があります。
クラスカル・ウォリス検定は複数の群(2群でもよいし、3群でも、3群以上でもOK)の間に分布の差があるかどうかを調べます。仮説検定を行うときの帰無仮説は、「群間に分布の差はない」、帰無仮説が棄却された場合には、「(どれとどれとの間にかはわからないが)群間で差がある」といいうことになります。
実際の計算はというと、仮にA群、B群、C群とあったとすると、それぞれのデータの値を総データにおける「順位」(小さい順。一番小さいものが1)に変換しておきます。
統計検定量H = 12/総データ数*(総データ数+1) * (A群のデータ数*(A群の順位和の平均 – 総データ数の中央値)^2 + B群に関して同様 + C群に関して同様)
という数式から統計検定量Hを計算します。上の式をみると、この統計検定量Hを計算する際、データの実際の値は使われておらず。そのデータの順位だけが考慮されていることがわかります。この統計検定量Hは、自由度(群の数 -1)のχ2乗分布に従うので、Hの値より上側の面積が、そのHもしくはそれより高い値が得られる確率(すなわちp値)になります。
データの値を順位に変換するのは、pythonなどのプログラミング言語を利用すると比較的簡単にできるので、上の式を用いて全部自分で計算することが可能です。
クラスカル・ウォリス検定と一元配置分散分析との違い
3群以上の群間の差を調べる方法としては、一元配置分散分析とクラスカル・ウォリス検定がありますが、一元配置分散分析が群間で平均値の差を検定するのに対して、クラスカル・ウォリス検定では中央値の差を検定しているというところが違いです。一元配置分散分析法(One-factor ANOVA)のノンパラメトリック版だと考えると、どういうときに使うのかが覚えやすいかもしれません。
- 経済情報処理 講義ノート 第8回 仮説検定 2017年5月29日(月)4限 担当教員:唐渡 広志 (PDF u-toyama.ac.jp )
クラスカル・ウォリス検定をした後は
他群間の比較をする目的は、たいていの場合、どの群とどの群との間に差があるのかです。しかし、クラスカル・ウォリス検定は、全ての群が同じということではない、と結論してくれますが、じゃあ、どの群が違ているのかまでは教えてくれません。そのため、クラスカル・ウォリス検定で有意差が認めらたとしても、そこで解析を終わるわけにはいきません。
事後の比較として多重比較の手順を必要とします。 多重比較の手法としては、Steel-Dwass test(スティール・デュワス検定)や Mann-Whitney U test(マン・ホイットニーのU検定)による2群比較を行ってBonferroni(ボンフェローニ)による調整を行う方法などが知られています (Kruskal-Wallis検定の後の多重比較の手法 Stats Guild)
参考図書
- 統計学実践ワークブック 日本統計学会編 学術図書出版社 日本統計学会公式認定 統計検定 準一級対応
原著論文
- Use of Ranks in One-Criterion Variance Analysis Author(s): William H. Kruskal and W. Allen WallisSource: Journal of the American Statistical Association, Dec., 1952, Vol. 47, No. 260 (Dec., 1952), pp. 583-621
Chat GPTに聞いてみた!クラスカル・ウォリス検定とは?
クラスカル・ウォリス検定(Kruskal-Wallis test)は、3つ以上の独立したグループ(または標本)の間で、連続型の順序尺度データに基づいて統計的に有意な違いがあるかどうかを検定する方法です。この検定は、グループ間で中央値に差があるかどうかを調べるために使用され、非正規分布のデータや等分散性の仮定が満たされない場合にも有用です。
クラスカル・ウォリス検定の基本アイデアは、各グループのランクを計算し、それらのランクを比較して、グループ間の中央値に統計的に有意な差があるかどうかを判断することです。具体的な手順は以下の通りです。
- データを収集し、各グループ(条件またはカテゴリ)の中央値を計算します。
- 各データポイントをそのグループ内でのランクに変換します。データを昇順に並べ、同じ値が複数ある場合は平均ランクを使用します。
- 各グループ内のランクの合計を計算します。
- グループの数と総サンプルサイズから、クラスカル・ウォリス統計量(H)を計算します。この統計量は、各グループのランク合計とデータの分散に基づいて求められます。
- Hの値はクラスカル・ウォリス分布に従い、帰無仮説(すべてのグループ間で中央値に差がない)を検定します。帰無仮説が棄却される場合、少なくとも1つのグループ間に統計的に有意な差があると結論されます。
クラスカル・ウォリス検定は、実験または調査データにおいて、複数の処置または条件がある場合、それらの条件間で統計的な差を評価するのに役立ちます。臨床における例を考えてみましょう。
例: 薬物療法の比較
臨床試験において、3つの異なる薬物(A、B、C)を投与して、患者の特定の疾患の症状の軽減度を評価したいとします。各薬物は異なる治療群に割り当てられ、同じ病態を持つ患者が各群に分散されます。治療後、症状の軽減度を数値で評価し、これらのデータを使用してクラスカル・ウォリス検定を実施します。
帰無仮説(H0): 3つの薬物の中央値に統計的に有意な差はない。
対立仮説(H1): 少なくとも1つの薬物の中央値に統計的に有意な差がある。
クラスカル・ウォリス検定を実行し、結果が有意であれば、どの薬物が他よりも有効であるかを特定できます。このような解析は、臨床試験や疾患治療の効果を評価する際によく使用されます。
(参照:chat.openai.com)