論文を読んでいるとp value(p値)というものが、表などに書かれていることがあります。何か2つの群の平均値をそれぞれ算出し、2群間の平均値が有意に差があるのかないのかを調べた研究などにおいてです。統計的検定の一般論としていうと、「差がある」ことを示すためには、
- 「差がない」という仮説をおいて、差がないとした場合に、
- とある検定統計量(確率分布が既知なもの)を計算して、
- その検定統計量の値が得られる確率がどの程度かを調べます。
- その値が得られる確率が0.05未満であれば、
- そんなことはめったに起こらない、すなわち、差がないとした仮説が間違っていた、
- つまり、差はある
と結論づけるわけです。
大学の初年度あたりに統計学の授業でこういったことは習うわけですが、学年が上がるとみな忘れてしまうようです。そのため、いざ研究論文を読み始めたときに、p値って何?といった状態に陥るんですね。