確率変数X(あるいは標本値X)をaX+bに変換したときの平均値と標準偏差は、平均はbを足したものとなり、標準偏差はa倍になります。
この事実を利用すると、標本値から標本平均を引いた場合の平均は、平均―平均=0となり、標本値から標本平均を引いたものを標準偏差で割ったものをあらたな変数と考えると、標準偏差に標準偏差分の1をかけることになるので(定数項は関与しない)、変数変換した場合の標準偏差が1になります。つまりZ=(Xーμ)/σ という変数変換を行うとZは、標準偏差が1で、平均が0になるわけですね。
- 小島寛之『完全独習統計学入門』(ダイヤモンド社)49ページ 加工されたデータの平均値と標準偏差
今まで、この変数変換の話がどの統計の教科書を読んでもしっくりこなかったのですが、小島寛之『完全独習統計学入門』の説明を読んで、この変数変換のご利益がなんて素晴らしい!と思いました。
この考え方がわかると、偏差値も簡単に理解できます。
偏差値とは
ある人のテストの点数Xとして、そのテストの平均点がμ、標準偏差がσだったとすると、
Z=(X-μ)/σ と変数変換したときに、Zの平均は0,標準偏差は1になります。ある人の点数がx点だったとすると、それを変数変換してz点とし、標準偏差を単位として表そうというわけです。
z=(x-μ)/σ
これをいわゆる偏差値にするには、これに10をかけて(つまり標準偏差1ユニットを10とする)、さらに50をたします(つまり平均を50とする)。
z点を取った人の偏差値は、
偏差値=zx10+50 = ((x-μ)/σ) x 10 +50
です。この考えかたのミソは、点数を「標準偏差」を単位として表すというところです。テストの点数は2SDでしたというのもなんなので、2x10+50=70 偏差値は70でしたというわけです。偏差値60は、1SDです。偏差値80は3SDですね。偏差値が40~60の間に全体の68%が入る(正規分布に従うとして)というわけです。偏差値70の人は2SDのところにいるので、上位2.5%にはいっています。
- 小島寛之『完全独習統計学入門』(ダイヤモンド社)53ページ
偏差値というのは、標準偏差を単位にしたスコアというのが核心ですね。今日からは、「あの人は偏差値が80だって!スゲー!」というかわりに、「あの人は3SDの成績だって!スゲー!」といったほうが、凄さが伝わるような気がします。