分散や標準偏差を計算するときにnで割るべきかn-1で割るべきか

統計の勉強はそうでなくても複雑でとっつきにくいのですが、なかでも初心者を簡単にくじく原因は、分散や標準偏差を計算するときにnで割るべきかn-1で割るべきかという混乱だと思います。授業で習ったことと教科書に書いてあることが違っている、複数の教科書を見てみると定義がまちまち。どうしてこういうことが起きているのでしょうか。まず、分散(やその平方根をとった標準偏差)と一言で言っても、実は分散には種類があり定義が異なるということを知ることが大事です。母分散、標本分散、不偏分散という概念を理解すればすべての問題は氷解します。分散という言葉が出てきたときには、それが、母分散、標本分散、不偏分散の3つのどれのことを指しているのかがわかれば、nで割ればいいのかそれともn-1で割ればいいのかがわかるわけです。

まず高校の数学を思い出しましょう。分散の定義は何だったかというと、

分散 = (1/n) * Σ (データ-平均値)^2

でした。5人の人のテストの点数がデータ=[100, 85, 30, 50, 60] だとします。

平均値 = (100+85+30+50+60)/5 = 65 点ですので、

分散 = (1/5)* {(100-65)^2 + (85-65)^2 + (30-65)^2 + (50-65)^2 + (60-65)^2 } =620

標準偏差はその平方根をとって、24.9 点となります。高校のときはこれで何も悩まなかったわけです。ところが大学に入って統計の勉強をすると、母集団から標本を抽出して、抽出した標本の統計量をもとに母集団の統計量を推定するということをやります。例えば、1000人がテストを受けていたとして、そのうちの5人をランダムに抜き出して(標本)たところ、データ=[100, 85, 30, 50, 60] だったというわけです。そうすると、本当に知りたいのは標本の平均値や分散ではなくて、母集団1000人の平均値や分散ということになります。つまり母平均や母分散に興味があるのです。現実的には1000人のテストの点もデータとして入手可能な場合もあるでしょうから、1000個のデータに関して上記の分散の定義で計算することができるでしょう。

しかし、それでは実はしりたいのは日本全国の大学1年生にこのテストをさせたときの点数だったとしたらどうでしょうか。そもそも大学1年生全員はテストを受けていません。受けたのは1000人だけだったとします。そうなると、その1000人が実は「標本」だったと考えることもできます。その場合、母集団のデータは手に入りませんので、標本から推測するしかありません。ここまででわかることは、母集団が何で、標本が何かをはっきりさせない限り、議論ができないということです。そこが曖昧だと、統計の勉強がよくわからないということになります。

さて、上で求めたのはnで割っているので、標本分散だったということになります。高校数学では標本分散のことを単に分散と呼んでいたわけです。ところが、大学以降は単に分散といえば、不偏分散(母分散の推定値)のことを指すのです。言葉の意味がいつの間にかすり替わっているのに、誰もちゃんとそれを教えてくれなかったから、統計の学習者はみな混乱させられているというわけです。もっとややこしいのは、日本語の言葉遣いの問題で、標本から計算される不偏分散のことを、標本の分散と呼ぶ本もあるようです。つまりその日本語の言葉遣いにおいては、「標本の分散」は、「標本分散」ではないというわけ。

分散や標準偏差を計算するときにnで割るべきかn-1で割るべきかという問いの答えは、母集団の母平均を推定したいので、不偏分散を計算しないといけないのが通常。だから、n-1で割るのが通常ということになります。もちろん標本分散を求めなさいといわれたときにはnで割ります。あるいは与えられたデータは母集団のデータ全てですという場合は、標本分散と同じ定義になるので、nで割ることになります。エクセルで標準偏差を求める関数としてSTDEVというものがありますが、これはn-1で割った値を返してくれる関数です。母標準偏差や標本標準偏差を求める場合には、STDEVPという関数を使います。要注意なのはpythonで、pythonでは標準偏差や分散はデフォルトではnで割った値を返します。

 

参考

  1. STDEVとSTDEVP―2つの標準偏差 BellCurve統計WEB
  2. パッと見でわかる統計学ノート【分散や標準偏差において n-1 で割る公式の理由】 2016年6月3日 / 2020年2月11日 アタリマエ!
  3. 読めば必ずわかる分散分析の基礎 第2版2003年12月5日 小野 滋
  4. 不偏推定量とは?平均と分散を例に分かりやすく解説 AVILEN TREND
  5. 7 母分散の推定(n-1で割る理由)

 

 

 

 

 

統計学的な手法の選択 2群か3群以上か、パラメトリックかノンパラか、データ間の対応の有無は、‥

実験群と対照群との間の差の有無を検定する統計学的な手法の選択は、慣れないと頭がこんがらがりそうです。考え方の基本となるのは、比べたい量が連続的に変化する量なのか、それとも離散的なデータなのか、また、データが正規分布していることを仮定しているのか(パラメトリック)、仮定しないのか(ノンパラメトリック)、群間のデータに対応があるかないかをしっかりと把握することが検定の手法選びのポイントです。それがわかっていないと、選びようがありません。

 

2群間の比較

パラメトリック

2群のデータに対応が無い場合には、t検定を(ただし等分散でない場合にはウェルチのt検定を)、対応があるデータに関しては、「対応のあるt検定」を用いる。

 

ノンパラメトリック

2群のデータに対応が無い場合には、マン・ホイットニー検定(またはそれと同値の、ウィルコクソンの順位和検定)を、対応があるデータに関しては、ウィルコクソンの符号付順和検定を用いる。つまりt検定のノンパラメトリック版がマン・ホイットニー検定で、ウェルチのt検定のノンパラメトリック版がウィルコクソンの符号付順和検定ということになります。

 

3群以上の間の比較

対照群、実験群(実験条件1)、実験群(実験条件2)といった研究デザインの場合です。

パラメトリック

1-way ANOVA (Analysis of variants 1元配置分散分析):多群間で、平均値が他と異なる群があるかどうかを検定する手法。2群間の比較で使われるt検定の、多群バージョンと考えられる。どの群とどの群の間に差があるのかは、ANOVAではわからないため、ANOVAのあとにチューキーのテストなどを行う。

1-way ANOVA (Analysis of variants 1元配置分散分析)とは

チューキーの検定 (Tukey’s test): 多群間のペアワイズな検定を行う。

ダネットの検定(Dunnett’s test):対照群1つと実験群複数の場合に、個々の実験群を対照群と比較する。

シッフェ(Scheffe)検定:

ボンフェローニ検定:

参考

  1. 杉本典夫『医学・薬学分野で役立つ 統計学の基礎 推定を中心にした統計手法の理論と実践』(プレアデス出版2015年)

ノンパラメトリック

クラスカル・ウォリス検定 (Kruskal-Wallis test):ノンパラメトリック検定の一つ。3群以上の間で、差がある群が存在するかどうかを検定する。どの群とどの群との間に差があるかはわからないので、その場合はSteel-Dwass test(スティール・デュワス検定)などを続けて行う。

Steel-Dwass test(スティール・デュワス検定):ノンパラメトリック検定の一つ。多群の場合に、群間の比較をペアワイズに行う。

 

参考

  1. 理学療法領域における統計解析法の選択 小林 武 理学療法の歩み16巻1号 2005年1月25■講座■ 統計学的手法を選ぶためのフローチャートが見やすい。
  2. 28-4. Welchのt検定 BellCure 統計WEB

1-way ANOVA (Analysis of variants 1元配置分散分析)とは

1-way ANOVA (Analysis of variants 1元配置分散分析)とは、簡単にいうとt-検定の多群への拡張版です。t検定は2群間比較にしか使えないのでした。それに対して、ANOVAは多群に対して用いることができます。ただし、それぞれの群の平均値に差があるものがあるかどうか、しか検定できません。どの群とどの群との間に差があるのかを調べたければ、ANOVAの後に、post hoc(事後に の意味)な検定を行います。post hocに用いる検定の種類としては、チューキーの検定 (Tukey’s test)(多群間のペアワイズな検定)、ダネットの検定(Dunnett’s test)(個々の実験群を共通の対照群と比較)、シッフェ(Scheffe)検定、ボンフェローニ検定などがあります(加納・高橋著『基礎医学統計学』改訂第6版 南江堂2011 などを参照)。

平均値の検定なのになぜ分散分析と呼ぶのかというと、平均値に差があるかどうかを分散の値を調べることによって分析するからです。以下のウェブ記事が非常にわかりやすいと思います。

独習教材「ハンバーガーショップで学ぶ楽しい統計学」──平均から分散分析まで──

上のウェブ記事ではFの値が危険率0.05のときのFの値と比べて有意かどうかを判定しており確率は載せていませんでしたので、確率p-valueをpythonで求めておきます。

import scipy.stats as st

ワクワク=[80,75,80,90,95,80,80,85,85,80,90,80,75,90,85,85,90,90,85,80]
モグモグ=[75,70,80,85,90,75,85,80,80,75,80,75,70,85,80,75,80,80,90,80]
パクパク=[80,80,80,90,95,85,95,90,85,90,95,85,98,95,85,85,90,90,85,85]

f, p = st.f_oneway(ワクワク,モグモグ,パクパク)
print(“F=%f, p-value = %f”%(f,p))

出力結果は、

 

参考

  1. 向後研究室 独習教材「ハンバーガーショップで学ぶ楽しい統計学」──平均から分散分析まで──
  2. 基礎 医学統計学 改訂第6版 加納・高橋 著 南江堂 2011年
  3. 杉本典夫『医学・薬学分野で役立つ 統計学の基礎 推定を中心にした統計手法の理論と実践』(プレアデス出版2015年)
  4. Fratio (or F) Distribution docs.scipy.org
  5. Pythonで統計学を学ぶ(6)  whitewell.sakura.ne.jp
  6. 分散分析 ようこそ、化学標準物質の不確かさへのいざない

 

allograft(同種移植)、xenograft(異種移植)、isograft(同系移植)

allograft(同種移植)は同じ動物種間での臓器移植のこと。例えば、他人の腎臓を誰かに移植するなど。

enograft(異種移植)は異なる動物種間の臓器移植のこと。例えば、ブタの心臓を人に移植するなど。

isograft(同系移植)は遺伝学的なバックグラウンドが同一の個体間での移植のこと。例えば一卵性双生児の間での移植など。

Isografts are allografts in which organs or tissues are transplanted from a donor to a genetically identical recipient (e.g. an identical twin).

https://www.sciencedirect.com/topics/immunology-and-microbiology/isograft

歴史的には、isograftという単語は同種移植の意味で用いられたこともあるようです。

Transplants are classified as (1) autogenous transplants—tissue completely separated from its original site and implanted in another location in the same individual—and (2) heterogenous transplants—tissue taken from other individuals. The second class may be subdivided into (a) homogenous grafts (known as isografts)—tissue from the body of an individual of the same species—and (b) zoografts—tissue from animals of different species.

https://jamanetwork.com/journals/jamaotolaryngology/fullarticle/575670

 

Youglish.comで使用例を聴く

xenograft (26件)

allograft (39件)

isograft (0件)

 

医学英単語 morbidity

morbidityは病的な状態のことです。さらに細かくいうと、以下の3つの意味で用いられます。

  • having a disease or a symptom of disease 病気であること、あるいは、疾患の症状があること
  • the amount of disease within a population 人口当たりの罹患率
  • medical problems caused by a treatment 治療によって引き起こされた医学的な問題

(参考:https://www.cancer.gov/publications/dictionaries/cancer-terms/def/morbidity)

morbidityをYouglish.comで聴く(1169件)

 

脳活動におけるリズムの意義

Position–theta-phase model of hippocampal place cell activity applied to quantification of running speed modulation of firing rate. Kathryn McClain, David Tingley, David J. Heeger, and György Buzsáki 

Traveling Theta Waves and the Hippocampal Phase Code. Christian Leibold & Mauro M. Monsalve-Mercado Scientific Reports volume 7, Article number: 7678 (2017) Published: 09 August 2017

Rhythms of the Brain György Buzsáki (465-page PDF) 2006年 書籍

Phase relationship between hippocampal place units and the EEG theta rhythm. John O’Keefe, Michael L. Recce, First published: July 1993 https://doi.org/10.1002/hipo.450030307 (PDF)

 

脳波の謎:リズムとその存在理由 良峯徳和 場所細胞の活動のタイミングと、海馬内の脳波とくにシータ波と呼ばれる周波数 4〜 8Hz の波に相関性があることがわかってきた。ラットが複数の場所を走り抜けると、それぞれの場所に反応する場所細胞が繰り返して活動する。その活動は、シータ波の 1 周期の間に、ラットが走り抜けた場所の順番を保持しながら、シータ波の周期ごとに、すなわち 1 秒間に 8 回繰り返されるという11。

  • O’Keefe J. and Recce M. L. (1993). Phase Relationship Between Hippocampal Place Units and the EEG Theta Rhythm. HYPPOCAMPUS 3(3), p.317-3303.
  • maguchi Y, Sato N, Wagatsuma H, Wu Z, Molter C & Aota Y (2007). A unified view of theta-phase coding in the entorhinal-hippocampal system. Curr Opin Neurobiol 17, p.197-204.
  • 山口陽子(2003)「脳はリズムで経験を記憶する」『理研ニュース』No.264, p.2-4.231603_多摩大研究紀要_No.21_本文-4校.indb 1002017/01/24 19:06:34

脳波測定装置

ミユキ技研

生体信号収録装置 ポリメイトプロ MP6100 10‐20の脳波記録が可能 脳波、心電図、筋電図、眼球運動などの多用途入力21ch、呼吸、いびき、脈波、SpO2、体位、外部入力などSENSOR 3ch入力に対応

高密度脳波計デジタル脳波計測システムGES400シリーズ クリニカルNetStation 32ch、64ch、128ch、256chの多チャネル脳波計測システム

  1. ポリメイトプロ MP6000 ミユキ技研
  2. 生体信号収録装置 Polymate Pro MP6000 / MP6100(基礎医学研究用)TEAC

 

イーストメディック株式会社

多用途生体アンプBiotopmini 8チャンネル多用途生体アンプBiotopmini は、脳波・筋電図・心電図・胃電図・腸電図・眼球運動・脳誘発電位などの生体電気信号の計測を目的とする、低ノイズ生体信号増幅器です。

 

参考

  1. 非侵襲生体信号の処理と解析—I—脳波の計測と信号処理 田中 聡久 ステム/制御/情報,Vol.62,No.2,pp.76–81,2018
  2. 改訂臨床脳波検査基準2002
  3. 脳波の謎:リズムとその存在理由 数百万個といわれる神経細胞のシナプス後電位の集積に、アルファ波のように 10Hz 程度のリズムが明確に生ずるようになるには、それら多数の神経細胞がほぼ同期してシナプス後電位を発するように調整されていなくてはならないと想定されている。脳全体において数百万単位の神経細胞が、一斉に同期して振動するという不思議な現象がいかに起きているかという問題は、今後の科学的解明を待たなくてはならない重要な課題である。ただし、なぜ脳の神経細胞が集団で同期的に活動しなければならないかについては、海馬を構成する神経細胞の律動性振動に関する最新の研究から、いくつかの示唆に富む研究成果が得られている。 良峯徳和 多摩大学 脳波の測定を通して、心の動きや働きを定量的にとらえるという大胆な試みにチャレンジします。

スティール=ドゥワス検定 Steel-Dwass’s testとは?

スティール=ドゥワスの多重比較検定 Steel-Dwass’s multiple comparison testは、ノンパラメトリックな検定に分類されます。同じく多重検定のための手法であるテューキーの方法のノンパラメトリック版と言えるでしょう。クラスカル=ウォリス検定は、数式に自分で値をいれて、手計算である程度できましたが、スティール=ドゥワスの多重比較検定は統計ソフトにお任せするしかなさそうです。

pythonでもできます。

https://buildmedia.readthedocs.org/media/pdf/scikit-posthocs/latest/scikit-posthocs.pdf このウェブページにあるサンプルコードですが、

import scikit_posthocs as sp
a= [1,2,3,5,1]

b = [12,31,54,62,12]

c = [10,12,6,74,11]

sp.posthoc_dscf([a, b, c])

と一行のコマンドで済みます。

  1. https://analyse-it.com/docs/user-guide/compare-groups/multiple-comparison-procedures
  2. scikit_posthocs.posthoc_dscf
  3. https://scikit-posthocs.readthedocs.io/en/latest/intro/
  4. https://scikit-posthocs.readthedocs.io/en/latest/generated/scikit_posthocs.posthoc_dscf/

クラスカル・ウォリス検定 (Kruskal-Wallis test) とは?わかりやすい説明

クラスカル・ウォリス検定 (Kruskal-Wallis test) に関するわかりやすい説明を纏めました。

クラスカル・ウォリス検定は、ノンパラメトリック検定の一つです。ノンパラメトリック検定とは、パラメトリック検定に対する言葉で、パラメトリック検定とは、母集団として正規分布など何かしらの分布を仮定しておき、その仮定のもとでなにがしかの検定統計量を計算し、その検定統計量が従う分布を用いて仮説検定を行うものです。それに対して、ノンパラメトリック検定は、そのような母集団の分布の仮定を置きません。ノンパラメトリック検定における基本的なやり方は、観察された値(データ)を大きさの順に並べて、その順位を使った検定統計量を計算し、その検定統計量が従う分布を利用して仮説検定を行うところに特徴があります。

クラスカル・ウォリス検定は複数の群(2群でもよいし、3群でも、3群以上でもOK)の間に分布の差があるかどうかを調べます。仮説検定を行うときの帰無仮説は、「群間に分布の差はない」、帰無仮説が棄却された場合には、「(どれとどれとの間にかはわからないが)群間で差がある」といいうことになります。

実際の計算はというと、仮にA群、B群、C群とあったとすると、それぞれのデータの値を総データにおける「順位」(小さい順。一番小さいものが1)に変換しておきます。

統計検定量H = 12/総データ数*(総データ数+1) * (A群のデータ数*(A群の順位和の平均 – 総データ数の中央値)^2 + B群に関して同様 + C群に関して同様)

という数式から統計検定量Hを計算します。上の式をみると、この統計検定量Hを計算する際、データの実際の値は使われておらず。そのデータの順位だけが考慮されていることがわかります。この統計検定量Hは、自由度(群の数 -1)のχ2乗分布に従うので、Hの値より上側の面積が、そのHもしくはそれより高い値が得られる確率(すなわちp値)になります。

データの値を順位に変換するのは、pythonなどのプログラミング言語を利用すると比較的簡単にできるので、上の式を用いて全部自分で計算することが可能です。

 

クラスカル・ウォリス検定と一元配置分散分析との違い

3群以上の群間の差を調べる方法としては、一元配置分散分析とクラスカル・ウォリス検定がありますが、一元配置分散分析が群間で平均値の差を検定するのに対して、クラスカル・ウォリス検定では中央値の差を検定しているというところが違いです。一元配置分散分析法(One-factor ANOVA)のノンパラメトリック版だと考えると、どういうときに使うのかが覚えやすいかもしれません。

  1. 経済情報処理 講義ノート 第8回 仮説検定 2017年5月29日(月)4限 担当教員:唐渡 広志 (PDF u-toyama.ac.jp )

 

クラスカル・ウォリス検定をした後は

他群間の比較をする目的は、たいていの場合、どの群とどの群との間に差があるのかです。しかし、クラスカル・ウォリス検定は、全ての群が同じということではない、と結論してくれますが、じゃあ、どの群が違ているのかまでは教えてくれません。そのため、クラスカル・ウォリス検定で有意差が認めらたとしても、そこで解析を終わるわけにはいきません。

事後の比較として多重比較の手順を必要とします。 多重比較の手法としては、Steel-Dwass test(スティール・デュワス検定)Mann-Whitney U test(マン・ホイットニーのU検定)による2群比較を行ってBonferroni(ボンフェローニ)による調整を行う方法などが知られています (Kruskal-Wallis検定の後の多重比較の手法  Stats Guild)

 

参考図書

  1. 統計学実践ワークブック 日本統計学会編 学術図書出版社 日本統計学会公式認定 統計検定 準一級対応

 

原著論文

  1. Use of Ranks in One-Criterion Variance Analysis Author(s): William H. Kruskal and W. Allen WallisSource: Journal of the American Statistical Association, Dec., 1952, Vol. 47, No. 260 (Dec., 1952), pp. 583-621