投稿者「PhD」のアーカイブ

アンケート調査に基づく研究デザインの実践

アンケート調査票を作成のための仮説の必要性

  1. 仮説構築と調査検証 株式会社 日立インフォメーションアカデミー 調査結果を考察することで「何が言えそうか」という新たな仮説が導けます。その新たな仮説を調査検証することで、さらに深い仮説が導けます。仮説検証は繰り返すことでより高い価値を発揮します高い価値を発揮します。
  2. アンケートの計画
  3. アンケート調査実施前の注意点ー計画編ー アンケート調査には、2つの種類があります。①発見型アンケート②仮説検証型アンケート
  4. アンケート調査を成功させるコツ Point1. 調査目的を明確にする  調査結果をどう活用するかが明確に定まっていないと、調査をやっただけで終わってしまうことがあるため、調査を実施する前に、「今回の調査結果をもとに、どのようなアクションを起こすのか」を決めておくことが重要です。Point2. 調査課題をモレなく整理する 調査課題とは、調査の目的を達成するために、得るべき知見のことです。 Point3. 仮説を立てる アンケート調査の本質は、仮説検証です。仮説を立てる際に重要なのが、検証により仮説が肯定された際の次のアクションまでがきちんと描かれていることです。 
  5. アンケート調査の方法とコツ② 課題設定~仮説構築~調査手法の選び方編 手法 ネットリサーチ 2019.07.26 アンケート調査の企画をする時には、具体的な方法や質問の内容を考え始める前に、解決すべき課題の設定仮説の構築~調査の企画というプロセスが必要です。ここで重要なのは、調査結果が課題の解決に向けたアクションに繋がるように企画することです。このプロセスでしっかり準備することが、調査結果の価値の大半を決めます。問題の原因を次のアクションにおとしこめるレベルまで具体化することで、アンケート調査の結果をマーケティングに活かすことができる 最初に考えた仮説が本当に原因であるとは限りません。考えられる原因=仮説を出来るだけアンケート調査に盛り込んでおく
  6. マーケティングリサーチの成功の秘訣は「仮説」にある 2018 / 02 / 15 市場調査における仮説は成功の鍵 現状仮説とは具体案を提示する際に「現在の状況は、このような状態になっているのではないか」という推測です。実行仮説とは(戦略推定ともいう)ビジネス展開するにあたり「このような方法で実行すればうまく行くのではないか」という仮定です。現状推定は次の実行推定の立案に結びつくような項目でなければならない。想定作りの前の事前調査の方法は、インターネットは基より実際の現場を訪れて生きた情報を集める事が大切である。
  7. 調査仮説の立て方 「調査仮説」がない場合 例えば、「売上不振の理由(商品の不満内容)を把握したい」というだけでは、調査設計まで落とし込めません。「調査仮説」がある場合  例えば、「売上不振の理由(商品の不満内容)は、 商品パッケージのデザインが良くないからだと考えられる」という仮説がある場合、その仮説に沿って踏査を設計することができます。
  8. https://www.advertimes.com/20180308/article266951/ 考察 → 分析 → 設計 という順で考えていく 調査項目を考える、いわゆる調査設計から考え始めると、必ずと言っていいほど後から『あれも聞けば良かった、こう聞けば良かった』という声が聴かれる
  9. https://www.and-d.co.jp/researches/form-hypothesis/ マーケティング上の課題を整理し、リサーチによって明らかにすべきテーマに変換したうえで、「仮説の構築」を行い、マーケティングリサーチで「何を」「どんなふうに」明らかにしていくのかの骨格を作っていきます。
  10. はじめての市場調査:アンケート調査票の作り方は?良い例・悪い例 精度の高いアンケートを作る9つのステップとポイント 2021年05月10日 精度の低いアンケートを行ってしまうと正しい調査結果が得られず、知りたかったことが分からなかったり、間違った結論を導いてしまったりすることがあります。
  11. https://globis.jp/article/5823 アンケートが長くなりすぎるのはもちろんのこと、レイアウトが見づらいとか、ウェブアンケートの場合は操作性が悪いと、答える方が面倒くさくなって、いい加減に答えてしまうことがあります。たとえば、ウェブのスピードが遅く、アンケートで20分以上かかるようなものでは、すべて真面目に答える人は多くありません。
  12. https://www.kcsf.co.jp/marketing/column.html 理想を言えば、設問数は10問~20問程度ではないでしょうか。・最初の数問で、回答者の頭をウォーミングアップ。 (前菜)・その後、やや、本題に近寄りながら、 (スープ)・本題に数問。 (メインディッシュ)・最後は、必要な属性などを確認します。 (デザート)

その他

  1. https://www.marketing-literacy.org/blog/hypothesis-excavation-method/
  2. 課題を把握し、商品・サービスの改善で売り上げを上げるための情報は『顧客』が持っています。「Consumer is Boss」(お客様はボス)はP&G社で徹底されている考え方であり、「ファブリーズ」に代表される徹底的なマーケティング・リサーチ実施による成功例は、まさに好事例と言えます。 https://www.startrise.jp/columuns/view/4179
  3. マーケティングを学ぶ学生たちには、仮説をもつことの重要さを説いています。リサーチの講義においては、そのことはリサーチの位置づけを理解することにもつながるので、とりわけ重要なことと考えています。ここで言う仮説とは、市場における消費者やブランド等の現況に関わる仮説にはじまり、それにもとづいて設定する課題の仮説、さらにはそれを解決するための戦略や施策の仮説まで、すべてを含みます。 https://insight.rakuten.co.jp/knowledge/researchcolumn/vol21.html

分散や標準偏差を計算するときにnで割るべきかn-1で割るべきか

統計の勉強はそうでなくても複雑でとっつきにくいのですが、なかでも初心者を簡単にくじく原因は、分散や標準偏差を計算するときにnで割るべきかn-1で割るべきかという混乱だと思います。授業で習ったことと教科書に書いてあることが違っている、複数の教科書を見てみると定義がまちまち。どうしてこういうことが起きているのでしょうか。まず、分散(やその平方根をとった標準偏差)と一言で言っても、実は分散には種類があり定義が異なるということを知ることが大事です。母分散(母標準偏差)、標本分散(標本標準偏差)、不偏分散(不偏標準偏差)という概念を理解すればすべての疑問は氷解します。分散という言葉が出てきたときには、それが、母分散、標本分散、不偏分散の3つのどれのことを指しているのかがわかれば、nで割ればいいのかそれともn-1で割ればいいのかがわかるわけです。

まず高校の数学を思い出しましょう。分散の定義は何だったかというと、

分散 = (1/n) * Σ (データ-平均値)^2

でした。5人の人のテストの点数がデータ=[100, 85, 30, 50, 60] だとします。

平均値 = (100+85+30+50+60)/5 = 65 点ですので、

分散 = (1/5)* {(100-65)^2 + (85-65)^2 + (30-65)^2 + (50-65)^2 + (60-65)^2 } =620

標準偏差は、分散の平方根なので24.9 点となります。高校のときはこれで何も悩まなかったわけです。

ところが大学に入って統計の勉強をすると、母集団から標本を抽出して、抽出した標本の統計量をもとに母集団の統計量を推定するということをやります。例えば、1000人がテストを受けていたとして、そのうちの5人をランダムに抜き出して(標本)たところ、データ=[100, 85, 30, 50, 60] だったというわけです。そうすると、本当に知りたいのは標本データそのもののの平均値や分散ではなくて、母集団1000人の平均値や分散ということになります。つまり母平均や母分散に興味があるのでそれを推定したいのです。現実的には1000人のテストの点もデータとして入手可能な場合もあるでしょうから、1000個のデータに関して上記の分散の定義で計算することができるでしょう。

しかし、それでは実は知りたいのは日本全国の大学1年生にこのテストをさせたときの点数だったとしたらどうでしょうか。そもそも大学1年生全員はテストを受けていません。受けたのは1000人だけだったとします。そうなると、その1000人が実は「標本」だったと考えることもできます。その場合、母集団のデータは手に入りませんので、標本から推測するしかありません。ここまででわかることは、母集団が何で、標本が何かをはっきりさせない限り、議論ができないということです。そこが曖昧だと、統計の勉強がよくわからないということになります。

研究者が実験して測定を繰り返して測定値の平均値を求めたりするのは日常的な行為ですが、この場合の「母集団」は、実際にはあり得ませんが仮想的に考えて、無限回測定を繰り返したときの測定値の集団です。それに対して、「標本」というのは測定を繰り返して得られた測定値のデータセットになります。

さて話を戻すと、上で求めたのはnで割っているので、標本分散だったということになります。高校数学では標本分散のことを単に分散と呼んでいたわけです。ところが、大学以降は単に分散といえば、不偏分散(母分散の推定値)のことを指すことが多いのです。言葉の意味がいつの間にかすり替わっているのに、誰もちゃんとそれを教えてくれなかったから、統計の学習者はみな混乱させられているというわけです。もっとややこしいのは、日本語の言葉遣いの問題で、標本から計算される不偏分散のことを、標本の分散と呼ぶ本もあるようです。つまりその教科書の日本語の言葉遣いにおいては、「標本の分散」は、「標本分散」ではないというわけ。混乱しない人がいたら、そのほうが不思議なくらいです。

分散や標準偏差を計算するときにnで割るべきかn-1で割るべきかという問いの答えは、母集団の母平均を推定したいので、不偏分散を計算しないといけないのが通常。だから、n-1で割るのが通常ということになります。もちろん標本分散を求めなさいといわれたときにはnで割ります。あるいは与えられたデータは母集団のデータ全てですという場合は、標本分散と同じ定義になるので、nで割ることになります。エクセルで標準偏差を求める関数としてSTDEVというものがありますが、これはn-1で割った値を返してくれる関数です。

研究者が測定データをエクセルに入力してSTDEVという関数で標準偏差を求めて論文報告するというのは一般的だと思いますが、その際に報告しているのは「不偏標準偏差」(つまり母集団の標準偏差の推定値)だったのですね。当然といえば当然のことです。

もし高校生が高校の数学の統計の授業で標準偏差を習い、それをエクセルのSTDEVで計算させたときに、食い違いが生じて混乱させられることでしょう。エクセルでは、母標準偏差や標本標準偏差を求める場合には、STDEVPという関数を使います。要注意なのはpythonで、pythonでは標準偏差や分散はデフォルトではnで割った値を返します。

 

参考

  1. STDEVとSTDEVP―2つの標準偏差 BellCurve統計WEB
  2. パッと見でわかる統計学ノート【分散や標準偏差において n-1 で割る公式の理由】 2016年6月3日 / 2020年2月11日 アタリマエ!
  3. 読めば必ずわかる分散分析の基礎 第2版2003年12月5日 小野 滋
  4. 不偏推定量とは?平均と分散を例に分かりやすく解説 AVILEN TREND
  5. 7 母分散の推定(n-1で割る理由)

 

 

 

 

 

統計学的な手法の選択 2群か3群以上か、パラメトリックかノンパラか、データ間の対応の有無は、‥

実験群と対照群との間の差の有無を検定する統計学的な手法の選択は、慣れないと頭がこんがらがりそうです。考え方の基本となるのは、比べたい量が連続的に変化する量なのか、それとも離散的なデータなのか、また、データが正規分布していることを仮定しているのか(パラメトリック)、仮定しないのか(ノンパラメトリック)、群間のデータに対応があるかないかをしっかりと把握することが検定の手法選びのポイントです。それがわかっていないと、選びようがありません。

 

2群間の比較

パラメトリック

2群のデータに対応が無い場合には、t検定を(ただし等分散でない場合にはウェルチのt検定を)、対応があるデータに関しては、「対応のあるt検定」を用いる。

 

ノンパラメトリック

2群のデータに対応が無い場合には、マン・ホイットニー検定(またはそれと同値の、ウィルコクソンの順位和検定)を、対応があるデータに関しては、ウィルコクソンの符号付順和検定を用いる。つまりt検定のノンパラメトリック版がマン・ホイットニー検定で、ウェルチのt検定のノンパラメトリック版がウィルコクソンの符号付順和検定ということになります。

 

3群以上の間の比較

対照群、実験群(実験条件1)、実験群(実験条件2)といった研究デザインの場合です。

パラメトリック

1-way ANOVA (Analysis of variants 1元配置分散分析):多群間で、平均値が他と異なる群があるかどうかを検定する手法。2群間の比較で使われるt検定の、多群バージョンと考えられる。どの群とどの群の間に差があるのかは、ANOVAではわからないため、ANOVAのあとにチューキーのテストなどを行う。

1-way ANOVA (Analysis of variants 1元配置分散分析)とは

チューキーの検定 (Tukey’s test): 多群間のペアワイズな検定を行う。

ダネットの検定(Dunnett’s test):対照群1つと実験群複数の場合に、個々の実験群を対照群と比較する。

シッフェ(Scheffe)検定:

ボンフェローニ検定:

参考

  1. 杉本典夫『医学・薬学分野で役立つ 統計学の基礎 推定を中心にした統計手法の理論と実践』(プレアデス出版2015年)

ノンパラメトリック

クラスカル・ウォリス検定 (Kruskal-Wallis test):ノンパラメトリック検定の一つ。3群以上の間で、差がある群が存在するかどうかを検定する。どの群とどの群との間に差があるかはわからないので、その場合はSteel-Dwass test(スティール・デュワス検定)などを続けて行う。

Steel-Dwass test(スティール・デュワス検定):ノンパラメトリック検定の一つ。多群の場合に、群間の比較をペアワイズに行う。

 

参考

  1. 理学療法領域における統計解析法の選択 小林 武 理学療法の歩み16巻1号 2005年1月25■講座■ 統計学的手法を選ぶためのフローチャートが見やすい。
  2. 28-4. Welchのt検定 BellCure 統計WEB