アウトカムが連続変数で、原因となっている因子の候補がカテゴリー変数(有か無か)で複数ある場合にどの因子の寄与が一番大きいのかを調べたい、そんなときにつかう多変量解析の手法が、「数量化I類」と呼ばれるものです。
多変量解析と一言でいっても条件によって選ぶべき手法は異なりますので、混同しないことが大事。要因(説明変数、独立変数)と結果(従属変数、目的変数)が、連続的な数なのかそれともカテゴリー変数なのかに着目すると、選ぶべき多変量解析の手法が自ずと定まります。
多変量解析の手法の選択基準
独立変数:連続量、従属変数:連続量なら、重回帰分析
独立変数:連続量、従属変数:カテゴリーなら、判別分析
独立変数:カテゴリー、従属変数:連続量なら、数量化I類
独立変数:カテゴリー、従属変数:カテゴリーなら、数量化II類
となります。
- 第4章多変量解析4.外的基準が分類の場合の分析方法(https://www.bunkyo.ac.jp/~hotta/lab/courses/2003seminar/ch4-4_5_hotta.pdf)
- 統計分析法の分類(https://www.educa.nagoya-u.ac.jp/~ishii-h/materials/analysis_methods.pdf)
数量化1類では、独立変数がカテゴリーですがそれをダミー変数に置き換えてしまうので、そうなるとあとは重回帰分析と全く同じということになります。ダミー変数というのは例えばアンケート調査項目で、リンゴの嗜好に関して好き、普通、嫌いという選択肢があった場合に、回答者の回答で該当するものを1、他を0といった具合に、一つだけ1にして後は0にしてしまうものです。ここで、「好き」、「普通」、「嫌い」はカテゴリー変数と呼ばれます。「リンゴの嗜好」という項目のことは、アイテムと呼ばれます。
判別分析とロジスティック回帰分析との違い
連続量⇒カテゴリー という流れでいうと、判別分析とロジスティック回帰分析は似ていますが、何が違うのでしょうか。
- 判別分析とロジスティック回帰分析について CGL通信 vol39 「多変量解析の宝石学への応用」
- ロジスティック回帰 アイスタット ロジスティック回帰分析と似ている多変量解析に判別分析があります。‥ 両者の違いを調べてみます。
数量化I類を適用できる例数
- 多変量解析の手法別解説>数量化1類 アイスタット 個体数>カテゴリー総数-説明変数個数+1
数量化I類を適用する具体的な事例
多変量解析の手法別解説>数量化1類 アイスタット
目的変数:海外旅行回数
説明変数:性別(男性、女性)、年齢(若年、中年、高年)、血液型(A,B,O,AB) (カテゴリー総数=2+3+4=9、説明変数の個数=3)
目的変数:1日の新聞売り上げ部数
説明変数:曜日(月・火・水・木・金・土・日)、天候(晴・雨・小雨)、前日の野球の試合での巨人の勝敗(勝・負)、当日および前後の競馬の有無(有・無)
数量化1類 日経リサーチ
目的変数:立候補者の得票率
説明変数:政党(自民・民進・無所属)、職歴(元・現・新)、性別(男・女)
目的変数:英語の小テストの点
説明変数:英語が好きかどうかの質問
多変量解析の教科書
- 柳井 晴夫, 竹内 啓『射影行列・一般逆行列・特異値分解』(UP応用数学選書10 )新装版 2018/9/25 東京大学出版会 多変量解析の数学的な原理である線形代数を学ぶのに良さげな本。
- 足立 堅一『多変量解析入門』2005/12/20 篠原出版新社 多変量解析の数学的な基盤である線形代数をわかりやすく解説した本。多変量解析への応用という強いモチベーションを持ちつつ、線形代数が学べるという点に特色があるのかも。
- 柳井晴夫『多変量データ解析法 理解と応用』(行動計量学シリーズ8)朝倉書店1994年12月5日定価3399円(本体3300円)図書館で借りて読みましたが、多変量解析の手法が網羅的に解説されています。数学的な根拠も説明されています。巻末の16ページに、本書で用いた線形代数の定理が簡潔にまとめられており、必要な数学を俯瞰できて便利。数量化I類の説明は103~105ページ
- 柳井 晴夫, 高根 芳雄『多変量解析法』 (現代人の統計) 新版 1985/6/1 朝倉書店
- 竹内啓, 柳井晴夫『多変量解析の基礎―線型空間への射影による方法』1972年 東洋経済新報社