未分類」カテゴリーアーカイブ

英語論文執筆に役立つ英作文、語法のコツ・アドバイス集

英文法・語法について

  1. グレン・パケット『科学論文の英語用法百科第1編 よく誤用される単語と表現』京都大学学術出版会 これはなかなかの力作、大作です。英語論文を書く人は必携の書籍でしょう。なにしろ日本人が英語論文を書くときの典型的なやらかしが、網羅的に指摘され、解説されています。目からうろことはまさにこのことかと思えるような明解な解説で、読破すれば英文執筆能力が一皮も二皮も剥けることでしょう。通常の辞書には語法までは載ってません。ここまで詳細な解説は、他で見たことがありません。
  2. 転換語(transition words)の役割と種類:効果的な使い分け方 エナゴ アカデミー Jul 26, 2023 ①追加、②比較・対照、③原因・結果、④例・解説、⑤順序と時系列、⑥明確化・言い換え、⑦強調、⑧要約・結論
  3. 「そして」を英語論文で使う際の注意点とは?「and」以外の英語表現方法 2021-06-11 native camp blog 英語の接続詞には大きく分けて7つの種類が存在します。①帰結、②原因・理由、③目的、④追加情報、⑤否定・逆説、⑥強調、⑦言い換えの7つです。
  4. 【英語論文の書き方】第29回 then, however, therefore, for example など接続副詞の使い方 2017年1月26日 ワールド翻訳サービス 以下に代表的な接続副詞を含め,6つの分類を示します。(1)  時間的移行: then, next, subsequently (2)  補足・追加:additionally, moreover, furthermore (3)  逆接:however, nevertheless, nonetheless (4)  選択: (or) else, otherwise (5)  原因・結果:accordingly, consequently, hence, therefore, thus (6)  例示・言換え:for example, for instance, namely, that is (to say)
  5. 「さらに」の英語表現12選|各表現の例文と使い分け 2023.10.30 BizMates Blog
  6. 科学英文のチェックマニュアル(第7版) (PDF) 牧島一夫 December 27, 2015
  7. 論文英語の組み立て – 学術論文における 口語 の使用について グレン・パケット Glenn Paquette Aug 31, 2018

冠詞の選び方について

  1. 科学論文における英語の話(PDF) 関根郁夫 千葉医学 90:195~200, 2014   その他の著作:関根郁夫:英語で医学論文を書く-曖昧であった思考を形にする方法、医学と看護社 (書籍) 関根郁夫:医師の英語-目的の設定と目標の数値化、千葉医学会雑誌、第81巻、75-80頁、2005 関根郁夫:英語論文を読むことと書くこと. 千葉医学雑誌 90: 251 -258, 2014 関根郁夫:科学論文における英語の話. 千葉医学雑誌 90:195-200,2014
  2. 科学論文の英語用法百科 第2編 冠詞用法 グレン・パケット 2016/10 京都大学学術出版会

語句の選び方

「~によって」はbyかwithか

  1. 【英語論文の書き方】第4回「~を用いて」の表現:by と with の違い 2015年10月14日 15時56分 ワールド翻訳サービス byは抽象的手段に,withは具体的手段 

英文校正に関する考え方

  1. Vol.103 医学論文執筆に際しての、英文“校正”業者の実力と英文添削の意義 医療ガバナンス学会 (2021年6月1日 06:00)

論文原稿作成の実際

  1. 松尾ぐみの論文の書き方:英語論文

その他の参考

  1. 日本人のため.の英語科学論文の書き方I.背景と目的ヒビサトシ(PDF) 私は,日本の科学者たちが書いた英文の意味を理解することができず,他の日本人にその意味を尋ねた経験は何回もある.尋ねられた日本人は,私が質問した部分を読んでその意味が明白に理解できたので,私に理解できないのが不思議に思えたようすであった.このような問題がおこるのは,日本には独特の英語の言い方(Japanese-English)があるからである.

コレスポンディングオーサー(correspoinding author、責任著者)とは?

correspoinding author(コレスポンディングオーサー、責任著者)とは、研究成果を論文発表するときに、著者が複数いる場合の一番の責任を負う著者のことです。correspoindingという名前が示すとおり、論文に関する第三者とのやりとりは、correspoinding authorが行います。つまり、雑誌への投稿の際の雑誌エディターとのやりとりや、出版後に誰か他の研究者が論文に関することを聞きたいときの連絡先でもあります。日本語で責任著者と訳されることからわかるように、単にやり取りをする窓口という意味以上に、論文報告する内容に関する責任を負います。研究者の間では、日常会話ではコレスポと略すことが多いです。

誰がコレスポになるのか

通常はラボのボスがコレスポになります。それは、ラボのボスが研究を立案し、研究資金を獲得し、研究人員を配置し(部下にテーマを与え)、論文を執筆することが多いからです。しかし、ラボの運営体制によっては、中ボスがコレスポになることや、実際に仕事をした部下がコレスポになることもなくはありません。このあたりは、誰がオーサーになるべきかという問題も含めて、分野によって、あるいは業界(学部)などによっても、文化・慣習が異なる場合があるので、一概に何が正しくて、何がおかしいとも言えないものがあります。つまり曖昧な線引きになっているため、俺が当然コレスポになるべきだ、いや、コレスポは私でしょう、というラボ内での意見の相違が生まれることもよくあります。

コレスポでもめる一番のパターンは、ラボのボス(教授)が実質的にはほとんど貢献していないにも関わらずコレスポを要求するパターンです。その場合の正当性の根拠は、自分のラボだから、自分が研究資金を稼いできたのだから、というものです。教科書的に言えばそれだけではオーサーシップにすら値しないということになっていますが、そのような教科書的なルールが実社会で行われているのは、自分は見たことがありません。場合によってはボスはあまり研究費を獲っていなくて、研究を実際に行った部下が自ら研究費も獲得して、研究を立案し、実験を実施し、データを解析して論文まで執筆するということもあります。その場合には、実際に研究を行った部下がコレスポンディングオーサーになるのが、「研究の倫理の教科書」的には正しいと思いますが、現実はというと、権力を持つ立場の人間がコレスポを主張することがあるでしょう。その場合に、どこをお落としどころにするかということに関しては、正解はありません。なぜなら、部下の立場でボスと喧嘩してもその部下に勝ち目がないことが多いですし、かりに主張を押し通せても、しこりが残ってしまって、長期的には必ずしも良いとは限らないからです。

2つのラボが対等の共同研究をした場合にも、コレスポをどちらのラボのボスが取るかで意見の相違が生じる可能性があります。これはもう2つのラボの力関係で決まるのではないでしょうか。オーサーシップでもめてしまって、折角共同研究で良い成果を得て論文発表したにも関わらず、その後の関係が冷え切ってしまうということもあるかもしれません。人間関係なので、難しいところです。

 

コレスポは何人まで可能?

責任著者は通常一人ですが、ジャーナルによっては複数の人が責任著者になっている論文があります(Co-corresponding author)。下のエディテージの記事を見ると、コ・コレスポンディングオーサーを認める雑誌は多くはないが存在するようです。基礎系の雑誌か、臨床系の雑誌かでもその割合は異なるかもしれません。自分は基礎系のジャーナルにしか論文を出したことがありませんが、責任著者が複数ということは比較的よく見かけたように思います。

While some journals allow the practice of including two corresponding authors, many journals do not. (Does your target journal allow more than one corresponding author? A case study editage insights)

コレスポが何人までOKなのかは、雑誌の投稿規定に明示されていないこともありますが、明示している雑誌もあります。

分散はnで割るのかn-1で割るのか?n-1で割ったほうをなぜ不偏分散と呼ぶのか

統計の教科書を読み始めてすぐに挫折する理由は、分散の説明が教科書によってまちまちなせいで頭が混乱させられるからです。分散の定義がある教科書では 1/n Σ (xi-m)^2なのに別の教科書だと 1/(n-1) Σ (xi-m)^2 のようにnでなくn-1で割っています(nは標本の数、mは標本の平均)。そして、n-1で割るほうを不偏分散と呼んでいます。

ちゃんとした教科書であれば、それぞれを正しく呼び分けていることも多いのですが、統計ソフトの場合、分散と言えば、n-1で割るほう(不偏分散)で、統計ソフトの使い方の教科書などでは特に、不偏分散のことを単に分散と呼んでいたりするので、混乱するわけです。

不偏という耳慣れない日本語の意味を知りたいのですが、「偏りが無い」と日本語で説明されても意味不明です。もうこのあたりで嫌気が差して教科書を閉じることになります。

ちゃんと理解したければ、「不偏推定量」なる概念を理解する必要がありました。前提として、「母集団」から標本を抽出するという操作の理解も大事です。母集団には母集団の分布の特性を表す量があります。例えば、平均値(母平均と呼ぶ)などが特性を表す値の一例です。母集団から標本をとってきた場合に、標本から計算される平均値(標本平均と呼ぶ)もあります。標本平均と母平均との関係はどうなっているの?というのが大事なポイントになります。分散についても同様に考えることができます。母集団の分散(母分散と呼ぶ)と、標本から得られた分散(標本分散)との関係はどうなっているのでしょうか。

標本を得るという操作を行うごとに、実際に得られる標本の値は毎回異なるわけですから、標本抽出を何回も行えば、標本平均も毎回異なります。標本分散も毎回異なります。そこで、「標本平均」の期待値や、標本分散の期待値を考えることになります。標本平均の期待値がもし母平均と一致していれば、標本平均は不偏推定量であるという言い方をします。実際、標本平均の期待値を計算すると母平均に一致するので、標本平均は不偏推定量です。分散の場合はどうでしょうか。標本分散の期待値を計算すると、実は母分散とは一致しません。なので標本分散(nで割る方)は不変推定量ではないのです。じゃあ、母分散の不偏推定量になっているのは、どのような量なのでしょうか?実はn-1で割る方が、期待値を計算したときに母分散に一致するので、不偏推定量になっているのです。このことから、n-1で割る定義のほうを不偏分散と呼ぶわけです。不偏推定量になっている分散なので不偏分散と呼ぶ、なるほど納得です。

標本分散の期待値を実際に計算してみると、このことが良くわかります。母分散がσ^2だったとして、標本分散s^2の期待値を計算すると、

期待値E[s^2] = …. = (n-1)/n σ^2 となります。母分散であるσ^2には一致せず、(n-1)/n という係数がかかるという違いがあるわけです。なので(n-1)/n の逆数であるn/(n-1)を標本分散にかけておけば、つまり、

n/(n-1)1/n Σ (xi-m)^2 = 1/(n-1) Σ (xi-m)^2 なる数を考えれば、その期待値は母分散に一致します。なので、不偏分散 1/(n-1) Σ (xi-m)^2 は、 分母にn-1が来ているのです。

これらの議論は少し詳しい統計の教科書や数理統計学の教科書に説明されています。自分が参考にしたのは、松本裕行・宮原孝夫『数理統計学入門』学術図書出版社(1990年)です(72ページ目)。

 

柳井 晴夫『多変量データ解析法―理論と応用』 朝倉書店

柳井 晴夫『多変量データ解析法―理論と応用』(行動計量学シリーズ)1994/12/1 朝倉書店 を図書館で借りて読みましたが、多変量解析で用いられる手法の数学的な理論の解説でした。線形代数を知らない人にはチンプンカンプンの書物でしょう。目次は、

1. 多変量データ解析概論
1.1 多変量データ解析とは
1.2 多変量データ解析の各種方法
1.3 多変量データ解析の最近の動向
2. 基本的数理
2.1 ベクトルによる分散と相関の表現
2.2 多変量データとその行列による表現
2.3 質的データの相関
2.4 多変量データ間の距離
2.5 確率変数による分散共分散行列とその表現
3. 多変量データの構造分析
3.1 主成分分析
3.2 主成分分析の利用法
3.3 データが類似度で与えられる場合の分析法
4. 予測と判別
4.1 重回帰分析
4.2 重回帰分析の諸問題
4.3 多変量回帰分析
4.4 判別分析
5. 多群の変量間の関連分析―正準相関分析
5.1 正準相関分析
5.2 正準相関分析の諸性質(その1)
5.3 正準相関分析の諸性質(その2)
5.4 正準相関分析の適用例
5.5 正準相関分析における新展開
6. 質的データの数量化―数量化理論と関連手法
6.1 数量化の基本概念
6.2 数量化Ⅰ,Ⅱ類
6.3 数量化Ⅲ類と対応分析
6.4 偏対応分析とその性質
6.5 その他の話題―対応分析の新しい展開
7. 潜在変数分析―因子分析と共分散構造分析
7.1 潜在変数モデルとは
7.2 因子分析法
7.3 共分散構造分析
7.4 項目反応理論
8. その他の手法
8.1 多重配列データの解析法
8.2 生存時間データに関する多変量データ解析
8.3 多変量解析の応用と多変量解析パッケージ
9. 付録:数学的性質
9.1 ベクトルの行列
9.2 固有値,固有ベクトルとその性質
9.3 直交射影行列とその性質
9.4 一般逆行列とその性質
9.5 一般逆行列と射影行列
9.6 行列の諸性質

数学を用いて、多変量解析の種々の技法を数学的な原理からスッキリと理解したい人向け。自分には読むのが極めて困難な本でした。

多変量解析に関する入門書 お勧め、定番、超初心者向けなど

医学研究を進めるうえで医療統計学の知識、特に多変量解析の知識が欠かせません。SPSSなどのソフトにただデータを入れれば、何かしらの結果は出ますが、それだと結果の解釈の段階で途方にくれてしまいます。やはり多変量解析の原理的な部分を抑えておく必要があるでしょう。どれだけ数学的なバックグラウンドがあるか、数学的な原理から理解したいという動機があるかによって、お勧めの教科書は変わってきます。

一口に多変量解析の教科書といっても、対象とする読者は数学的な原理はともかく使えればいい人、定理の厳密な証明はいいけど数学的な基礎はある程度理解しておきたい人、仕事ですぐに使いたい人、統計学を勉強中の理系大学生・大学院生、勉強する時間があまり取れない実務に携わる多忙な社会人など様々なので、自分が想定された読者なのかどうかを判断する必要があります。

線形代数がメインの書籍はまた別記事にします。

→ 多変量解析を理解するための線形代数の教科書

Rによる多変量解析入門

川端 一光, 岩間 徳兼, 鈴木 雅之『Rによる多変量解析入門 データ分析の実践と理論』オーム社  July 19, 2018

手元にデータがあってすぐに分析をしたい人にピッタリの本。理論的な説明はないかわりに、結果の解釈の際の注意事項の説明が詳細。説明の順番は、データの解析、結果、解釈や数学的な理屈の順になっています。Rそのものに関しては紙面をあまり割いていないので、pythonで勉強したい人にとっても紙面が無駄になっておらず、ためになります。数学的な理屈に関してはおいおい勉強するとして、とりあえず仕事ですぐに多変量解析をやらなきゃいけない人にとってはベストの教科書ではないでしょうか。

出版社の書籍紹介によれば、

多くの多変量解析についての学習書は、理論的な説明に終始し、実務場面でどのように利用されているかについて、殆ど配慮がないのが現状です。そこで本書は、多変量解析手法の理論と実践をバランスよく解説することで、統計が得意ではない大学生や実務者にも利用しやすい構成とし、本書1冊で多変量解析手法を実務に応用できるまで習得できる内容となっています。

とのことですが、看板に偽りなしです。目次は、以下の通り。

第Ⅰ部 多変量解析の基礎
第1章 多変量解析の基礎を学びたい―R による多変量データの基本的な統計処理
第2章 R によるデータハンドリングを学びたい ―アンケートデータと ID-POS データのハンドリング
第Ⅱ部 量的変数の説明・予測
第3章 現象を説明・予測する統計モデルを作りたい (1) ―重回帰分析
第4章 現象を説明・予測する統計モデルを作りたい (2) ―階層的重回帰分析
第5章 さまざまな集団から得られたデータを分析したい―マルチレベルモデル
第6章 複雑な仮説を統計モデルとして表したい (1)―パス解析
第Ⅲ部 心理尺度の分析
第7章 心理尺度を開発したい (1) ―探索的因子分析
第8章 心理尺度を開発したい (2) ―確認的因子分析
第9章 複雑な仮説を統計モデルとして表したい (2) ―潜在変数を伴うパス解析
第Ⅳ部 質的変数の説明・予測
第10章 クロス集計表をもっとていねいに分析したい―対数線形モデル
第11章 カテゴリに所属する確率を説明・予測したい―ロジスティック回帰分析
第Ⅴ部 個体と変数の分類
第12章 似たもの同士にグループ分けしたい―クラスター分析
第13章 質的変数間の連関を視覚化したい―コレスポンデンス分析
第Ⅵ部 多変量解析を使いこなす
第14章 データが持つ情報を視覚化したい―パッケージggplot2による描画
第15章 多変量解析を実践で生かしたい―手法の組み合わせ

 

多変量解析入門

小西 貞則『多変量解析入門――線形から非線形へ』January 27, 2010 岩波書店

目次

  1. 1 はじめに 1.1 現象のモデル化 1.2 識別・判別 1.3 次元圧縮 1.4 分類
  2. 2 線形回帰モデル 2.1 2変数間の関係を捉える 2.2 多変数間の関係を捉える
  3. 3 非線形回帰モデル 3.1 現象のモデル化 3.2 基底関数に基づくモデル 3.3 基底展開法 3.4 正則化法
  4. 4 ロジスティック回帰モデル 4.1 リスク予測モデル 4.2 複合リスク予測モデル 4.3 非線形ロジスティック回帰モデル
  5. 5 モデル評価基準 5.1 予測誤差に基づく評価基準 5.2 情報量基準 5.3 ベイズ型モデル評価基準
  6. 6 判別分析 6.1 フィッシャーの線形判別 6.2 マハラノビス距離に基づく判別法 6.3 多群判別 6.4 変数選択 6.5 正準判別
  7. 7 ベイズ判別 7.1 ベイズの定理 7.2 ベイズ判別法 7.3 ロジスティック判別
  8. 8 サポートベクターマシーン 8.1 分離超平面の構成 8.2 線形分離可能でない場合のテクニック 8.3 線形から非線形へ
  9. 9 主成分分析 9.1 主成分の構成 9.2 カーネル主成分分析
  10. 10 クラスター分析 10.1 階層的分類法 10.2 非階層的分類法 10.3 混合分布モデル
  11. 付録A ブートストラップ法 付録B ラグランジュの未定乗数法 付録C EMアルゴリズム

著者の略歴は、広島大学理学部数学科卒、文部省統計数理研究所を経て九州大学大学院数理学研究院教授。専門は,非線形多変量解析,情報量統計学(岩波書店)。

アマゾンのレビューを読むと、データから数理モデルを組み立てるというアプローチとして多変量解析が解説されている、モデルを線形から非線形に拡張するように丁寧な議論となっていて、特にSVMの解説は分かりやすい、数式は多いが、出てくる数式や式展開は、パターン化していてしかも数学的な説明が丁寧なので、読みやすく大変理解しやすいとのこと。

 

多変量解析法入門

永田 靖, 棟近 雅彦『多変量解析法入門』 (ライブラリ新数学大系) サイエンス社 April 1, 2001

アマゾンのレビューを読む限り、数学が苦手な人でも追えるような丁寧さで、数式によって説明を進めているそう。目次は、

  1. 1 多変量解析法とは 1.1 多変量データ 1.2 重回帰分析とは 1.3 数量化1類とは 1.4 判別分析とは 1.5 数量化2類とは 1.6 主成分分析とは 1.7 数量化3類とは 1.8 多次元尺度構成法とは 1.9 クラスター分析とは
  2. 2 統計的方法の基礎知識 2.1 データのまとめ方 2.2 確率分布 2.3 検定と推定 練習問題
  3. 3 線形代数のまとめ 3.1 行列とベクトル 3.2 固有値と固有ベクトル 3.3 ベクトルによる微分 3.4 変数ベクトルによる期待値と分散・共分散 練習問題
  4. 4 単回帰分析 4.1 適用例と解析ストーリー 4.2 解析方法 4.3 行列とベクトルによる表現 練習問題
  5. 5 重回帰分析 5.1 適用例と解析ストーリー 5.2 説明変数が2個の場合の解析方法 5.3 説明変数がp個の場合の解析方法 5.4 行列とベクトルによる表現 練習問題
  6. 6 数量化1類 6.1 適用例と解析ストーリー 6.2 説明変数が1個の場合の解析方法 6.3 説明変数が2個以上の場合の解析方法 6.4 説明変数に量的変数と質的変数が混在する場合 練習問題
  7. 7 判別分析 7.1 適用例と解析ストーリー 7.2 変数が1個の場合の解析方法 7.3 変数が2個以上の場合の解析方法 7.4 行列とベクトルによる表現 練習問題
  8. 8 数量化2類 8.1 適用例と解析ストーリー 8.2 説明変数が1個の場合の解析方法 8.3 説明変数が2個以上の場合の解析方法 8.4 説明変数に量的変数と質的変数が混在する場合
  9. 9 主成分分析 9.1 適用例と解析ストーリー 9.2 説明変数が2個の場合の解析方法 9.3 説明変数がp個の場合の解析方法 9.4 行列とベクトルによる表現
  10. 10 数量化3類 10.1 適用例と解析ストーリー 10.2 数量化3類の基本的な考え方と解析方法 練習問題
  11. 11 多次元尺度構成法 11.1 適用例と解析ストーリー 11.2 非計量MDSの解析方法 11.3 計量MDSの考え方 練習問題
  12. 12 クラスター分析 12.1 適用例と解析ストーリー 12.2 変数が2個の場合のクラスター分析 12.3 変数がp個の場合のクラスター分析 12.4 クラスター間の距離 12.5 ウォード法 練習問題
  13. 13 その他の方法 13.1 パス解析 13.2 グラフィカルモデリング 13.3 因子分析 13.4 正準相関分析 13.5 多段層別分析 練習問題

 

多変量データ解析

杉山 高一 (著), 小椋 透 (著), 藤越 康祝『多変量データ解析』 (シリーズ“多変量データの統計科学”)  朝倉書店  November 25, 2014

出版社の説明によれば、

シグマ記号さえ使わずに平易に多変量解析を解説する」という方針で書かれた’83年刊のロングセラー入門書に,因子分析正準相関分析の2章および数理的補足を加えて全面的に改訂。主成分分析,判別分析,重回帰分析を含め基礎を確立。

とのこと。数学恐怖症の人向けのようです。

もくじ

  1. 1 相関係数 1.1 成績データの相関係数 1.2 手のデータの相関係数 1.3 相関係数の安定性 1.4 分散と共分散 1.5 数理的補足–相関係数
  2. 2 主成分分析 2.1 主成分分析とは 2.2 共分散行列による主成分分析–手のデータ 2.3 相関行列による主成分分析(1) –成績のデータ 2.4 相関行列による主成分分析(2)–被服のデータ 2.5 因子負荷量–漢字テストの分析 2.6 歯の咬耗度に基づく主成分分析 2.7 主成分スコア低次元空間表現 2.8 主成分軸の回転 2.9 固有値の信頼区間 2.10 固有ベクトルの信頼性 2.11 数理的補足–主成分分析
  3. 3 判別分析 3.1 判別分析とは 3.2 マハラノビスの距離 3.3 判別分析の考え方 3.4 2変量の判別分析 3.5 線形判別関数 3.6 多変量の判別分析–筆跡鑑定のデータ 3.7 変数選択による判別分析–逐次法(1) 3.8 変数選択による判別分析–逐次法(2) 3.9 変数選択による判別分析–AIC 規準・誤判別確率 3.10 線形判別分析の頑健性 3.11 逐次法における規準値とAIC 規準 3.12 数理的補足–判別分析
  4. 4 重回帰分析 4.1 重回帰式とは 4.2 1変数の場合の回帰式 4.3 2変数の回帰分析 4.4 残差分散, 重相関係数 4.5 回帰係数の信頼区間 4.6 多重共線性 4.7 説明変数の選択–逐次法 4.8 説明変数の選択–AIC とCp 4.9 逐次法における規準値とAIC 規準 4.10 主成分回帰 4.11 偏相関係数 4.12 数理的補足–重回帰分析
  5. 5 因子分析 5.1 因子分析とは 5.2 因子分析モデルと回転 5.3 推測法 5.4 白人の手のデータ 5.5 数理的補足–因子分析
  6. 6 正準相関分析 6.1 正準相関とは 6.2 正準相関–成績のデータ 6.3 寄与率と次元 6.4 正準相関分析–歯の咬耗度データ 6.5 正準相関の安定性 6.6 数理的補足–正準相関
  7. A 行列・固有値 A.1 行列 A.2 多変量データと基礎統計量の行列表示 A.3 行列式と逆行列 A.4 固有値・固有ベクトル
  8. B 多変量分布 B.1 身長の分布と正規分布 B.2 2次元正規分布 B.3 数理的補足–多変量正規分布

 

数量化1類、ダミー変数を用いた重回帰分析の実際

男か女かといった質的変数は、重回帰分析の独立変数に用いるときには、ダミー変数として取り扱います。性別という「アイテム」において、「男」というカテゴリー変数は1か0の値を通り、男なら1、男でなければ0とします。同様に、「女」というカテゴリー変数は1か0の値をとり女なら1、女でなければ0になります。ある人に関して、性別のアイテムの行は、カテゴリー変数男とカテゴリー変数女の和は1になるわけです。カテゴリー変数が複数の場合も、同様に和は1になります。例えば「曜日」という「アイテム」で、カテゴリー変数「月曜日」は1か0、「火曜日」も1か0という具合です。あるデータに関しては、いずれかの曜日なのでどれかの曜日が1で他の曜日が0とい値になっており、和は1です。こうして作ったダミー変数を重回帰分析の独立変数として用いればよいわけです。ただし、独立変数は独立であってほしいわけですが、こうやってつくったダミー変数は明らかに「カテゴリー変数の数―1」個のカテゴリーが決まれば、残りの一個は決まってしまいます(和が1になるようにつくったので)ので、ひとつのカテゴリー変数は除去しておく必要があります。

ダミー変数の作り方と作る際の注意

あるアイテム変数の持つ情報をダミー変数で表現するとき、アイテム変数がk個のカテゴリーを持つ場合には、0か1かのいずれかを持つ二値データk個のダミー変数に展開される。例えば、あるアイテム変数がiという値を持つ場合、i番目のダミー変数は値1を持ち、残りのダミー変数は値0を持つ。表1に示したデータ中の3つのアイテム変数のデータは、表2のように、延べ9個のダミー変数(D11,…,D33)に展開されるしかし、このダミー変数は冗長な情報を持つ。例えば、k−1個のダミー変数が0であるとき、残りの1個のダミー変数は必ず1である。そこで、多変量解析においては、各アイテム変数に対応する複数のダミー変数のうちの1つを除いて解析に使用する。どのダミー変数を除いてもよい(数量化 I 類はダミー変数を用いた重回帰分析である 青木繁伸 2005 年 10 月 17 日)

下のB表はカテゴリーデータを1,0の数量データに変換したものです。‥ このデータは、曜日の7列のデータを合計すると、どの日も1となります。(天候、巨人勝敗、競馬についても同様です。)そこで、4項目からそれぞれ任意の1列を削除します。この例では、曜日は土、天候は雨、巨人勝敗は無、競馬は無の最後の列を削除しました。(《数量化1類(2/3) 》 カテゴリースコアの求め方 アイスタット)

ダミー変数は「1か0(ゼロ)」の2つの値しかとりません。「1」は「○○である」、「0」は「○○でない」ということを表します。「○○」を「合格」とすれば「1=合格/0=不合格」、「不合格」とすれば「1=不合格/0=合格」ということになります。(ロジスティック回帰分析(4)─ダミー変数 統計WEB)

カテゴリーが k種類あれば,k-1個のダミー変数を用意する。上の例でダミー変数を一個だけ用意して,鉄骨=0,軽量鉄骨=1,木造=2のようにしてはいけない。(アパートの家賃(2) ダミー変数を用いた重回帰分析 cuc.ac.jp)

データ: 従属変数と独立変数は量的でなければなりません。宗教、専攻、居住地区などのカテゴリー変数は、2 値 (ダミー) 変数またはその他の種類の対比変数として再割り当てする必要があります。(IBM SPSS Statistics Base 26

3カテゴリーの時に、ダミー変数を3つ作らないように注意。(分析実習資料 2021/06/ SPSSによる重回帰分析 村瀬 洋一)

https://geolog.mydns.jp/www.geocities.jp//databooster2/mydoc/sreg-qt1.pdf

SPSSを用いた解析

具体的な例が説明されている本としては、内田治著『SPSSによる回帰分析』(オーム社 平成25年8月23日第1版)があります。第4章 質的変数とダミー変数 としてかなりのページ数を割いて実際に適用した例が示されています。

『SPSSによる回帰分析』目次

  1. 第1章 回帰分析入門 1.1 回帰分析の概要 回帰分析とは 回帰分析の用語 回帰分析の用途 1.2 回帰分析におけるデータ データの種類 測定の尺度 変数の種類
  2. 第2章 単回帰分析 2.1 単回帰分析の基本 例題1 回帰式 回帰式の有意性 回帰式の有効性 母回帰係数の信頼区間 2.2 残差の検討 個々の残差 残差のヒストグラム 標準化残差の正規確率プロット 2.3 区間推定 母回帰式の信頼区間 個々のデータの予測区間 2.4 SPSS の手順 単回帰分析 散布図
  3. 第3章 重回帰分析 3.1 重回帰分析における予備的解析 例題2 3.1.1 1変数の解析 要約統計量 データのグラフ化 3.1.2 2変数の解析 相関行列 散布図行列 3.1.3 説明変数ごとの単回帰分析 x1による単回帰分析 x2による単回帰分析 x3による単回帰分析 x4による単回帰分析 単回帰分析のまとめ 3.2 重回帰分析の実際 3.2.1 重回帰分析の基本 回帰式 回帰式の有意性 回帰式の有効性 回帰係数の有意性 標準偏回帰係数 3.2.2 残差の検討 個々の残差 残差のヒストグラム 3.2.3 回帰診断 てこ比 Cook の距離 DfBeta 3.2.4 相互検証法とリサンプリング法(1)予測精度の検証 Hold out 法 K-fold 法 Leave-One-Out 法(2)回帰係数の検証 Jackknife 法 Bootstrap 法 3.3 SPSS の手順 要約統計量 ヒストグラム・箱ひげ図・幹葉図 ドットプロット 相関行列 散布図行列 3次元散布図 単回帰分析 重回帰分析 回帰診断 Bootstrap法
  4. 第4章 質的変数とダミー変数 4.1 質的変数を含んだ回帰分析 例題3 データのグラフ化 4.1.1 質的変数とダミー変数 4.1.2 ダミー変数の使い方 数値例1 数値例2 数値例3 4.1.3 カテゴリの数が3 つ以上のダミー変数 4.1.4 ダミー変数の作成 4.2 数量化理論Ⅰ類と共分散分析 4.2.1 数量化理論Ⅰ類 例題4 4.2.2 一般線形モデル 4.2.3 共分散分析 例題5 質的変数を含んだ重回帰分析 データのグラフ化 ダミー変数による重回帰分析の結果 共分散分析の結果 4.3 SPSS手順
  5. 第5章 回帰分析における説明変数の選択 5.1 変数選択の方法 5.1.1 変数選択の必要性 重要な変数と不要な変数 良い回帰式 説明変数の選択方法 変数選択の基準 5.1.2 ステップワイズ法 例題6 変数選択基準の設定 ステップワイズ法の結果 5.1.3 ベストサブセット法 5.2 説明変数の組合せで生じる問題 5.2.1 多重共線性 多重共線性とは 許容度 VIF 例題7 説明変数同士の相関行列 説明変数ごとの単回帰分析 回帰係数の符号逆転 5.2.2 解の一意性 例題8 5.2.3 欠損値の扱い 例題9 リストごとに除外した解析結果 ペアごとに除外した解析結果 平均値で置き換えた解析結果 5.3 SPSS の手順 重回帰分析(ステップワイズ法) ベストサブセット法
  6. 第6章 ロジスティック回帰分析 6.1 ロジスティック回帰の基本 6.1.1 ロジスティック回帰とは 例題10 ロジスティック回帰の概念 データのグラフ化 ロジスティック回帰の結果 6.1.2 完全分離 例題11 6.1.3 SPSS の手順 6.2 ロジスティック回帰の実践 6.2.1 多重ロジスティック回帰 ロジスティック回帰の種類 例題12 ロジスティック回帰の結果 データのグラフ化 ロジスティック回帰の結果 6.2.2 変数選択 変数選択の方法 変数選択の結果 6.3 SPSS の手順 ロジスティック回帰 ロジスティック回帰(尤度比による変数減少法)
  7. 第7章 生存分析とCox 回帰 7.1 生存分析 7.1.1 Kaplan- Meier 法による生存率曲線 例題13 生存分析とは 生存率 生存率曲線 7.1.2 生存率曲線の比較と検定 例題14 2つの生存率の違いに関する検定 ログランク検定の結果 7.2 Cox 回帰 7.2.1 比例ハザードモデル 例題15 比例ハザードモデル Cox回帰の結果 7.2.2 複数の説明変数を含むCox 回帰 例題16 複数の説明変数 7.3 SPSS の手順 Kaplan- Meier 法による生存率曲線の作成 ログランク検定 Cox 回帰 複数の説明変数を含むCox 回帰
  8. 第8章 パス解析と因果分析 8.1 因果関係の解析 8.1.1 説明変数間の因果関係 因果関係の整理 8.1.2 パス解析の概念 パス図 パス解析 8.2 パス解析の実際 8.2.1 回帰分析を用いたパス解析 x1を説明変数、x2を目的変数とする回帰分析 x1を説明変数、x3を目的変数とする回帰分析 x2とx3を説明変数、x4を目的変数とする回帰分析 x4を説明変数、yを目的変数とする回帰分析 8.2.2 共分散構造分析を用いたパス解析 共分散構造分析 AMOS による解析結果

参考

  1. SPSSにおけるカテゴリー変数のとりあつかい 2012年
  2. 04. 重回帰分析 京都大学 加納 学

共分散構造分析とは:講義ノート(チュートリアル)や解説書などの紹介

複数の要因(独立変数)で、「結果」がどのように説明できるかを調べる手法が重回帰分析ですが、重回帰分析においては、個々の独立変数が互いに影響しあっていない(多重共線性が無い)ことが必要です。しかし多くの場合には、互いに影響しあっているため、それを考慮できる方法としてパス解析があります。パス解析では観測できる量だけからなる独立変数、従属変数の関係性を調べますが、さらには、直接には観測できない量(例えば、性格の朗らかさ)も想定した関係性を調べたい場合に、共分散構造分析が使われます。

共分散構造分析という言葉は、構造方程式モデリング(Structural equation modeling; SEM)とほぼ同義に使われているようです。共分散分析(ANCOVA)は共分散構造分析と名前が似ていて紛らわしいですが別物のようです。

  1. 共分散構造分析の基礎と実際—-基礎編—-狩野 裕(大阪大学大学院人間学研究科 2002年11月11日SSJデータ・アーカイブ  第66回公開セミナー: StructuralEquationModeling構造方程式モデル(モデリング)–近年は共分散構造分析よりもメジャーな名称

共分散構造分析とは

  1. 共分散構造分析を行う際は最初に仮説を立て、構造モデルを作る必要があります。
  2. 仮説を立ててモデルを作ったものの、想定した要素を表すデータがとれないと共分散構造分析を行うことができません
  3. 共分散構造分析はたくさんの要素間の関係性を一度に計算することができます。これは相関分析や重回帰分析などではできないことで、共分散構造分析の最大のメリットです。
  4. CFIの値はこのモデルの適合度(妥当性)を表す指標の一つで、0から1までの範囲に収まります。1に近いほど適合が良く、一般には0.95以上であればよいモデルと判断します。

https://www.nttcoms.com/service/research/dataanalysis/sem/  NTTコムオンライン

共分散構造分析とは、わかりやすく言うと、直接観測できない「潜在変数」を導入し、導入した潜在変数と観測変数との間の因果関係を同定する統計学的手法のことです。

  1. 共分散構造分析の基礎と実際—-基礎編—- SSJデータ・アーカイブ第6回公開セミナー 2002年年11月月11日
  2. 共分散構造分析の基礎と実際—-応用編—- 狩野 裕(大阪大学大学院人間学研究科)
  3. 共分散構造分析 多変量解析の手法別解説 統計分析研究所アイスタット

共分散構造分析と重回帰分析との違い

単回帰分析、重回帰分析、パス解析、共分散構造分析(SEM)の違いは、下のサイトの図がわかりやすい。

  1. 単回帰分析・重回帰分析・共分散構造分析とパス解析 GMORESEARCH

従属変数(結果)が1個、独立変数(要因)が1個でそれらの関係を調べるのが単回帰分析。要因が複数、つまり独立変数が複数あってそれらと従属変数との関係を調べるのが重回帰分析。独立変数同士にも関連性があることを想定した解析手法が、パス解析。測定可能ではない量「潜在変数」まで考えて関連性を調べることができるのが共分散構造分析ということになります。

共分散構造分析におけるパス解析(パス図)とは

仮説的なパス図を描く上での決め事があります。アンケート調査や観測によって得られたデータを「観測変数」といい、 パス図では四角に囲んで表現します。また、アンケート調査や観測では得られなかったが、仮説的に存在するであろうと思う変数項目を 「潜在変数」と言い、パス図では楕円で囲んで表現します。因果関係において原因に当たる変数を「原因項目」、 結果に当たる変数を「結果項目」とし、それぞれを矢印の始点と終点で結びます。原因項目同士の因果関係を表す場合、 その項目間の時間的な意味を勘案して時間的に前にある項目を始点とします。

https://www.cross-m.co.jp/analysis/amos/

  1. パス解析 日経リサーチ
  2. 顧客理解を可能とするパス解析|因果関係を徹底的に探る KOTODORI
  3. 分析2:調在データの分析 人工知能学会誌21巻5号(2006年9月
  4. パス解析とは?共分散構造分析との違いもわかりやすく解説2021年10月04日 GMO RESEARCH https://gmo-research.ai/research-column/path-analytics

構造方程式モデリングとは

  1. SEMは心理学に何をもたらしたか? The Annual Report of Educational Psychology in Japan2020, Vol. 59, 292-303 ・時流に乗った,数学的には高度な新しい分析法を使った,脱常識性が感じられない研究,データと大きく乖離した主張をしている研究の量産 ・時流に乗った,数学的には高度な新しい分析法を使った研究が優れた研究であるという思い込み(?)の蔓延 ・データの収集法に関して工夫をして,脱常識性の高い因果関係を提示しようとする姿勢の阻害・相関と因果,測定の妥当性,相関的研究における変動因の問題などの,心理学にとって基本的で非常に重要なことを踏まえない傾向の助長
  2. 製品開発のためのマーケティングリサーチへの構造方程式モデリングの応用
  3. SEMによる因果分析入門–パス解析から傾向スコアまで– 大阪大学 大学院基礎工学研究科 狩野 裕
  4. 産後の抑うつ状態の複雑な予測

共分散構造分析の手順

SPSSによる共分散構造分析

Rによる共分散構造分析

『共分散構造分析 R編』

pythonによる共分散構造分析

エクセルによる共分散構造分析

共分散構造分析の教科書

『共分散構造分析 入門編』

『共分散構造分析 応用編』

『共分散構造分析 疑問編』

SPSSとAmosによる心理・調査データ解析

小塩真司『SPSSとAmosによる心理・調査データ解析 : 因子分析・共分散構造分析まで』第3版  東京図書, 2018.

図解でわかる共分散構造分析

涌井良幸, 涌井貞美『図解でわかる共分散構造分析 : データから「真の原因」を探り出す新しい統計分析ツール』日本実業出版社, 2003.

 

参考

  1. 統計分析法の分類  予測・説明関係を検討する統計的検定法の分類 予測・説明関係を検討する多変量データ解析法の分類
  2. 看護学における多変量解析の利用―国内文献の検討結果から― 飯島 純夫
  3. 高等教育研究のための計量手法の整理 中尾走、樊怡舟 広島大学大学院教育学研究科 広島大学高等教育研究開発センター(RIHE)では,大学教員に対する調査がこれまで何度も行われており,研究生産性というテーマで大学教員の論文数を従属変数にして分析
  4. 構造方程式モデリングは,因子分析,分散分析,パス解析のすべてにとって代わるのか? 狩野 裕 行動計量学 第29巻第 2号 (通巻57号)2002年,138~159
  5. 「討論:共分散構造分析」の特集にあたって 豊田秀樹  行動計量学 第29巻第 2号 (通巻57号)2002年,135~137

 

 

数量化I類:量的結果を説明する要因を同定するための多変量解析

アウトカムが連続変数で、原因となっている因子の候補がカテゴリー変数(有か無か)で複数ある場合にどの因子の寄与が一番大きいのかを調べたい、そんなときにつかう多変量解析の手法が、「数量化I類」と呼ばれるものです。

多変量解析と一言でいっても条件によって選ぶべき手法は異なりますので、混同しないことが大事。要因(説明変数、独立変数)と結果(従属変数、目的変数)が、連続的な数なのかそれともカテゴリー変数なのかに着目すると、選ぶべき多変量解析の手法が自ずと定まります。

多変量解析の手法の選択基準

独立変数:連続量、従属変数:連続量なら、重回帰分析

独立変数:連続量、従属変数:カテゴリーなら、判別分析

独立変数:カテゴリー、従属変数:連続量なら、数量化I類

独立変数:カテゴリー、従属変数:カテゴリーなら、数量化II類

となります。

  1. 第4章多変量解析4.外的基準が分類の場合の分析方法(https://www.bunkyo.ac.jp/~hotta/lab/courses/2003seminar/ch4-4_5_hotta.pdf)
  2. 統計分析法の分類(https://www.educa.nagoya-u.ac.jp/~ishii-h/materials/analysis_methods.pdf)

数量化1類では、独立変数がカテゴリーですがそれをダミー変数に置き換えてしまうので、そうなるとあとは重回帰分析と全く同じということになります。ダミー変数というのは例えばアンケート調査項目で、リンゴの嗜好に関して好き、普通、嫌いという選択肢があった場合に、回答者の回答で該当するものを1、他を0といった具合に、一つだけ1にして後は0にしてしまうものです。ここで、「好き」、「普通」、「嫌い」はカテゴリー変数と呼ばれます。「リンゴの嗜好」という項目のことは、アイテムと呼ばれます。

 

判別分析とロジスティック回帰分析との違い

連続量⇒カテゴリー という流れでいうと、判別分析とロジスティック回帰分析は似ていますが、何が違うのでしょうか。

  1. 判別分析とロジスティック回帰分析について CGL通信 vol39 「多変量解析の宝石学への応用」
  2. ロジスティック回帰 アイスタット ロジスティック回帰分析と似ている多変量解析に判別分析があります。‥ 両者の違いを調べてみます。

数量化I類を適用できる例数

  1. 多変量解析の手法別解説>数量化1類 アイスタット 個体数>カテゴリー総数-説明変数個数+1

数量化I類を適用する具体的な事例

多変量解析の手法別解説>数量化1類 アイスタット

目的変数:海外旅行回数

説明変数:性別(男性、女性)、年齢(若年、中年、高年)、血液型(A,B,O,AB) (カテゴリー総数=2+3+4=9、説明変数の個数=3)

目的変数:1日の新聞売り上げ部数

説明変数:曜日(月・火・水・木・金・土・日)、天候(晴・雨・小雨)、前日の野球の試合での巨人の勝敗(勝・負)、当日および前後の競馬の有無(有・無)

数量化1類 日経リサーチ

目的変数:立候補者の得票率

説明変数:政党(自民・民進・無所属)、職歴(元・現・新)、性別(男・女)

https://www.bunkyo.ac.jp/~hotta/lab/courses/2003seminar/ch4-3_huang.files/frame.htm

目的変数:英語の小テストの点

説明変数:英語が好きかどうかの質問

 

多変量解析の教科書

  1. 柳井 晴夫, 竹内 啓『射影行列・一般逆行列・特異値分解』(UP応用数学選書10 )新装版  2018/9/25  東京大学出版会 多変量解析の数学的な原理である線形代数を学ぶのに良さげな本。
  2. 足立 堅一『多変量解析入門』2005/12/20  ‎ 篠原出版新社 多変量解析の数学的な基盤である線形代数をわかりやすく解説した本。多変量解析への応用という強いモチベーションを持ちつつ、線形代数が学べるという点に特色があるのかも。
  3. 柳井晴夫『多変量データ解析法 理解と応用』(行動計量学シリーズ8)朝倉書店1994年12月5日定価3399円(本体3300円)図書館で借りて読みましたが、多変量解析の手法が網羅的に解説されています。数学的な根拠も説明されています。巻末の16ページに、本書で用いた線形代数の定理が簡潔にまとめられており、必要な数学を俯瞰できて便利。数量化I類の説明は103~105ページ
  4. 柳井 晴夫, 高根 芳雄『多変量解析法』 (現代人の統計) 新版 1985/6/1 朝倉書店
  5. 竹内啓, 柳井晴夫『多変量解析の基礎―線型空間への射影による方法』1972年 東洋経済新報社

新型コロナウイルス変異株オミクロンとCOVID-19パンデミック収束の期待

新型コロナウイルス蔓延によるCOVID-19により世界の生活が全て一変してしまいましたが、最近興ってきた変異株オミクロンは病原性がデルタ株などよりも弱くて感染力は強いので、デルタ株などを駆逐して、COVID-19パンデミックを収束に向かわせるのではないかという期待感があるようです。

WASHINGTON (TND) — The World Health Organization is predicting the omicron variant could change the course of the pandemic. WHO Director-General Tedros Adhanom Ghebreyesus says the exact impact is “still difficult to know,” as recent reports suggest the variant appears to be less mild. “This actually is very encouraging news. The World Health Organization so far says there has not been one reported death from omicron in the world,” said Dr. Jeffrey Singer to The National Desk’s Jan Jeffcoat. “Since this appears to be four times more contagious than a delta variant, hopefully, this will crowd out the delta variant eventually.” Singer says COVID-19 could become nothing more than a recurring endemic cold. (Omicron variant could change COVID-19 to just a ‘recurring endemic cold,’ says doctor by ELISSA SALAMY, The National DeskFriday, December 10th 2021 thenationaldesk.com)

 

  1. オミクロン株は「終わりの始まり」説 コロナとの戦い、もうすぐ終了の期待 2021年12月10日20時10分 J-CASTトレンド  米ブルームバーグも同日、「オミクロンは感染力がこれまでの変異株よりも強い可能性がある一方、初期の報告によれば致死性は低いともみられる。これは歴史的に観察されたウイルスの進化パターンに合致している」「オミクロン株は新型コロナパンデミックの終焉(しゅうえん)が近いことを示唆している可能性がある」という米国大手証券会社の専門家の見方を伝えた。

2本以上の直線で部分的に近似する方法 複数の回帰直線の境界の同定

実験して得れた2つのパラーメータの関係を、散布図をプロットしてなんでもかんでも直線で近似してしまう例を見かけます。どんなランダムなデータでも最小二乗法の計算は可能なので、なんらかの直線は引けてしまいますし、相関係数なども計算できてしまいます。しかし、パッと見が直線関係に見えないデータに対して、回帰直線を引くことになんの意味があるのでしょうか。実験者の頭の中に、これとこれとが相関していて欲しい、これがこれの原因であって欲しいという気持ちがあるために、無理やり直線を引いてしまっているのではないかと思われる場合があります。

どんな曲線(直線)でデータを表すのかは、研究者の恣意的な判断です。Uの字型のデータ分布に直線を当てはめるのはナンセンスでしょう。つまり、カーブフィッティングの際の近似式の選択は、実験者の仮説が入り込んでいるわけです。

一本の直線で表すのは無理そうでも、部分部分でみると直線性があることがあります。だったら、区間を分けて複数の直線を当てはめてみるのも一つの手です。もちろん、そうする動機、すなわち仮説、すなわちデータの分布に対する合理的な説明(仮説)が存在するという前提です。

この解析手法で用いられる関数の名前は英語では、piece-wise linear functionと呼ぶようです。piece-wise linear functionでグーグル検索すると多数のサイトがヒットしました。

複数の直線によるフィッティング

https://www.codeproject.com/Articles/5282014/Segmented-Linear-Regression

https://datacadamia.com/data_mining/linear_spline

http://yetanothermathprogrammingconsultant.blogspot.com/2018/03/piecewise-linear-regression.html

https://slidetodoc.com/chapter-9-special-topics-in-regression-optional-copyright/

複数の直線による回帰の方法(Python利用例)

区間に分けて直線回帰を行うことは英語だと、piecewise linear regressionというようです。ピースワイズ、つまり「部分ごとに」ということ。

  1. How to apply piecewise linear fit in Python? stack overflow

 

https://datascience.stackexchange.com/questions/8457/python-library-for-segmented-regression-a-k-a-piecewise-regression

https://www.researchgate.net/profile/Charles-Jekel-2/publication/331231072_pwlf_A_Python_Library_for_Fitting_1D_Continuous_Piecewise_Linear_Functions/links/5c9107f945851564fae8aa57/pwlf-A-Python-Library-for-Fitting-1D-Continuous-Piecewise-Linear-Functions.pdf?origin=publication_detail

https://medium.com/@kangeugine/optimize-piecewise-linear-function-f47b8610993d

https://stackoverflow.com/questions/35415372/piecewise-regresion-python

https://stackoverflow.com/questions/19955686/fit-a-curve-for-data-made-up-of-two-distinct-regimes

https://online.stat.psu.edu/stat501/lesson/8/8.8

https://stats.stackexchange.com/questions/14538/not-usual-piecewise-linear-regression

Rによる複数の直線の回帰

http://yetanothermathprogrammingconsultant.blogspot.com/2018/03/piecewise-linear-regression.html

複数の直線による回帰の方法(MATLABの利用例)

https://jp.mathworks.com/matlabcentral/answers/426524-how-to-curve-fit-a-data-with-multiple-linear-line-which-regression-method-suits

セグメントごとの直線回帰(GraphPadの利用例)

GraphPadでは2つの区間に分けて行う直線回帰はサポートしているようです。3つの区間の場合も手作業でできるようです。

https://www.graphpad.com/guides/prism/latest/curve-fitting/reg_segmental_linear_regression.htm

 

論文

 

https://www.ams.org/journals/mcom/1961-15-073/S0025-5718-1961-0119390-6/S0025-5718-1961-0119390-6.pdf

 

Muggeo, V. M. (2003). Estimating regression models with unknown breakpoints. Statistics in medicine, 22(19), 3055-3071.

https://www.hindawi.com/journals/cmmm/2019/9810675/