オッズ比とハザード比との違い

論文紹介記事を読んでいたらハザード比が出てきたのですが、

睡眠規則性指数(sleep regularity index;SRI):毎日の入眠覚醒サイクルの一貫性を示す。100であれば毎日の入眠と覚醒が同じ時間。0であれば入眠と覚醒の時間が常に異なる。

睡眠の規則性が最も乱れている人(SRIスコアの5パーセンタイルに位置する人)の平均スコアは41点、最も規則正しい人(SRIスコアの95パーセンタイルに位置する人)の平均スコアは71点、スコアの中央値は60点。

中央値7.2年におよぶ追跡期間中に480人が認知症を発症。SRIが5パーセンタイルの人では、SRIが中央値の人に比べて認知症発症のハザード比が1.53(95%信頼区間1.24〜1.89)であり、認知症リスクの増加が認められた。

https://medical-tribune.co.jp/news/2023/1225560559/

オッズ比との違いってなんだっけ?となってしまったのでメモっておきます。なぜごっちゃになったのかというと、似ているところがあるからなんですね。

タバコを吸うと、肺癌になりやすい?

睡眠が不規則だと、認知症になりやすい?

この2つのケースを考えたとき、原因と⇒結果 という関係に関するという点ではどちらも同じです。しかし、患者を一定期間追跡して、時間も考慮して分析するかどうか、それとも、患者の追跡はせず(横断的な研究など)ある時点での原因の有無と結果の有無を集計するだけか、という研究デザインの違いがもしあれば、そこで違いが出てきます。肺癌か認知症かという研究対象の違いでなく、追跡期間を考慮した分析をしたか(時間を追って、イベント発生のタイミングを記録したデータか)どうかという研究手法(=データ収集方法)の違いが大事になってくるというわけです。

リスク比:時間要素を含まない相対指標

オッズ比:時間要素を含まない相対指標。リスク比を近似する指標。

ハザード比:初回イベントまでの速さで比較したリスク比

(参照:統計検定1級対応 統計学 日本統計学会編 2013年 東京図書 第10章 医学生物学分野キーワード 10.4効果の指標)

勉強というのは、似ていること(共通すること)と似ていないこと(異なること)との区別をしていく作業のような気がします。

  1. リスク比(相対危険率)とオッズ比の決定的な違いとは?

タバコを吸う吸わないの違いが、肺癌になる可能性に影響するか?に関して、ある時点での病気の有無と過去の喫煙歴のデータがあったとした場合は(つまり、横断研究や後ろ向き研究によって収集されたデータ)、オッズ比が計算されます。

タバコ吸う:肺癌10人 健常90人

タバコ吸わない:肺癌1人 健常99人

というテーブルが与えられたとしたときに(数字は適当です)、

タバコを吸う人が肺癌になるオッズは10/90 = 0.11

タバコを吸わない人が肺癌になるオッズは1/99=0.01

オッズ比=0.11/0.01 = 11

となります。タバコを吸うと肺癌になる危険が11倍というわけです。

ここで、「時間」の概念は登場していません。ある時点での話というわけです。

それに対してハザード比は、時間経過を問題にした解析方法です。

生存曲線に関する話ですが、死ぬ確率の確率密度関数をf(x)としたときに(横軸xは時間)、tの時点までに死ぬ確率は、f(t)をマイナス無限大からtまで積分したもの

F(t)= $ \int_{-\infty}^{t} $ f(t’)dt’

になります。逆にtの時点でまだ生きている確率S(t)=1-F(t) となります。ここでハザード関数(hazard function)として時刻xにはまだいきているが、その後すぐに死ぬ割合を考えます。

h(t) = f(t) / (1-F(t))

ちなみにh(t) = $\frac{d}{dt}$ (-log S(t))  という関係です。合成関数の微分法を思い出すとlogの微分は分母にきて中身を微分したものを掛けるので確かにそうですね。

  1. 日本統計学会編 統計学実践ワークブック 統計検定準1級対応  7ページ

さて生存曲線やハザード関数は、様々な予後予測因子を変数に含むと考えられるので、X=(X1, X2, …, Xs)をパラメータとして含みます。Xとしてある基準点を考えてX0とし、パラメータがX0のハザード曲線に対して、パラメータがXのハザード曲線がどんな比になるかをしめしたのがハザード比ということになります。このとき、生存曲線のモデルとしてハザード比が時間に依存しないようなものを仮定していれば、ハザード比は時間に無関係なある値を与えます。

  1. 基礎医学統計学改訂第6版 南江堂 141-142ページ

どうも一冊の教科書で、初学者がついていけるような説明をしてくれているものがあまり見当たりません。

ちなみに生存時間の解析では、イベントの発生=死ぬこと が多いですが、生存時間分析自体は一般性があることなので、イベントはなんでもよくて、病気の転移、完治などでも構いません。

  1. 日本統計学会編 統計学実践ワークブック 統計検定準1級対応  158ページ

 

ハザード比の説明を教科書に求めたのですが、案外どの統計学の教科書も初学者向けかつ網羅的な説明がないような気がします(自分が読み取れていないだけ?)。日本統計学会編 の 統計学実践ワークブック 統計検定準1級対応 は数学的にきちんとした説明があって、コンパクトさと網羅性を両立させたために、文章による説明は少ないのですが、理路整然としたまとめ方が自分は気に入っています。