ハザードとは
統計用語集(https://bellcurve.jp/)にハザードの定義式がありました。いわく、
h(t) = [latex]\lim_{\Delta t \rightarrow 0+} \frac{P(t \leq T < t + \Delta t | t \leq T)}{\Delta t}[/latex]
ハザードは時間とともに死亡者が増えていく現象を記載するときの概念で、言葉で説明するなら、ある時刻における瞬間死亡率という意味だそうです。上の式で、Pは条件付き確率です。定義式だけだと何のことかよくわからないので、もう少し丁寧な説明を探すと、ai-trend.jpにありました。このサイトの説明は数式が出てきますがとても丁寧でわかりやすい。わかりにくい統計の内容をネットで検索してわかりやすい説明に出会うと、たいていその記事はこの会社のサイトだったりします。
Tは生存期間。被験者が時間tまでには死亡している確率は、確率密度関数をf(t)とすれば、
F(t)=P(T<t)=∫f(u)du (0からtまでの積分)
生きている確率すなわち生存確率S(t) = P(T>=t)は、
S(t) = 1 – F(t)
P(T>=t)の意味は、確率変数Tがt以上である確率ということです。
確率変数TがT>=tという条件のもと(すなわち、時刻tまでは生存していたという条件のもと)
t=<T < t + dt という値を取る確率P(t=< T < t+dt | T >=t)を考えて、これを時間dtで割った、瞬間確率を考えます。このdtを0に近づけたものがハザード関数h(t)の定義になります。