ジャーナル自身が自己引用することによるインパクトファクターの押し上げ

MDPI社が発行するジャーナルSustainabilityのセルフサイテーションがひどいという論文をみかけました。

ジャーナル自身が自己引用することによるインパクトファクターの押し上げ

Journal Impact Factor = Citations in 2020 to items published in 2018 and 2019  / Number of citable items in 2018 and 2019

=  (18,186+20,818) /(4,815 +7,184)

= 39,004 / 11,999 = 3.251

Journal Impact Factor without self cites =(Citations in 2020 to items published in 2018 and 2019 − Self Citations in 2020 to items published in 2018 and 2019 ) / Number of citable items in 2018 (4,815) and 2019 (7,184)

= (18,186+20,818) – (4,066+6,677) / (4,815 + 7,184)

=(39,004 − 10,743)/11,999=2.355

(jcr.clarivate.com)

上の例でみると、10745/39004 = 27.5%がセルフサイテーションになっています。これによってインパクトファクターが押し上げられているわけですね。

  1. Sustainability (MDPI) 2020 JOURNAL IMPACT FACTOR 3.251

MDPI社の別の雑誌INTERNATIONAL JOURNAL OF MOLECULAR SCIENCESで同様にみてみると、

2020 JOURNAL IMPACT FACTOR 5.923

JOURNAL IMPACT FACTOR WITHOUT SELF CITATIONS 5.356

とやはりセルフサイテーションの有無で大きな差があります。2年分の引用数61,237のうち自己引用が5,865件で、割合でいえば、9.6%になります。Sustainability誌ほどではないですが、IJMSも引用件数およそ10%がセルフの引用なんですね。他の出版社のジャーナルの場合はどうなのかを見てみますと、nature communicationsの場合、

2020 JOURNAL IMPACT FACTOR 14.919

JOURNAL IMPACT FACTOR WITHOUT SELF CITATIONS 14.526

であまり大きな差はありません。2年間の引用数157,111のうち 4,134件がセルフ。割合は2.6%に過ぎません。やはりIJMSの10%は大きな数字だと思います。

状態空間モデル・階層ベイズ 

状態空間モデル・時系列解析・階層ベイズなどを解説したYOUTUBE動画

階層ベイズ&MCMC講義 (久保拓弥) 難易度★★ 2014/07/31 統計数理研究所

状態空間モデル・時系列解析などの教科書

  1. 赤池 弘次, 北川 源四郎 編『時系列解析の実際I(新装版) (統計科学選書)』2020/2/17  朝倉書店
  2. 島田 直希 『時系列解析: 自己回帰型モデル・状態空間モデル・異常検知 (Advanced Python) 』2019/9/7 共立出版 ARIMA、カルマンフィルタ・粒子フィルタ・HMM、ChangeFinderによる異常検知
  3. 萩原 淳一郎 ほか『基礎からわかる時系列分析 ―Rで実践するカルマンフィルタ・MCMC・粒子フィルター (Data Science Library) 』2018/3/23 技術評論社
  4. 久保拓弥『データ解析のための統計モデリング入門: 一般化線形モデル・階層ベイズモデル・MCMC』岩波書店、 2012  *買った
  5. 沖本 竜義『経済・ファイナンスデータの計量時系列分析 (統計ライブラリー) 』 2010/2/1  朝倉書店
  6. Jacques J.F. Commandeur, Sime Jan Koopman『状態空間時系列分析入門』2008/9/1
  7. James D. Hamilton『時系列解析〈上〉定常過程編 』2006/3/1 沖本 竜義, 井上 智夫 訳
  8. 北川 源四郎 『時系列解析入門』2005/2/24 岩波書店

統計モデルの教科書

  1. 松浦 健太郎『StanとRでベイズ統計モデリング (Wonderful R) 』 2016/10/25  良さげ
  2. Annette J.Dobson『一般化線形モデル入門 原著第2版』 2008/9/8 共立出版 1993年出版「統計モデル入門」の改訂版 *これはうちの図書館も所蔵。MUST READ

階層ベイズ法の実際の適用例

  1. 「階層ベイズ法」によるツキノワグマ生息数推定の批判的検討―状態空間モデルとの関連からの再考― 山上俊彦 2018年7月 日本福祉大学経済学部経済学科 Discussion Paper Series, DP-2018-01

状態空間モデル・時系列解析などウェブ記事等

  1. 時系列データを用いた広告効果測定の実際 2015年5月29日 JMRX勉強会[公開版] 青島弘幸 (株)ビデオリサーチ マーケティング事業推進局 猪狩良介 慶應義塾大学大学院経済学研究科/日本学術振興会特別研究員 スライドシェア
  2. SARIMAで時系列データの分析(PV数の予測)2018-05-08 kumilog.net

外勤とは?医師のアルバイトのこと

外勤(がいきん)というのは、医師が通常勤務している病院以外の病院にアルバイトとして行って診療することみたいです。民間の病院だったり街中で開業している病院に、週に一回近くの大学病院の先生が来てみてくださっているという状況が外勤ということだったんですね。

外勤とは・研究日、外勤日とは

  • 外勤がいきん)。そもそもよくわからない制度ですよね。一言で言えば、医者のアルバイトです、えぇ。
  • 医者は他の職業と違い、アルバイトの方が常勤先よりも時給がよいという珍しい職業なのです。
  • 多くの医局では、名前は違えど、週に1日前後「研究日」とか「外勤日」とか言われる日を設けており、医師はその日を使ってバイトしたりしているわけです。

せのびぃ、初外勤で「違い」を実感 2014/04/16 日々是たぶん好日ナリ

 

  • 後期研修医は初期研修医とは異なり、アルバイトをすることが可能
  • このアルバイト代が後期研修医の収入を大きく占めている
  • 後期研修医のアルバイトとは、勤務先の病院以外での医療機関で働く「外勤」のこと

後期研修医は外勤やアルバイトもできる!その年収は? e-doctor

外勤先(アルバイト先)の見つけ方

ほとんどは医局で『あそこへ行って』と指示されます。バイト先は各大学ごとにシマがあって、たとえば順天堂のシマ、日本医大のシマというものがある。

患者にはとても言えない「病院の真実」後編 週刊現代

 

外勤のアルバイト収入の金額

  • 時給は、1万円〜です
  • 1回バイトに行くと8万~10万貰えるわけです

医者の給料 2018-03-28 外科医たっくのブログ

外勤の必要性について

東京女子医科大学が「研究日」を廃止

  1. スクープ!東京女子医大で医師100人超が退職 一方的な経営陣の方針に抗議の意思表示か  岩澤 倫彦 2021/04/20 6:20 東洋経済ONLINE

 

運動とストレスホルモンとの関係 上昇するのか減少するのか変化しないのか

運動するとコルチゾール(ストレスホルモン)が上昇するという記述を見かけて、驚きました。運動するとストレス解消になるというのが、よく一般的に言われることだと理解していたからです。

  • 有酸素トレーニングは、コルチゾール(ストレスホルモン)値を上昇させる。それで炎症が起こり、加齢が加速する。コルチゾール値が高まると、体内の酸化物質の量が増加する。この酸化物質が、脳、心臓、消化管、その他の器官の炎症を増大させる。
  • 2010年のある研究では、300人以上の持久性運動の選手(長距離走者、トライアスロン選手、自転車競技者)のコルチゾール値を調べ、非アスリート対照群と比較した。その結果として、有酸素運動競技者のコルチゾール値は対照群よりもかなり高く、この値の高さとトレーニング量の多さに明確な相関関係が認められた。
  • 2011年の研究では、健康で活動的な男子大学生に対する自転車こぎの影響を調べた結果、コルチゾール値と炎症マーカーがかなり増大することがわかった

出典:長距離の「有酸素運動」は脳を老化させる デイヴ・アスプリー 栗原百代:翻訳 2020.7.17 4:20

上の記事で紹介されていたスキームは、有酸素運動⇒コルチゾール上昇⇒酸化物質の量の増加⇒脳、心臓、消化管などで炎症が増大⇒加齢が加速 です。有酸素運動は体にとって良くないという内容で驚きました。

  1. シリコンバレー式超ライフハック 2020/7/2 ダイヤモンド社 デイヴ・アスプリー 著, 栗原 百代 訳
  2. 溜まったストレスは運動で解消するべき4つの理由 5/2(日) 12:08 シェア ウィメンズヘルス YAHOO!JAPAN ハードな運動は体にとってストレスなので、運動をすると一時的に体内のコルチゾールが増える。でも、ゴットフリード博士いわく、回復にあてる時間を十分取れば、コルチゾールは適度に調節される。

運動がストレス解消に良いというのは、自分でも日頃実感していることですので、上で紹介されていた内容は運動の条件によるのではないかと思います。実際、運動でストレスホルモンが減るという話もあります。

  • 運動をするとコルチゾールの分解が促され、体内のストレスホルモンを減らすことができます。
  • 有酸素運動、球技、ダンス系、ヨガ系、どのスポーツでも効果があります。
  • たった3分間のストレッチを行うだけでも、コルチゾールの分泌量が減るという研究も報告されています。

vol.9 運動をしてストレスホルモンを分解しよう

言っていることが、真逆ですよね。運動でコルチゾールが増えるのか、減るのか、変わらないのかは、研究によってまちまちのようです。

運動でコルチゾールが上昇したとする研究報告・解説記事

運動でコルチゾールが減少したとする研究報告・解説記事

  1. ダイエットの意外な落とし穴「有酸素運動でかえって太る人」の特徴 運動前に必ず体に入れたい食べ物 PRESIDENT Online 水野 雅登 水野 雅登 医師 YAHOO!JAPAN 有酸素運動は、このコルチゾールの分泌量を減らしてくれます。
  2. 【心の健康】体だけじゃない!運動の精神的な効果 2020年8月31日 運動することで感情や気分のコントロールを司る「セロトニン」が分泌され、ストレスホルモンと呼ばれる「コルチゾール」が減少します。運動は体だけでなく、心にも良い影響があるのです。

運動でコルチゾールが変化しなかったとする研究報告・解説記事

  1. 一過性の有酸素運動が唾液中コルチゾールの分泌に与える影響に関する予備的検討 この論文の背景のセクションで、運動がコルチゾール量に与えた影響に関する先行研究がまとめられています。

 

Midline estimating statistic of rhythm (MESOR)とは

周期的な測定データを回帰モデルで表現する場合にMidline estimating statistic of rhythm (MESOR)というものが登場することがあります。

回帰モデル式 Y(t) = M + A*cos (2*pi*t / τ + φ) + e(t)

M: the MESOR (Midline Statistic Of Rhythm, a rhythm-adjusted mean

A: the amplitude (a measure of half the extent of predictable variation within a cycle)

φ: the φ is the acrophase (a measure of the time of overall high values recurring in each cycle)

τ: the period (duration of one cycle)

e(t): the error term

参考 Cosinor-based rhythmometry Germaine Cornelissen Theoretical Biology and Medical Modelling2014,11:16

  1. Cosinor-based rhythmometry Germaine Cornelissen Theoretical Biology and Medical Modelling2014,11:16
  2. REFINETTI et al. Procedures for numerical analysis of circadian rhythms. Biol Rhythm Res. 2007; 38(4): 275–325. doi: 10.1080/09291010600903692

研究者が決めた遺伝子セット(パネル)の発現量を解析できるNanoString社のnCounter 

NanoString社のnCounterという測定法技術を初めて耳にしたので、内容をまとめておきます。最初の報告の論文は2008年ネイチャーバイオテクノロジー誌でした。

Direct multiplexed measurement of gene expression with color-coded probe pairs. 17 February 2008;Nature Biotechnology volume 26, pages317–325.

これは検出したい遺伝子のmRNAの配列に相補的なDNAを蛍光標識しておき検出するものです。その際、蛍光プローブは一種類ではなく7種類並べたものを使うので、原理上、蛍光色の数の7乗種類の標的配列を認識できることになります。3^7=2187、4^7=16384、5^7=78125ですから、かなりの数の遺伝子の発現を同時に検出できるということになります。しかしマイクロアレイが数十万~数百万までできるようですから、それにはかないません。感度はナノストリングのnカウンターの方がいいみたいです。論文を見るとnCounterを使った研究では数十個の遺伝子発現を調べたものが多いようです。

  1. マイクロアレイとは?DNAマイクロアレイについて Agilent Technologies October, 2008

ナノストリング ウェブリソース

  1. https://www.bioxpedia.com/nanostring-ncounter-technology/

 

室駆出率の保たれた心不全(HFpEF)とは

左室駆出率の保たれた心不全(Heart failure with preserved ejection fraction; HFpEF)という言葉をしばしば目にするのですが、それが何なのかは文字通りとしても、なぜそれが大事なのか、なぜみなそれに興味を持っているのかが今一つピンと来ていませんでした。

心臓には、血液を循環させるための二つの機能があります。全身へ血液を送り出すための「収縮機能」と、全身から戻ってきた血液を取り込むための「拡張機能」です。以前は、左心室の収縮力が低下し(左室駆出率が50%未満)、左心室が拡大した「収縮機能不全」が心不全の主な原因と考えられていました。しかし、最近の研究から、高齢者の心不全の半数は、収縮力が保たれているにもかかわらず、左心室が硬くて広がりにくいために、心不全症状を呈する「拡張機能不全」というタイプの心不全であることが分かってきました。… 拡張能を正確に評価することが難しいため、「収縮機能が保たれた心不全」(heart failure with preserved ejection function: HFpEF)と呼ばれています。(高齢者の心不全 日本心臓財団

拡張不全と言えばよいのですが,日常診療では拡張機能を正確に評価することは,必ずしも簡単ではありません.そのため,便宜上このような病態を「収縮機能の保たれた心不全」“Heart Failure with Pre-served Ejection Fraction”,略名 “HFpEF”と呼んでいます.

なるほど、「左室駆出率の保たれた」の言わんとするところは、収縮とは逆の機能すなわち拡張が出来ない、つまり、血液を取り込むほうがうまくいかないということだったんですね。(左室駆出率の保持された心不全の病態 吉川 勉(榊原記念病院) 心臓財団虚血性心疾患セミナー(2015年9月29日放送分))

 

“If an old man’s heart relaxes slowly, his capacity for physical exertion is thus limited, even though the systolic contractions were still like those of youth.”(老人の心臓がゆっくりと拡張するなら,たとえ収縮能が若い人と同じであっても運動能力は制限されるであろう.)1923 年の Physiological Review に載っている Henderson の言葉である.90 年以上前に高齢化社会における拡張不全の出現を予言していたのである.(拡張不全とはどのような心不全のことをいうのでしょうか? 拡張不全の疫学

 

参考

  1. 駆出率(EF)の保たれた心不全(総説) NEJM, Nov.10,2016 西伊豆早朝カンファランスH28.12西伊豆健育会病院仲田和正
  2. 心不全の種類

心不全とは?心筋梗塞との違い

心不全とは

心不全は病名ではなく、心筋梗塞心臓弁膜症心筋炎などの心臓のさまざまな病気や高血圧などが原因となり、引き起こされる状態のこと。(心不全 Doctors File)

「不全」の国語の辞書的な意味は、「活動や機能が完全でないこと」です(goo辞書)。医学用語として使われているときも、病気の名前ではなく、状態のことのようです。腎不全なら、腎臓の機能が低下した状態です(参照:腎不全 Doctors File)。

心不全を引き起こす病気の一つに心筋梗塞があります。「梗塞」という言葉も、心筋梗塞や脳梗塞で使われていますが、そもそもの意味は、「①ふさがって通じないこと。②動脈がふさがれて、その先の組織に壊死 (えし) を生じた状態。」(goo辞書)。なるほど、心臓を取り巻く血管が詰まって、血液が心臓の筋肉にいきわたらなくなり心臓の筋肉が死んでしまった状態が「心筋梗塞」なわけですね。goo辞書の説明がわかりやすかったです。

心不全の原因には心筋症弁膜症など、さまざまな病気がありますが、とくに多いのが心筋梗塞なのです。心筋梗塞のために壊死した心筋部分が大きいと、心筋が充分にポンプの役割を果たせずに、身体の要求に見合うだけの十分な血液を送り出せないため心不全状態となるわけです。(心筋梗塞、虚血性心不全とは 日本心臓財団)

この説明で「心不全」と「心筋梗塞」との違いがはっきりとわかりました。心筋梗塞は心不全の原因の一つというわけです。

がんマーカー 早期診断、確定診断、病勢、予後予測に役立つバイオマーカーに関する論文のまとめ

がんは早期に発見すれば治療が容易で完治することが多いため、がん撲滅のためには早期診断が可能なバイオマーカーの開発が期待されています。また、がんの薬剤への応答性は個人によって大きく異なるため、テイラーメード医療の必要性も広く認識されています。このような事情から、がんの早期診断、確定診断、病勢、予後予測、テイラーメード医療に役立つバイオマーカーの開発に、世界中の研究者がしのぎを削っています。こうした新規バイオマーカー(候補)に関する論文は膨大な数に上り、把握するのがなかなか大変です。

臨床の現場で実用的かどうかは、患者に負担をかけない侵襲性の低い(尿、唾液、血液など)検体が使えるかどうか、コストがかからないか、迅速か、誰がやっても同じ結果が容易に得られるかなどが重要になってきます。

がんのバイオマーカーであるということは、発がんやがんの成長、転移などのメカニズムに直接関与する可能性があるので、新規がんバイオマーカーを見つけるということは、とりもなおさずがんのメカニズムに迫る可能性が強まることにもなり、その意義は大きなものがあります。

 

がんマーカー

AFP (Liver Cancer), BCR-ABL (Chronic Myeloid Leukemia), BRCA1 / BRCA2 (Breast/Ovarian Cancer), BRAF V600E (Melanoma/Colorectal Cancer), CA-125 (Ovarian Cancer), CA19.9 (Pancreatic Cancer), CEA (Colorectal Cancer), EGFR (Non-small-cell lung carcinoma), HER-2 (Breast Cancer), KIT (Gastrointestinal stromal tumor), PSA (Prostate Specific Antigen) (Prostate Cancer), S100 (Melanoma) (Cancer biomarker Wikipedia)

  1. Goossens et al., Cancer biomarker discovery and validation. Transl Cancer Res. 2015 Jun; 4(3): 256–269. there has been a large gap between multiple initial reports of biomarkers, often with diagnostic performance that cannot be reproduced in later studies
  2. Henry and Hayes. Cancer biomarkers Molecular Oncology 06 February 2012
  3. Cancer Biomarker Discovery SinoBiological
  4. Strategies for discovering novel cancer biomarkers through utilization of emerging technologies. Clinical Practice http://sites.utoronto.ca/acdclab/pubs/PM/18695711.pdf  The introduction of technologies such as mass spectrometry and protein and DNA arrays, combined with our understanding of the human genome, has enabled simultaneous examination of thousands of proteins and genes in single experiments, which has led to renewed interest in discovering novel biomarkers for cancer.中略 Cancer biomarkers can be DNA, mRNA, proteins, metabolites, or processes such as apoptosis, angiogenesis or proliferation.

 

がんマーカーとしての変異遺伝子

発がんは多くの場合、遺伝子の変異の蓄積を伴います。

K-Ras変異とがん

epidermal growth factor receptorの変異とがん

c-Kitの変異とがん

Braf の変異とがん

  1. Andre et al.,  Biomarker Discovery, Development, and Implementation in France: A Report from the French National Cancer Institute and Cooperative Groups. March 2012 Clinical Cancer Research March 2012 Volume 18, Issue 6

 

がんマーカーとしての細胞外小胞の利用

Kosaka et al., Exploiting the message from cancer: the diagnostic value of extracellular vesicles for clinical applications. Experimental & Molecular Medicine 15 March 2019; volume 51, pages1–9. https://www.nature.com/articles/s12276-019-0219-1 細胞外小胞の種類を説明した図がわかりやすい

 

乳がん

  1. Comment on ‘BAG-1 as a biomarker in early breast cancer prognosis: a systematic review with meta-analyses’ 15 March 2018 British Journal of Cancer volume 118, pages 1152–1153
  2. Circulating Microparticles in Breast Cancer Patients: A Comparative Analysis with Established Biomarkers. ANTICANCER RESEARCH 28: 1107-1112 (2008)

TNBC

  1. Sukumar et al.,  Triple-negative breast cancer: promising prognostic biomarkers currently in development. Expert Review of Anticancer Therapy 24 Feb 2021
  2. Biomarkers in Triple-Negative Breast Cancer: State-of-the-Art and Future Perspectives. Int J Mol Sci. 2020 Jul; 21(13): 4579. MDPIジャーナルに掲載されたレビュー論文 Lehmann et al. proposed a division of TNBCs into seven molecular subtypes: immunomodulatory (IM), mesenchymal (M), mesenchymal stem-like (MSL), luminal androgen receptor (LAR), unstable (UNS) subtype, and two basal-like subtypes (BL1 and BL2) [3]. Then, a subclassification refinement was performed, to define only four groups BL1 (immune-activated), BL2 (immune-suppressed), M (including most of the MSL), and LAR [4]. These classifications can, in theory, be used as prognostic and predictive tool for better patient selection and personalized treatments. 中略 However, sound clinical applications of this molecular classification are yet to appear [8]. 個別化医療のためのTNBC
    のタイプ分けの努力とその限界
  3. Bao et al. Exploring specific prognostic biomarkers in triple-negative breast cancer.  Fan Cell Death & Disease 24 October 2019; volume 10, Article number: 807
  4. Potential clinically useful prognostic biomarkers in triple-negative breast cancer: preliminary results of a retrospective analysis. Breast Cancer (Dove Med Press). 2018 Nov 23; 10: 177–194.
  5. Lafont et al., CD73: a new biomarker in triple-negative breast cancer. Translational Cancer Research Vol 7, Supplement 5 (June 2018)

 

大腸がんのマーカー蛋白質

Zheng et al., A circulating extracellular vesicles-based novel screening tool for colorectal cancer revealed by shotgun and data-independent acquisition mass spectrometry. Journal of Extracellular Vesicles 14 April 2020; Volume 9, Issue 1

Zhong et al. Serum extracellular vesicles contain SPARC and LRG1 as biomarkers of colon cancer and differ by tumour primary location. EBioMedicine 2019 Nov 18; 50:211-223.

Lee et al. Discovery of a diagnostic biomarker for colon cancer through proteomic profiling of small extracellular vesicles. BMC Cancer. 2018 Nov 1; 18: 1058.

Quantitative mass spectrometry analysis reveals a panel of nine proteins as diagnostic markers for colon adenocarcinomas. Oncotarget. 2018 Mar 2; 9(17): 13530–13544.

Shiromizu et al., Quantitation of putative colorectal cancer biomarker candidates in serum extracellular vesicles by targeted proteomics. Scientific Reports 06 October 2017 ; volume 7, Article number: 12782.  annexins A3, A4, and A11

  1. 英語表記の日本語訳における注意点 colorectal cancer「結腸直腸癌」ではなく、「大腸癌」と訳すべきである。日本の大腸癌診療において「結腸直腸癌」という語は一般的に用いられていない
  2. 大腸がん(結腸がん・直腸がん) ColoRectal Cancer:CRC まつおか内視鏡内科 富山県富山市 大腸がんの発生には大腸腺腫(ポリープ)が徐々に大きくなりがん化するものと、正常粘膜から突然がん化するものの2種類あります。多くは前者

大腸がん予後予測バイオマーカー

バイマーカーという言葉は非常に広い意味で使われており、単なる遺伝子発現だけでなく、画像診断であったりもします。

  1. AIによる大腸がん転帰の予測マーカーを開発/Lancet ケアネット2020/02/17 ノルウェー・オスロ大学病院のOle-Johan Skrede氏らは、ディープラーニング(深層学習)を用いて、従来の病理組織画像から大腸がんの転帰を予測するバイオマーカー(DoMore-v1-CRC)を開発し、その臨床的有用性を確認した。
  2. The Lymphocyte-to-Monocyte Ratio is a Superior Predictor of Overall Survival in Comparison to Established Biomarkers of Resectable Colorectal Cancer. Ann Surg. 2017 Mar; 265(3): 539–546.

 

AUCとは?ROC曲線とは?感度(sensitivity)とは?特異度(specificity)とは?

AUCという言葉は医療系あるいは機械学習の世界では頻出で、何の説明もなくAUCはいくらいくらでしたといった使われ方をします。初めてこの世界に来た人にしてみれば、「?」です。AUCとは何かを調べるとROCが出てきて、それ何?と思って調べると、TPFやFPFが出てきて、最初から理解するしかありません。

AUC:ROC曲線のグラフの下の部分の面積(‘Area Under the Curve)の略語

ROC:ROC曲線とは、Receiver Operating Characteristic curveのこと。検査や診断において、陽性か陰性かを判別するカットオフ(選別点)を動かした場合の、偽陽性率(=FPF)を横軸に、真陽性率(=TPF)を縦軸にとって、線で結んだグラフ。

偽陽性率=1-特異度

陽性率=感度

特異度

まだ何のこっちゃ?ですが、ROCを理解するための重要の前提は、「検査や診断は白か黒かにハッキリ分けられることは普通はない」という事実です。つまりあるマーカーの値で病気か病気でないかを判断しましょうと言ったときに、「病気か病気でないかを判別するカットオフ値をどう設定するか」という恣意的な操作が入っているのです。とある「簡易うつ病診断テスト」で質問項目20個に答えてもらった場合に、各項目1点として、15点を超えた人をうつ病と判断するのか、12点を超えた場合にうつ病とみなすのか、というわけです。12点だった人の場合でも実はうつ病の人と、実はうつ病ではない人が混じっているわけです。この場合、うつ病かどうかの診断が別の方法で確定できるという前提で話しています。つまりもともとうつっぽい性格なんだけど全然うつ病ではない人がいたときに、その人は、「擬陽性」(うつでないのにうつと判断されてしまう)になるというわけです。

別の例で説明すると、がん患者の集団とがんでない人の集団があったとして、あるがんマーカーの値を調べたとします。仮にがんマーカーの値が0から100までの値をとれるとします。がん患者の集団はおおよそ80くらいの値に集中していて、がんではない人のマーカーの値は20くらいに集中していたとします。がんマーカーの値が50の場合に、がんの人もいればがんでない人もいて入り混じった状態です。このような状況だと、このがんマーカーでがんかどうかを判別することは、「ある程度」の正確さでしかできず、カットオフの値をどう設定するかで、がん(の疑い)かどうかの判断が変わってくるということになります。そこで、カットオフの値を動かしたときに、偽陽性率(=FPF)を横軸に、真陽性率(=TPF)(感度とも呼ばれる)を縦軸にとってグラフが書けるということになります。このグラフがROC曲線と呼ばれ、その下側の面積がAUCと呼ばれます。

pythonで試してみます。健常者4000人のがんマーカー値の平均が40、標準偏差12、また、がん患者1000人のがんマーカー値の平均値が70、標準偏差12だったとします(pythonで、そうなるように乱数を発生させた)。すると、マーカー値の分布をプロットして、ROC曲線を描いてみると、

となりました。AUCは96%みたいです。今度は試しに、健常者4000人のがんマーカー値の平均が45、標準偏差12、また、がん患者1000人のがんマーカー値の平均値が45、標準偏差12だったとします。すると、描画したら

となり、AUCは50%でした。これはつまり、このがんマーカーは健常者とがん患者とを全く区別できていないという、極端な条件です。

こんどは、健常者40人、がんマーカー値の平均値40、標準偏差20、がん患者の人数を5人、平均値を60、標準編偏差20としてみます。すると、

で、AUCを計算する70.5%になりました。

今度は、健常者400人、平均40、標準偏差20、がん患者50人、平均60、標準偏差10にしてみます。

これのAUDは80.7%。上のヒストグラムから明らかなように、今の場合がん患者の分布はほとんど健常者の分布の内部にあります。するとROC曲線をみてわかるように、偽陰性率を上げないと感度も上がらないわけですね。いいマーカーは直線関係よりもできるだけ上に膨らんで欲しいのですが、今の場合は直線的に上昇しているだけで、あまり良いマーカーでないことがわかります。

最後に、健常者45人、がんマーカー平均値40、標準偏差10、がん患者5人、がんマーカー平均値70、標準偏差10でランダムに分布を得ました。

今の場合、偶然ですが、健常者とがん患者の重なりはゼロです。すると偽陽性率0のカットオフがあるので、感度は100%になります。AUCは100%。例数が少ない場合に実験データからROC曲線やAUCを求めると、こういうことも起こるようです。

参考図書

  1. 森本 剛『医学論文のための 研究デザインと統計解析』(中山書店2017年)146ページ 診断特性 Topic マーカー研究と診断特性pp144-157 この本は臨床研究実践のための教科書としては最強の部類に入ります。

AUCとは

ROC曲線は、診断法がどれぐらい有用なのかを知るときに使われ、曲線下の面積(AUC)によって定量化されます。(医療統計コラム File 2. ROC曲線は、こんなふうに描かれます jmp

ROC曲線とは

  • 与えられた値から,真(TRUE)か偽(FALSE)かを判断したい
  • 与えられた値をどこで切っても,TとFは完全には分離できません
  • 区切る値(閾値,カットオフポイント)をいろいろ変えて,横軸にfalse positiveの割合,縦軸にtrue positiveの割合をとってプロットしたものが,ROC曲線
  • ROCはReceiver Operating Characteristicの略で,第2次大戦のときに米国のレーダーの研究から生まれた概念

ROC曲線 edu.mie-u.ac.jp

  1. ROC curve analysis  MedCalc

血中薬物濃度-時間曲線下面積(AUC)とは?

AUCは体循環血液中に入った薬物量比例します。(薬物血中濃度-時間曲線下面積(AUC) 治験ナビ)

Area Under the Curve One of the most important pharmacokinetic parameters is the area under the drug concentration versus time curve within the dosing interval (AUC) because AUC relates dose to exposure. Because the dosing interval is typically once daily or every 24 h on safety studies, the reported AUC is typically AUC0–24 h. AUC is the quantitative measure of the apparent amount of compound at the site from which samples were collected and concentrations measured, which in most cases is the systemic circulation. When sampling occurs from the systemic circulation, it is often an indication of systemic exposure. The simplest method for calculating AUC is the linear trapezoidal rule (Gibaldi and Perrier 1982). (sciencedirect.com)

参考ウェブサイト

  1. 機械学習の評価指標 – ROC曲線とAUC TECH BLOG by GMO