投稿者「PhD」のアーカイブ

コレスポンディングオーサー(correspoinding author、責任著者)とは?

correspoinding author(コレスポンディングオーサー、責任著者)とは、研究成果を論文発表するときに、著者が複数いる場合の一番の責任を負う著者のことです。correspoindingという名前が示すとおり、論文に関する第三者とのやりとりは、correspoinding authorが行います。つまり、雑誌への投稿の際の雑誌エディターとのやりとりや、出版後に誰か他の研究者が論文に関することを聞きたいときの連絡先でもあります。日本語で責任著者と訳されることからわかるように、単にやり取りをする窓口という意味以上に、論文報告する内容に関する責任を負います。研究者の間では、日常会話ではコレスポと略すことが多いです。

誰がコレスポになるのか

通常はラボのボスがコレスポになります。それは、ラボのボスが研究を立案し、研究資金を獲得し、研究人員を配置し(部下にテーマを与え)、論文を執筆することが多いからです。しかし、ラボの運営体制によっては、中ボスがコレスポになることや、実際に仕事をした部下がコレスポになることもなくはありません。このあたりは、誰がオーサーになるべきかという問題も含めて、分野によって、あるいは業界(学部)などによっても、文化・慣習が異なる場合があるので、一概に何が正しくて、何がおかしいとも言えないものがあります。つまり曖昧な線引きになっているため、俺が当然コレスポになるべきだ、いや、コレスポは私でしょう、というラボ内での意見の相違が生まれることもよくあります。

コレスポでもめる一番のパターンは、ラボのボス(教授)が実質的にはほとんど貢献していないにも関わらずコレスポを要求するパターンです。その場合の正当性の根拠は、自分のラボだから、自分が研究資金を稼いできたのだから、というものです。教科書的に言えばそれだけではオーサーシップにすら値しないということになっていますが、そのような教科書的なルールが実社会で行われているのは、自分は見たことがありません。場合によってはボスはあまり研究費を獲っていなくて、研究を実際に行った部下が自ら研究費も獲得して、研究を立案し、実験を実施し、データを解析して論文まで執筆するということもあります。その場合には、実際に研究を行った部下がコレスポンディングオーサーになるのが、「研究の倫理の教科書」的には正しいと思いますが、現実はというと、権力を持つ立場の人間がコレスポを主張することがあるでしょう。その場合に、どこをお落としどころにするかということに関しては、正解はありません。なぜなら、部下の立場でボスと喧嘩してもその部下に勝ち目がないことが多いですし、かりに主張を押し通せても、しこりが残ってしまって、長期的には必ずしも良いとは限らないからです。

2つのラボが対等の共同研究をした場合にも、コレスポをどちらのラボのボスが取るかで意見の相違が生じる可能性があります。これはもう2つのラボの力関係で決まるのではないでしょうか。オーサーシップでもめてしまって、折角共同研究で良い成果を得て論文発表したにも関わらず、その後の関係が冷え切ってしまうということもあるかもしれません。人間関係なので、難しいところです。

 

コレスポは何人まで可能?

責任著者は通常一人ですが、ジャーナルによっては複数の人が責任著者になっている論文があります(Co-corresponding author)。下のエディテージの記事を見ると、コ・コレスポンディングオーサーを認める雑誌は多くはないが存在するようです。基礎系の雑誌か、臨床系の雑誌かでもその割合は異なるかもしれません。自分は基礎系のジャーナルにしか論文を出したことがありませんが、責任著者が複数ということは比較的よく見かけたように思います。

While some journals allow the practice of including two corresponding authors, many journals do not. (Does your target journal allow more than one corresponding author? A case study editage insights)

コレスポが何人までOKなのかは、雑誌の投稿規定に明示されていないこともありますが、明示している雑誌もあります。

分散はnで割るのかn-1で割るのか?n-1で割ったほうをなぜ不偏分散と呼ぶのか

統計の教科書を読み始めてすぐに挫折する理由は、分散の説明が教科書によってまちまちなせいで頭が混乱させられるからです。分散の定義がある教科書では 1/n Σ (xi-m)^2なのに別の教科書だと 1/(n-1) Σ (xi-m)^2 のようにnでなくn-1で割っています(nは標本の数、mは標本の平均)。そして、n-1で割るほうを不偏分散と呼んでいます。

ちゃんとした教科書であれば、それぞれを正しく呼び分けていることも多いのですが、統計ソフトの場合、分散と言えば、n-1で割るほう(不偏分散)で、統計ソフトの使い方の教科書などでは特に、不偏分散のことを単に分散と呼んでいたりするので、混乱するわけです。

不偏という耳慣れない日本語の意味を知りたいのですが、「偏りが無い」と日本語で説明されても意味不明です。もうこのあたりで嫌気が差して教科書を閉じることになります。

ちゃんと理解したければ、「不偏推定量」なる概念を理解する必要がありました。前提として、「母集団」から標本を抽出するという操作の理解も大事です。母集団には母集団の分布の特性を表す量があります。例えば、平均値(母平均と呼ぶ)などが特性を表す値の一例です。母集団から標本をとってきた場合に、標本から計算される平均値(標本平均と呼ぶ)もあります。標本平均と母平均との関係はどうなっているの?というのが大事なポイントになります。分散についても同様に考えることができます。母集団の分散(母分散と呼ぶ)と、標本から得られた分散(標本分散)との関係はどうなっているのでしょうか。

標本を得るという操作を行うごとに、実際に得られる標本の値は毎回異なるわけですから、標本抽出を何回も行えば、標本平均も毎回異なります。標本分散も毎回異なります。そこで、「標本平均」の期待値や、標本分散の期待値を考えることになります。標本平均の期待値がもし母平均と一致していれば、標本平均は不偏推定量であるという言い方をします。実際、標本平均の期待値を計算すると母平均に一致するので、標本平均は不偏推定量です。分散の場合はどうでしょうか。標本分散の期待値を計算すると、実は母分散とは一致しません。なので標本分散(nで割る方)は不変推定量ではないのです。じゃあ、母分散の不偏推定量になっているのは、どのような量なのでしょうか?実はn-1で割る方が、期待値を計算したときに母分散に一致するので、不偏推定量になっているのです。このことから、n-1で割る定義のほうを不偏分散と呼ぶわけです。不偏推定量になっている分散なので不偏分散と呼ぶ、なるほど納得です。

標本分散の期待値を実際に計算してみると、このことが良くわかります。母分散がσ^2だったとして、標本分散s^2の期待値を計算すると、

期待値E[s^2] = …. = (n-1)/n σ^2 となります。母分散であるσ^2には一致せず、(n-1)/n という係数がかかるという違いがあるわけです。なので(n-1)/n の逆数であるn/(n-1)を標本分散にかけておけば、つまり、

n/(n-1)1/n Σ (xi-m)^2 = 1/(n-1) Σ (xi-m)^2 なる数を考えれば、その期待値は母分散に一致します。なので、不偏分散 1/(n-1) Σ (xi-m)^2 は、 分母にn-1が来ているのです。

これらの議論は少し詳しい統計の教科書や数理統計学の教科書に説明されています。自分が参考にしたのは、松本裕行・宮原孝夫『数理統計学入門』学術図書出版社(1990年)です(72ページ目)。

 

主要な確率分布と標本分布の確率密度関数と平均、分散

確率・統計で用いられる言葉の定義

確率変数とは、ある確率に基づいた試行の結果として値が定まるような変数のことです。例えば、サイコロを振るという試行を考えた場合に、確率変数Xは、1から6までの自然数の値を取り得ます。各々の目が出る確率は、1/6になります。

確率関数とは、確率変数が離散型の場合に、確率を規定する関数のこと。確率pで当たりくじが出るくじをn回引いたときにr回当たりが出る確率の確率関数は、

P(X=r)=f(x)=nCr p^r (1-p)^n-r

となります。

確率分布とは、確率関数と確率変数との対応関係のことです。上の式の場合は、二項分布とよばれる確率分布です。

確率密度関数とは、確率変数が連続型の場合に、P(a=< X <=b)がaからbまでの積分で確率が求まるような関数f(x)のことです。

分布関数とは、累積分布関数とも呼ばれますが、F(x):=P(X<=x)で定義されるような関数F(x)のこと。

期待値とは、離散型確率変数Xの場合は、Xと、Xの確率との積を全てのXに関して足し合わせたもののことです。連続型確率変数Xの場合は、確率変数と確率密度関数との積をマイナス無限大からプラス無限大まで積分したものになります。

m次モーメントとは、確率変数Xのm乗の期待値$E[X^m]$のこと。

確率母関数$G _X(t)$は、tのX乗の期待値$E[t^X]$として定義されます。

$G _X(t)\stackrel{\mathrm{def}}{=}E[t^X]$

積率母関数モーメント母関数)$M _X(t)$は、「eのtX乗」の期待値$E[e^{tX}]$として定義されます。

$M _X(t)\stackrel{\mathrm{def}}{=}E[e^{tX}]$

さて用語のおさらいが終わったところで、よく出てくる確率分布を纏めておきます。

離散型確率変数の確率分布

離散一様分布

ベルヌーイ分布

二項分布

ポアソン分布

幾何分布

超幾何分布

負の二項分布多幸分布

多項分布

連続型確率変数の確率分布

正規分布

指数分布

ガンマ分布

ベータ分布

コーシー分布

対数正規分布

ワイブル分布

Gompertz分布

ロジスティック分布

標本に対する確率分布(標本分布)

母集団から抽出する「標本」は確率変数とみなせるので、標本分布は確率分布のことなのですが、習慣的にか標本分布という言葉を使うようです。

カイ2乗分布

t分布

F分布

参考図書

  1. 日本統計学会公式認定 統計検定1級対応 統計学 日本統計学会編

参考(LaTex)

  1. https://mathlandscape.com/latex-equal/
  2. https://48n.jp/blog/2016/07/12/sample-of-formula/
  3. https://www.applstat.gr.jp/wp/wp-content/themes/jsas/common/img/readme.pdf
  4. https://atatat.hatenablog.com/entry/2020/05/01/230319

[医学論文の種類]Editoral(エディトリアル)とは?

一口に論文と言っても、様々な種類があります。新しい発見を報告する「原著論文」(Original article)がなんといっても重要であり、これが研究者を評価する際の最重要項目になります。その分野の専門家であれば、領域の動向をまとめたReview Article(レビュー論文)を書くことも多いでしょう。Review Article の「review」と、論文査読{review)の「review」とは、全く別物ですので混同しないように。念のため。さて、医学論文ではEditorialという論文の形式もよく目にします。

医学においては、著書としての学術論文はその内容や様式により、基本的には原著症例報告総説短報告手紙文などにまとめて分類される。論説(Editorial)は学術論文の範疇からは除外される。(https://seiyogakuin.ac.jp/guide/criticism/doc/055.pdf)

これは、専門家が特定の分野に関して簡潔にまとめたものだそうです。

エディトリアルとは、現在重要視されている問題や、今後大きく議論されると予測されるトピックや研究に言及した論文を指します。‥ 雑誌に掲載された特定の論文内容や研究方法に言及する場合はあります。(巻頭辞(エディトリアル)の書き方について genius.jp.net)

特定の論文に関するコメントもEditorialに含まれるようです。

NEJM誌はEditorial、Lancet誌はCommentとしていますが、要は論文著者以外で当該分野に詳しい人が書く批評です。(医学論文の読み方(2) 西村多寿子のブログ)

編集後記」editorials は、医学学術誌のその号に掲載された様々な論文を批評した論文です。世界的に著名な学術誌では、論文ごとに editorial を掲載することが一般的で、その号に掲載された original articles を批評する editorials が掲載されます。(Menu 15 医学論文の抄読会を楽しく乗り切る方法 icrip.jp)

参考サイト

  1. New England Journal of Medicine (NEJM) Editorial検索
  2. Lancet Comments

免疫学 プライミングとは?

プライミングとは プライミングという現象が見られる例

免疫系を賦活するための予備刺激 少量のLPS処理によるpro-IL-1βの誘導,いわゆる“プライミング” (プライミング 実験医学online)

アレルギー反応は1)最初に遭遇したアレルゲンへの曝露時に生じる反応(感作あるいはプライミング相)と、2)感作を受けた後で獲得免疫系が誘導された後に、同じ抗原に曝露された時の反応(エフェクター相)に区別することができる(図2)(2)。https://www.jbpo.or.jp/med/jb_square/autoimmune/immunology/im09/01.php

cDC(標準型樹状細胞)2細胞は、通常DCファミリーに起因する一般的な機能、MHCクラスII上の抗原提示を介したナイーブCD4+ T細胞のプライミング、および共刺激に関与します。https://www.thermofisher.com/jp/ja/home/life-science/cell-analysis/cell-analysis-learning-center/immunology-at-work/dendritic-cell-overview.html

Interleukin-12 (IL-12) is a heterodimeric cytokine produced primarily by antigen-presenting cells (monocytes, macrophages, dendritic cells, and B cells). Its production is stimulated by bacteria, bacterial products, and intracellular parasites and enhanced by priming with granulocyte-macrophage colony-stimulating factor (CM-CSF) and interferon-gamma (IFN-gamma) or inhibited by IL-10. https://bibgraph.hpcr.jp/abst/pubmed/8613697

好中球のO2-産生には、プライミングという現象が知られている。好中球があらかじめ特定の刺激因子の作用を受けるとプライミングされた状態になり、続いて異なる刺激因子の作用によりO2-産生の著しい亢進が起こる1, 2)。プライミング作用を有する因子として、IL-1、腫瘍壊死因子(tumor necrosis factor; TNF-α)、顆粒球コロニー刺激因子(granulocyte colony-stimulatingfactor; G-CSF)、顆粒球・マクロファージ刺激因子(granulocyte-macrophage colony-stimulatingfactor; GM-CSF)、IL-8などのサイトカインがある3, 4)。http://plaza.umin.ac.jp/j-jabs/35/35.322.pdf

IL-2 は、IL2Rβ鎖および IL2Rγ鎖の両者を発現する抗原特異的なナイーブ T 細胞や NK 細胞を含む隣接細胞にトランスプレゼンテーション(trans-presentation)するため、活性化された DCの表面上に発現する IL2Rαに結合することができます4。この IL-2 のトランスプレゼンテーションは、IL-2 を産生するためにナイーブ T 細胞をプライミングする初期の免疫応答に必要な、高親和性の初期 IL-2 シグナル伝達を促進することが示されています6。https://www.nacalai.co.jp/ss/Contact/pdf/review-IL2-invivogen.pdf

脳波の解析に必要な線形代数の知識

主成分分析(PCA)

独立成分分析(ICA)

 

参考サイト

  1. 脳波解析マニュアル 脳波解析の方法を紹介
  2. ヒトの状態推定をするために脳波の時系列データを如何にモデリングするか 2018-11-09 kenyu-life.com
  3. https://www.slideshare.net/ssuser186f56/eeg-analysis-nonlinear

参考文献

  1. 物理からみた脳波 青木亮三 日本物理学会誌45(9):621-628 (1990).

参考図書

  1. 脳波解析入門 Windows10対応版 EEGLABとSPMを使いこなす 開 一夫 編金山 範明 編 2020年12月09日 東京大学出版会 適切な脳波の計測解析がこの一冊で可能に!脳活動研究に興味のある人必携の書。EEGLAB開発者スコット・マケイグの全面協力を得てチュートリアルを作成。専用ウェブサイトにて、チュートリアルデータや詳細な説明を提供。
  2. 市川 忠彦 新版 脳波の旅への誘い 第2版 ‐楽しく学べるわかりやすい脳波入門 2006/4/24  星和書店
  3. Mike X. Cohen and Jordan Grafman『Analyzing Neural Time Series Data Theory and Practice』Chapter5
  4. 田中 聡久 信号・データ処理のための行列とベクトル- 複素数,線形代数,統計学の基礎 – (次世代信号情報処理シリーズ 1) 2019/7/10  コロナ社
  5. 岡部 靖憲『実験数学 ―地震波,オーロラ,脳波,音声の時系列解析― 』2005年11月10日 朝倉書店 *大学図書館(他キャンパス)に蔵書ある

その他

  1. パッチ式脳波計 https://www.pgv.co.jp/technology-device
  2. 脳の神経細胞が行う掛け算の仕組みを解明

HALBAUによる多変量解析の実践 現代数学社

HALBAUによる多変量解析の実践

『HALBAUによる多変量解析の実践』現代数学社1995年1月25日

HALBAUという統計ソフトは現代数学社から(当時?)売れているものだそう。愛称「ハル坊」は、NECのPC9801で走る統計プログラムパッケージで、High-quality Analysis Libraries for Business and Academic Users)とのこと。PC9801っていつの時代だよ?って思います。HALBAUによる という書籍タイトルですが、別にHALBAUを使う必要はいまどきありません。本の中身は具体例が多くて、興味深いものです。編著者の名前でこの本に辿り着いたのですが、期待を裏切らないいい教科書だと思いました。理屈の部分が結構数式できっちり説明されています。

アマゾンで1円で売られていますが、HALBAUの部分を除いて考えても、とてもよい、コンパクトにまとまった多変量解析の教科書なので、お買い得かも。

『多変量解析の展開 隠れた構造と因果を推定推理する』(統計科学のフロンティア5 岩波書店 2002年12月10日)

『多変量解析の展開 隠れた構造と因果を推定推理する』(統計科学のフロンティア5 岩波書店 2002年12月10日)

図書館で借りました。

共著ですが各チャプターの著者がその領域の第一人者ばかりで、それだけでも刺激的な本であることがわかります。

目次

第I部 独立成分分析とその周辺 甘利俊一

1 信号の混合と分離独立成分分析の枠組み 2 問題の定式化 3 独立成分分析,主成分分析,因子分析 4 確率変数の従属性コスト関数 5 最急降下学習法 6 自然勾配学習法 7 独立成分分析における最急降下学習 8 推定関数と学習アルゴリズム 9 独立成分の逐次的抽出 10 信号の時間相関を利用する方法 11 時間的な混合とデコンボリューション 12 画像の分解と独立成分解析 参考文献

第II部 構造方程式モデリング,因果推論,そして非正規性 狩野裕

1 因果推論何が問題か 2 検証的因果推論パス解析 3 探索的因果推論共分散選択 4 構造方程式モデリング 5 因果の大きさを正確に測定する 6 因果の方向を同定する 7 回帰分析の役割 8 非正規性の問題 9 構造方程式モデリングの役割まとめに代えて 参考文献

第III部 疫学・臨床研究における因果推論 佐藤俊哉・松山裕

1 因果を探る 2 因果モデル 3 因果グラフ 4 因果パラメータの推定 5 因果は巡る 参考文献

補論A 分布の非正規性の利用 竹内啓

補論B 多次元AR モデルと因果関係 石黒真木夫

柳井 晴夫『多変量データ解析法―理論と応用』 朝倉書店

柳井 晴夫『多変量データ解析法―理論と応用』(行動計量学シリーズ)1994/12/1 朝倉書店 を図書館で借りて読みましたが、多変量解析で用いられる手法の数学的な理論の解説でした。線形代数を知らない人にはチンプンカンプンの書物でしょう。目次は、

1. 多変量データ解析概論
1.1 多変量データ解析とは
1.2 多変量データ解析の各種方法
1.3 多変量データ解析の最近の動向
2. 基本的数理
2.1 ベクトルによる分散と相関の表現
2.2 多変量データとその行列による表現
2.3 質的データの相関
2.4 多変量データ間の距離
2.5 確率変数による分散共分散行列とその表現
3. 多変量データの構造分析
3.1 主成分分析
3.2 主成分分析の利用法
3.3 データが類似度で与えられる場合の分析法
4. 予測と判別
4.1 重回帰分析
4.2 重回帰分析の諸問題
4.3 多変量回帰分析
4.4 判別分析
5. 多群の変量間の関連分析―正準相関分析
5.1 正準相関分析
5.2 正準相関分析の諸性質(その1)
5.3 正準相関分析の諸性質(その2)
5.4 正準相関分析の適用例
5.5 正準相関分析における新展開
6. 質的データの数量化―数量化理論と関連手法
6.1 数量化の基本概念
6.2 数量化Ⅰ,Ⅱ類
6.3 数量化Ⅲ類と対応分析
6.4 偏対応分析とその性質
6.5 その他の話題―対応分析の新しい展開
7. 潜在変数分析―因子分析と共分散構造分析
7.1 潜在変数モデルとは
7.2 因子分析法
7.3 共分散構造分析
7.4 項目反応理論
8. その他の手法
8.1 多重配列データの解析法
8.2 生存時間データに関する多変量データ解析
8.3 多変量解析の応用と多変量解析パッケージ
9. 付録:数学的性質
9.1 ベクトルの行列
9.2 固有値,固有ベクトルとその性質
9.3 直交射影行列とその性質
9.4 一般逆行列とその性質
9.5 一般逆行列と射影行列
9.6 行列の諸性質

数学を用いて、多変量解析の種々の技法を数学的な原理からスッキリと理解したい人向け。自分には読むのが極めて困難な本でした。

マンホイットニーのU検定とウィルコクソンの順位和検定とウィルコクソンの符号順位検定の違い

マンホイットニーのU検定とウィルコクソンの順位和検定とウィルコクソンの符号順位検定は、名前が似ていたり、内容が似ていたりして、普段t検定ばかりつかっていると、すぐに何がなんだったのかを忘れてしまいます。

パラメトリック検定であるt検定(つまり2群間の比較)で対応が無い場合に対応するノンパラメトリック版が、マンホイットニーのU検定およびそれと全く同値であるウィルコクソンの順位和検定です。マンホイットニーのU検定とウィルコクソンの順位和検定はやっていることが同一(同値)なので、どちらを使っても構いません。対応がある場合のt検定のノンパラメトリック版が、ウィルコクソンの符号順位検定です。「対応がある」のですから、比べたい2群のそれぞれのデータ数はもちろん同じでなくてはなりません。それに対して、マンホイットニーのU検定やウィルコクソンの順位和検定では、比べたい2群のそれぞれのデータ数(サンプル数)は異なっていても構いません。

参考図書

  1. 狩野克己、高橋秀人『基礎 医学統計学 改訂第6版』 この本がスッキリとした説明でなおかつ、計算式および簡単な実例を解説しているので、検定の中身がブラックボックスにならず、自分で何をやっているのかが自分で納得できるというメリットがあります。厳密な理論は理解したいとまでは思わないけど、検定で何をやっているのか計算式くらいは知っておきたいというスタンスの人に丁度手頃な教科書。きわめて整然と多数の手法がまとめられているので、自分の頭の中をスッキリと整理するのに役立つ本。2019年に第7版が出ています。フォントが変わったりして見やすくなったが、内容に変更はないようです。統計学の勉強のための最初の一冊としても申し分ないし、日常的に使うためのリファレンスとしても良い本なので、是非手元に置いておきたい本です。