今ではエコー(超音波による観察)が立体的にできて、時間を追えるので、4D(3D+時間)エコーが実現しています。これによりおなかの中の赤ちゃんが育つ様子が非侵襲的に観察できるということになります。
Life Before Birth – In the Womb Naked Science チャンネル登録者数 138万人 チャンネル登録
- 4Dエコーとは?いつから受けられる?料金や3Dとの違いは? 2018年2月19日 監修専門家 助産師 佐藤 裕子
今ではエコー(超音波による観察)が立体的にできて、時間を追えるので、4D(3D+時間)エコーが実現しています。これによりおなかの中の赤ちゃんが育つ様子が非侵襲的に観察できるということになります。
Life Before Birth – In the Womb Naked Science チャンネル登録者数 138万人 チャンネル登録
。同位体(isotope)とは,原子番号(陽子の数)が等しく,中性子数(従って質量数)が異なる核種のことをいいます。同位体には,不安定で放射能をもつ放射性同位体と,安定で崩壊しない安定同位体とがあります。例えば炭素では,12C(質量数12)と13C(質量数13)が安定同位体であり,14C(質量数14)が放射性同位体です。
同位体比は試料の起源や周囲の環境要因などによりわずかではあるものの変化します。
C4植物(トウモロコシやサトウキビなど)はC3植物(アカシヤ,レンゲ,クローバーなど)に比べて高い割合で13Cを取り込むことが知られています。
炭素の安定同位体比は、国際的に定められた標準物質*に対する13C/12Cの偏差として以下の式で表します。
δ‰ = 1000 x (Rsample – Rstandard)/Rstandard
Rsample:試料中の13C/12C
Rstandard:標準物質中の13C/12C
炭素安定同位体比の標準物質:PDB (Pee Dee belemnite:アメリカ・サウスカロライナ州にあるPee Dee層から産出したイカの仲間 belemniteの化石に含まれる炭酸カルシウム)が用いられる。
市民公開講座「心不全と上手に付き合う」医師より 神戸市立医療センター西市民病院 チャンネル登録者数 1480人
心臓のポンプとしての働きが低下して、全身の臓器に必要な血液量を送ることができなくなった状態をいいます。‥ 心不全は一つの疾患名ではありません。 心筋梗塞、狭心症、心筋症、弁膜症、高血圧、不整脈などの疾患が最終的に至る病態で『終末像』と言われています。
(第42話 「心不全(しんふぜん)とその予防」 山形済生病院)
心不全という病気は、心臓の機能が悪くなった状態で、症状としては息切れやむくみ(浮腫)が生じて、徐々に悪くなっていき寿命を縮めてしまうことになります。治療によって症状がよくなったとしても、完治するものではなく、一度心不全と診断されたら、残りの人生は心不全と気長に付き合っていく必要があります。
心不全は悪化していく病気ですが、薬による治療はバランスを考えた食生活、心臓に負担を掛けないような心がけを日頃からすることによって、改善がみられたり、進行を遅らせることができます。
心不全の症状が強く出現して困っている状態を「急性心不全」と呼び、薬を使うことでその症状が落ち着いている状態のことを「慢性心不全」と呼んでいます。つまりどちらも「心不全」ですので、心不全が「治った」という表現は使えません。このような「慢性心不全」の場合、薬をやめてしまえば当然「急性心不全」の状態に逆戻りしてしまう可能性が高いです
(すでに心不全と言われている方のQ&A 日本心不全ネットワーク)
心不全は高齢になればなるほど患者数が増えることが知られています。米国の研究によると、50歳代での慢性心不全の発症率は1%であるのに対し、80歳以上では、10%になることが報告されています。
(心不全は繰り返す 上手な付き合い方のポイントは? 乾小児科内科医院)
- 日本人の平均的な食塩摂取量は一日12g
- 軽症の慢性心不全では一日7g程度に制限が必要
- ナトリウムは、水を体にためる性質があり、食塩を多く摂取すると循環血液量が増加して心臓に負担がかかるから
(心臓にやさしい生き方 日本循環器学会)
人の体には、血液などの体液を一定の濃度に保つ仕組みがあります。例えば、小さな梅干し10個(食塩20g相当)※を食べると、濃度を一定に保つために、体液量が約2リットル増加します。この過剰に増えた水分を元に戻すために、腎臓は圧力(血圧)と時間(数日間)をかけて血液をろ過し、尿として排泄しているのです。
(塩分と水分<血圧が高くなる仕組み> 放射線医学県民健康管理センター)
ヒトの体は塩を摂取すると、塩分濃度が上がりすぎないよう希釈するために水分を溜め込み、血液全体の容量が増えます。「心臓が回さなければならない血液量が増える」=「心臓の仕事量が増える」ことになります。
(心臓と塩との関係 佐賀大学医学部循環器内科)
ナトリウムは、人の体内で水分調整に関わっていますが、普段は一定の濃度に保たれています。塩分の摂りすぎなどでナトリウムの量が増えると人の体は水分量を増やし、濃度を下げるように働きます。つまり、日常的に塩分が多すぎる食事をとっていると、血液量が増えることになります。
(心不全になると塩分制限が必要なのはなぜ?理由を分かりやすく解説 心臓血管研究所附属病)
参考サイト
https://www.jhf.or.jp/topics/2019/007954/
論文紹介記事を読んでいたらハザード比が出てきたのですが、
睡眠規則性指数(sleep regularity index;SRI):毎日の入眠覚醒サイクルの一貫性を示す。100であれば毎日の入眠と覚醒が同じ時間。0であれば入眠と覚醒の時間が常に異なる。
睡眠の規則性が最も乱れている人(SRIスコアの5パーセンタイルに位置する人)の平均スコアは41点、最も規則正しい人(SRIスコアの95パーセンタイルに位置する人)の平均スコアは71点、スコアの中央値は60点。
中央値7.2年におよぶ追跡期間中に480人が認知症を発症。SRIが5パーセンタイルの人では、SRIが中央値の人に比べて認知症発症のハザード比が1.53(95%信頼区間1.24〜1.89)であり、認知症リスクの増加が認められた。
https://medical-tribune.co.jp/news/2023/1225560559/
オッズ比との違いってなんだっけ?となってしまったのでメモっておきます。なぜごっちゃになったのかというと、似ているところがあるからなんですね。
タバコを吸うと、肺癌になりやすい?
睡眠が不規則だと、認知症になりやすい?
この2つのケースを考えたとき、原因と⇒結果 という関係に関するという点ではどちらも同じです。しかし、患者を一定期間追跡して、時間も考慮して分析するかどうか、それとも、患者の追跡はせず(横断的な研究など)ある時点での原因の有無と結果の有無を集計するだけか、という研究デザインの違いがもしあれば、そこで違いが出てきます。肺癌か認知症かという研究対象の違いでなく、追跡期間を考慮した分析をしたか(時間を追って、イベント発生のタイミングを記録したデータか)どうかという研究手法(=データ収集方法)の違いが大事になってくるというわけです。
リスク比:時間要素を含まない相対指標
オッズ比:時間要素を含まない相対指標。リスク比を近似する指標。
ハザード比:初回イベントまでの速さで比較したリスク比
(参照:統計検定1級対応 統計学 日本統計学会編 2013年 東京図書 第10章 医学生物学分野キーワード 10.4効果の指標)
勉強というのは、似ていること(共通すること)と似ていないこと(異なること)との区別をしていく作業のような気がします。
タバコを吸う吸わないの違いが、肺癌になる可能性に影響するか?に関して、ある時点での病気の有無と過去の喫煙歴のデータがあったとした場合は(つまり、横断研究や後ろ向き研究によって収集されたデータ)、オッズ比が計算されます。
タバコ吸う:肺癌10人 健常90人
タバコ吸わない:肺癌1人 健常99人
というテーブルが与えられたとしたときに(数字は適当です)、
タバコを吸う人が肺癌になるオッズは10/90 = 0.11
タバコを吸わない人が肺癌になるオッズは1/99=0.01
オッズ比=0.11/0.01 = 11
となります。タバコを吸うと肺癌になる危険が11倍というわけです。
ここで、「時間」の概念は登場していません。ある時点での話というわけです。
それに対してハザード比は、時間経過を問題にした解析方法です。
生存曲線に関する話ですが、死ぬ確率の確率密度関数をf(x)としたときに(横軸xは時間)、tの時点までに死ぬ確率は、f(t)をマイナス無限大からtまで積分したもの
F(t)= $ \int_{-\infty}^{t} $ f(t’)dt’
になります。逆にtの時点でまだ生きている確率S(t)=1-F(t) となります。ここでハザード関数(hazard function)として時刻xにはまだいきているが、その後すぐに死ぬ割合を考えます。
h(t) = f(t) / (1-F(t))
ちなみにh(t) = $\frac{d}{dt}$ (-log S(t)) という関係です。合成関数の微分法を思い出すとlogの微分は分母にきて中身を微分したものを掛けるので確かにそうですね。
さて生存曲線やハザード関数は、様々な予後予測因子を変数に含むと考えられるので、X=(X1, X2, …, Xs)をパラメータとして含みます。Xとしてある基準点を考えてX0とし、パラメータがX0のハザード曲線に対して、パラメータがXのハザード曲線がどんな比になるかをしめしたのがハザード比ということになります。このとき、生存曲線のモデルとしてハザード比が時間に依存しないようなものを仮定していれば、ハザード比は時間に無関係なある値を与えます。
どうも一冊の教科書で、初学者がついていけるような説明をしてくれているものがあまり見当たりません。
ちなみに生存時間の解析では、イベントの発生=死ぬこと が多いですが、生存時間分析自体は一般性があることなので、イベントはなんでもよくて、病気の転移、完治などでも構いません。
ハザード比の説明を教科書に求めたのですが、案外どの統計学の教科書も初学者向けかつ網羅的な説明がないような気がします(自分が読み取れていないだけ?)。日本統計学会編 の 統計学実践ワークブック 統計検定準1級対応 は数学的にきちんとした説明があって、コンパクトさと網羅性を両立させたために、文章による説明は少ないのですが、理路整然としたまとめ方が自分は気に入っています。
ここ数日、体調不良(微熱?)、咳、鼻水で調子が良くないのですが、葛根湯を飲んだり、パブロン滋養強壮剤を飲んだりしてだましだまし生きてました。体のだるさは完全になくなりましたが、昨日は咳がひどくて朝の通勤電車に乗っている間は咳を我慢するために腹筋がつかれました。鼻水もひどくて、駅の売店でポケットティッシュ―を大量に買いました。のど飴ももちろん必須です。今日は咳の頻度はかなり低くなって楽ですがそれでも鼻水がまだ完治していません。
12月と言えば忘年会の季節ですが、風邪気味の状態で忘年会に出るのはリスキーで、もし風邪じゃなくてコロナだったらコロナを拡散させてしまうことになります。もちろん風邪でも人にうつすのはマズいのですが。
薬局で買えるコロナ検査キットで検査すべきかどうか悩みます。検査を周りに勧められたので薬局に出向きました。新型コロナとインフルエンザが同時に検査できるコンボタイプのキットが1980円(消費税10%で、総額2178円)でした。
SARSコロナウイルス抗原キット インフルエンザウイルスキット エスプラインSARS-CoV-2&FluA+B という商品名です。製造は、富士レビオ株式会社。
薬局の中の薬剤師がいるコーナーで薬剤師に声を掛けたら奥から持ってきてくれました。上のウェブサイトにあるような「箱」にははいっていなくて、ジップロックの袋に中身がポロりんと入ってました。購入にあたっては、氏名、住所を書かされました。やったことがあるか聞かれてないというと、採取の方法を説明してくれました。2cmくらい入れて採取するそう。
さて、あらためて説明書を読むと、2つ図があって、??と思いました。よくよく読むと、「鼻咽頭ぬぐい液」の採取方法と、「鼻腔ぬぐい液」の採取方法の2種類でした。鼻咽頭ぬぐい液を採取する場合には、棒をかなり鼻の孔の深くまで突っ込む必要があります。これは、以前、病院で検査を受けたときに医師の人が自分に対してやっていたことだと思います。自分では恐ろしくてこんな深くまで入れるのはできません。それで鼻腔ぬぐいを普通の人はやるようになっているのでしょう。
鼻腔ぬぐい液の採取は、他社メーカーのキットの説明を見ていたら左右両方からと書いていました。しかしメーカー(商品)によっては、一つの鼻の孔だけでよいようです。
採取した綿棒を突っ込む溶液はすでにチューブに入っていました。しかしチューブの壁や上の部分に液体がついていたりしたので、チューブの先を下にして何回か振って液体が全部底部に集まるようにしました。このチューブはふにゃふにゃで指でおすとへこみます。あとで綿棒を押すようにする必要があるので柔らかい材質なんですね。
さていよいよやってみます。スポンジスワブの包装をひらいてスワブを取り出し、鼻の孔(右にしました)に差し入れました。おもったより柄がやわらかいです。2cmていど挿入するといわれてもどこが2cmかわからないので、挿し込んで鼻の内部にあたってくすぐったい感触がするくらいの深さまでいれました。鼻の出口部分を指で押さえて、出したときに入っていた部分の長さがわかるようにしました。そこで5回転くらい柄の軸を回転させてさらに5秒くらい鼻の壁にくっついた状態で待ち、それから引き出しました。いま鼻水がすごいので、なんか綿棒部分が黄色くなったような気がします。まあだいたい2cmくらい入っていたはず。
液体が予めはいっているチューブ(振って、壁面や上部の液滴が底に集まるように予めしておいた)に綿棒をつっこんで液体部分に先をいれて、説明書通り、チューブを押さえて綿棒部分を押し洗いするようにして採取されたものが液体に溶けだすようにしました。10回くらい回転させながら。
チューブの上部にはめる「滴下チップ」をはめ込んで、静置します。5分。
いよいよ本体部分をアルミ包装から取り出して、机の上に置きます。それからチューブを逆向きにして(滴下チップが下)、「2drops」とかかれた部分の窓の上あたりで滴下。しずかにチューブをはさんで液体が出てくるのをみながら、まず1滴。さらに1滴。液はたくさんあまりますが、2滴落とし込んで、そのあと黄色い部分を押し込みました。
3分するとうっすらと「r」の部分に赤い線が見え始めました。「r」は、対照という意味ですが(多分、リファレンス reference)、ここに線が出ると検査自体が上手くいったという意味になります。r F Cと並んでいます。とりあえずF(インフルエンザ)にもC(新型コロナ)にも線が現れてこないようです(まだ5分しかたってませんが)。普通の風邪なら、FもCも線が出ないということになりますので、風邪であってほしいです。ちなみに室温はエアコンで23度に設定しています。
判定は20分後にすることになっています。説明書をよく読んだら、「r」のところにはもともと赤いラインがあるみたい
です。現れたわけじゃなかったんですかね。
10分経過しましたが、何の線も現れてきません。ただ全体が白っぽかったものが、青みがかってきました。12分してもどこにも線が現れません。ドキドキですね。
18分経過。全体に青みが強くて、バックグランドが高い状態ですが、rのところに線が急に見えてきました。FとCには線はありません。
20分経過しました。「r」のところに非常につよく線が出ています。FやCにはまったくありません。よかった。風邪でした。
(20分後の状態)
26分してみると、rだけ非常に強い太い線が出ています。FとCはどうみても何もなしです。期待通りでホッとしました。
まあ症状からして普通の風邪っぽかったので、今までの経験に照らし合わせて、多分コロナじゃないだろうとは思っていたのですが、確認できて良かった。
ちなみに1時間半後に見てみたら、rの線の色がほとんど黒にちかい青にまで濃くなっていましたが、FやCの部分には線は微塵もなしでした。
重要な病原体の検査がこんなに安価で気軽に個人でできる世の中になっているとはすばらしいことですね。検査キットも、もちろん海外のメーカーのものも出回っていますが、自分が使ったのは日本の会社のものでしたし。日本の技術力の高さはありがたいことです。
検査キットに関する参考サイト
小林製薬が販売している富士レビオ社製のエスプラインは、唾液でも測れるとしていますが、富士レビオ社のFAQを読むと唾液を検体として用いるのは承認されていないという回答でズレがあるようです。
線がうっすら出ている場合どう判断するのか気になるところですが、Abbott社製の製品PanBioの動画説明を見ると、The presence of any test line (T), no matter how faint , indicates a positive results. たとえどんなに薄くても線があれば陽性という判断をすべきだそうです。
メーカーが違えば製品も異なり、手順も多少ことなるようです(何滴垂らすかなど)。製品の説明書をよく読んで、その通りにしたほうがいいでしょう。
t検定とは何でしょうか?一番分かりやすい説明をしてみますと、t分布に従う検定量Tをつくって検定する方法と言えます。t検定を理解するためには、そもそもの大前提として、「検定とは何か」を理解しておく必要があります。それさえわかれば、ナニナニ検定などの内容を個別に理解する必要がなくなり、統一的な理解が可能になります。
検定の基本をおさらいしておくと、帰無仮説(棄却したい仮説)とその逆の関係である対立仮説(こちらであってほしいと期待する仮説)を用意します。帰無仮説の内容が起こる確率を計算してそれが0.05未満であれば、そんなまれにしか起きないことが起きたとは思えないので、帰無仮説の内容は間違っているものとして棄却する、すなわち、対立仮説が正しいと結論づけるものです。この検定の考え方は、全ての検定方法で共通することなので、まずはこの概念の理解が大事です。t検定は1変数だの2変数だのあって、初学者は混乱させられますが、上記の考え方をわかっていると、自分が知りたいことがどっちで、何をすればいいのかがわかります。
これをおさえておけば、t検定だろうが、ナニ検定だろうが何も恐れることはありません。なにがしかの「検定量」とその検定量が示す「分布」が分かっていること、計算できることが必須です。そうすればその検定量が得られる確率が求められるので、稀にしか起きないことなのか、全然起きてもおかしくないことなのかの判断ができるわけです。稀にしか起きないのであれば、そもそもの最初の仮説(帰無仮説)が間違いだったよねと結論して、対立仮説が正しいと言えます。
正規分布N(μ、σ^2)に従う確率変数Xを変数変換して
Z=X-μ / σ とするとZは標準正規分布N(0, 1)に従うのでした。
正規分布N(μ、σ^2)の母集団からn個の標本を抽出してつくった平均値がどんな分布に従うか?というと、N(μ、(σ/√n)^2)という正規分布に従います(定理)。ちなみに、母集団が正規分布であるという仮定を外して、一般の分布の母集団の話とした場合には、nが大きければ、N(μ、(σ/√n)^2)という正規分布に近づくことも示されています。
さて母集団は正規分布だったとして話を続けると、標準偏差がσだったのが、標本の分布では、標準偏差はその√n分の1に小さくなるわけですね。母分散σ^2(もしくは母標準偏差σ)が既知であれば、
(標本Xの平均値-μ) / (σ/√n)が標準正規分布に従うという定理を利用して、区間推定ができます。標準正規分布の95%信頼区間は-1.96から1.96までの間なので、
-1.96 ≦(標本Xの平均値-母平均μ)/(σ/√n))≦ 1.96
という不等式を立てることが出来ます。標本抽出をしたわけですから、上の不等式のなかの変数のうち標本Xの平均値、標本数nは既知です今、母標準偏差σも既知の場合を考えるので、未知数は母平均μだけです。よってμについて不等式を解けば、μの範囲(95%信頼区間)が求まるというわけです。
さて、母標準偏差σが既知ならこれでいいのですが、一般的には母標準偏差σが未知であることのほうが多いでしょう。それでも母平均μを推定したいというのが、課せられた問題なわけです。じゃあどうするのか?単純に考えると、わからないものは仕方がないから近いもので代用すればいいんじゃね?という発想があります。つまり母標準偏差σ(未知)のところに標本標準偏差s(既知)を入れてしまえというわけですね。
しかしそれではあまり正確ではありません。nが大きければsはσにより近づくでしょうからいいかもしれませんが、通常何かを観察するときに標本数を大きくすることはできませんので、σのかわりにsを使うのは都合が悪いのです。仕事で統計解析を使っているが、正確な分析ができなくて困っていたゴセットさん。いい分析手法が存在しなかったので、ついに自分で編み出してしまったのです。賢い!
t分布(統計量T)を発見したゴセットさんは、μは含むがσは含まないようなうまい統計量を考えだしました。それが統計量Tであり、Tが従う分布というものも見つけだしました。
T = (標本Xの平均値-μ) /(s/√(n-1))
上で示した (標本Xの平均値-μ) / (σ/√n) の式にちょっと似ていますが、ちょっと違います。
σのところがsに置き換わっていますが、nもn-1になっています。そしてこのTという量は、t分布という分布に従うのです。t分布の形は正規分布によくにていますが同じではありません。ただしnが大きくなれば、正規分布に近づきn無限大の極限で正規分布になるような分布です。
どうやって「μは含むがσは含まないようなうまい統計量」を見つけたのでしょうか?それは、σを含む、分布が既知の2つの統計量をそれぞれ分子と分母に持つような統計量を考えたのでした。分子と分母の両方にσが現れるのでそれらは約分されて消えてくれるというわけです。
χ2乗分布は、標準正規分布する確率変数を例えば3個取り出して
X = x1^2 + x2^2 + x3^3 という2乗和をつくったときにXが従う分布です。
自由度は取り出した変数の数で、今の場合3になります。さてこの手順を10000回繰り返して得られる10000個の2乗和がどんな分布を示すかヒストグラムを書いてみますと、
のようになります。なおヒストグラムはpython3で描きました。python3のコードはChatGPT-3.5に作ってもらいました。
上の図が自由度3のχ2乗分布ですが、自由度が1,2,3,4,5,‥とかわったときに分布の形はどう変わるでしょうか。試しに描いてみます。
こんな感じになります。自由度10まで描きました。縦軸はデータ数が10000個のときの度数です。データ数で除算して相対度数で表示すれば、
となります。自由度が大きくなるほどベルシェープ(正規分布)の形に近づいているように見えます。試しに自由度1000にして、サンプル数100000個のヒストグラムを描いてみます。
どうやらこれは正規分布に近い形ですね。今の場合自由度=1000ですが、それが平均値になっているようです。さらに自由度10000にしてみると(サンプル数100000個)、
これくらい自由度を大きくすると、綺麗に左右対称になりました。
自由度kが十分に大きいときカイ二乗分布XはN(k,2k)に収束する
(【統計学】カイ二乗分布の正規近似 自由度が無限大のときのカイ二乗統計量 2022年12月23日 ウサギさんの統計学サロン)
やっぱりそうなんですね。プログラムでいろいろ描いてやると、こういったことが簡単にわかって面白いです。プログラミングは、勉強の道具として最高だと思います。自分はプログラミングはほとんどできないのですが、ゼロからこういったコードを書ける必要がもはや全くなくなりました。生成AIの代表格であるChatGPTさまさまです。「こんなことをしてくれるコードをちょうだい。」と投げるだけで、(多くの場合)完全に動くコードを返してもらえます。凄い時代が来たものです。
今は標準正規分布から変数を取り出しましたが、「標準」でない正規分布N(μ, σ^2)の場合はどうすればよいかというと、X-μ / σ という変数を考えれば、これは標準正規分布に従うので、X-μ / σ の2乗和がχ2乗分布に従うことになります。
日本では星細胞という名前よりも伊東細胞の方がまだ馴染みがあるのかもしれません。この細胞には、他にもfat-storing cell, lipocyte, interstitial cell, vitamin A-storing cellなど実に様々な名称で呼ばれてきた歴史があります。http://hepato.umin.jp/kouryu/kouryu05.html
肝臓の類洞周囲腔に存在する肝臓星細胞はビタミンA貯蔵細胞であるが、ウイルス感染やアルコール摂取など様々な刺激に反応して活性化し、コラーゲンを合成・分泌するようになるため、肝線維化の責任細胞としても知られている。http://hepato.umin.jp/kouryu/kouryu15.html
個人のゲノムDNAを読むことは、倫理的、法的、社会的にどんな影響があるのでしょうか。
論文を書くときに、n=9などと書きますが、その実験の例数nはどう数えているのでしょうか?異なる分野の研究者と話をしていると、nの数え方が実は、研究分野によって独特だったりするような気がします。
基本的な考え方を最初に言ってしうまうと、nといったときにそれが何を意味するかは、
の2通りがあり、通常論文でn=9などと書く場合、それは、biological replicateですし、そうあるべきです。ところが、人によって、あるいは分野によっては、technical replicateに過ぎないのに、それをあたかもbiological replicateであるかのように(しかし決してそれが何であるかには言及せずに)n=9などと書いている場合があります。これは、研究の作法に反する行為で、私は個人的には研究不正と同類の行為だと思っています。意図的にやっている人間は研究者として全く信頼できませんし、無知でやっている人間もやはり研究者として全く信頼できません。
勿論、technical replicateであることが分かるような説明をハッキリとMaterials and Methodsなどに書いておき、査読者がそれでよしとして論文がアクセプトされていれば、何の問題もありません。
Conflict of Interestを明示しておけば研究不正には当たらずにすむのに、それを隠したら研究不正とみなされてしまうというのに似ています。
マウス10匹を用いて、各個体におけるある遺伝子の発現量を定量しました。と言う場合は、n=10でわかりやすいでしょう。しかし、実際には、その10匹は1つがいの両親から得られた(1匹の母親から同時に得られた)同腹の10匹だったのか、何回もことなるペアを掛け合わせてえられた10匹(1匹ごとに両親が異なるかもしれないし、数匹は同腹かもしれない)だったのか、いろいろありえるでしょう。親個体が異なれば当然、遺伝子発現量の個体差(遺伝的な背景による差)が大きくなる可能性があります。極端な話、違う系統のマウスの個体を混ぜて10匹としていれば、さらに個体差(系統差)が大きくなるでしょう。通常は一つの系統を使いそのことを論文中に明示します。それが別の系統をつかうと実験結果が変わってくることもあります。マウスのように系統が確立していればまだいいですが、他のモデル生物のように純系が無い場合もあります。そうなると、異なるラボで(ことなる系統のモデル動物を使っているため)結果が再現できないということが起こりえます。雄と雌を揃えたのかどうかなども、実験結果に影響する可能性があります。また遺伝子発現が概日周期を持って変動する場合には、その個体からいつ細胞や臓器を調整したか(1日のうちの何時に)でも結果がばらつく恐れがあります。
個体に由来する細胞の調整であれば(例えば、個体を解剖して脳や肝臓やその他の臓器などから、細胞を取り出して培養する、primary culture)、3個体に関して実験を別々に行い(異なる細胞由来の細胞を混ぜたりはもちろんしない)、3つの測定値を得ることができます。これはn=3(nは個体の数)で、最も望ましい実験だと思います。
分光光度計で吸光度を測定したりする場合には、同じサンプルに対して何度も測定値を得ることができますし、その測定値が一定しないこともありえます。測定が安定していれば、通常は一度しか測定値を得ないことが多いでしょう。というか、光源が安定して測定値が安定してから(何回測定しても同じ値にしかならなくなってから)、1回だけ測定するのが普通です。もし何回も測定した場合でも、それをnとすることはありません。測定がばらつくのなら測定を繰り返して平均を一つの測定値とすべきでしょう。
同じ試料(同じ由来の細胞などの抽出液など)をわざわざ3つのチューブに分けて処理(もしくは化学反応など)して、ピペッティングなど手技のバラツキを平均するということも良く行われます。これをn=3と数えるのかどうかは、研究者によって考え方が異なるかもしれません。手技によるバラツキは本来はあってはいけないことなので、これを例数として個別にカウントするのは違うのではないかという気がします。triplicateで実験して得られた3つの測定値は平均して、一つのデータ(値)とすべきでしょう。duplicateやtriplicateで実験することの意味、目的は本来、実験手技のバラツキを補正するためだと思います。n数を稼ぐためにそうするのは、本来の趣旨から外れるでしょう。
96孔プレートを使って細胞を培養して何かを測定するときに、同じ細胞を3つのWellに播いておいて3つの測定値を得るのもTriplicate実験であり、上のチューブ3つに分けた実験と同じことだと思います。
technical replicateかそれともbiological replicateかがわかりにくくなるのは、培養細胞を用いた実験のときです。
株化した細胞を用いた実験やプライマリーカルチャーなどの実験の際に、同一の細胞をディッシュ3枚に播いておいて、それらのディッシュごとに細胞を調整して遺伝子発現をみるなり生化学実験を行うなりしてデータを3つ得るということがあります。これもtriplicate実験で、ディッシュごとのバラツキ(本来はばらつく理由がないですが、さまざまな実験手技によるバラツキ)を補正するのが目的で、これをn=3とするのは趣旨として違うように思います(しかし、実際にはこれをn=3と数えて論文化している研究者は多いと思います)。
まあ、細胞株をどう数えるかは難しい問題だと思います。冷凍保存していた細胞株を起こして培養を始めたときに、培養皿ごとに実験者がコントロールできない条件の差があって、それによって何か変化が起きていないとも限りません。だとしたら、ディッシュ3枚に播いたものをbiological reptlicateと考える人がいるかもしれません。また、3回細胞を起こして実験することの労力を考えたときに、それは現実的でないと判断する研究者もいるのかもしれません。
凍結保存してある細胞株を融解して培養して何か生化学実験を行ってデータを得る場合に、細胞をおこすことに関して3回独立に行って、実験結果の再現性を確認するということもあると思います。これをn=3と数えて、再現性がありましたと結論するのは一般的に行われていると思います。
細胞を起こす時期が長くあいたりすると、培養に用いる血清のロットが変わってしまって、結果がなかなか再現されにくくなってしまうということもあるでしょう。そもそも培養液に添加する血清のロットが変わったくらいで実験結果が変わってしまうのであれば、そんな実験結果を報告することに意味はないと思います。なぜなら、他の研究室では再現できない結果だというわけですから。しかし、使う血清のロットが変わると実験結果が変わる恐れがあるので、一つの実験が完了するまで同じロットが使えるように買い込んでおくというのはわりと聞く話です。
培養細胞に関するreplicateの考え方としては、もっとも保守的にやるのであれば、冷凍保存した細胞株を3回起こしてそれをn=3とするのがいいと思います。
通常、細胞株の保存は少量ずつに分けたものをいくつかのバイアル(チューブ)に入れて凍らせておき(液体窒素中で)、実験するごとに一つのチューブを取り出してきて融解してディッシュに播くということをすると思います。この場合、一つのチューブをn=1と数えるというのが、細胞株を使った実験におけるn数のベストのカウント方法でしょう。
a biological replicate would be thawing a new vial of cells from the same stock and repeating the experiment on separate days. https://www.reddit.com/r/labrats/comments/14wse7w/in_vitro_cell_experiments_biological_replicates/?rdt=59132
初代培養は、動物やヒトなどの「個体」から採取した細胞が出発点になりますので、個体を数えることが可能です。この場合は、biological replicateは個体の数ということで紛れがないでしょう。ヒトの場合患者さんが一人しかいなければn=1(biological replicate)になりますが、それは論文中で明示すれば済む話だと思います。
バクテリアの場合も、細胞株と同様の問題(論点)が生じます。ただし、細胞株はバイアル(チューブ)一つを融かしして使うのに対して、バクテリアの場合は必ずしもチューブ1本分を融かさずに、表面を掻きとって寒天培地にストリークすればコロニーが得られるので、何をnとするかに関する議論がさらにややこしくなりそう。
If I grow a bacteria in 3 containers (eg, flasks) from the same stock in one experiment, do those containers of bacterial cultures represent 3 biological replicates or just one replicate? https://www.researchgate.net/post/Is-this-a-biological-replicate
兎に角、何をnと数えたかを論文中にハッキリと書くということが一番大事です。
さて、何をもってnとするかについて考えてきましたが、これら異なる階層を混ぜてよいか?という問題もまたあります。3個体から別々に肝臓を取り出して肝細胞を調整して、実験する段階では1個体からの肝細胞については3枚のディッシュで別々に培養して(つまりtriplicate実験)サイトカインの定量を行ったときに、これはn=3(nは個体数)と考えるのか、n=3×3=9(nは実験数)とするかという問題です。標本抽出は、同一の母集団からランダムに行うという統計学の常識から考えれば、n=9とするのは無理があるように思います。しかし個体が異なっても、細胞の調整が異なっても、本来それらはバラツキがないはずだという理想的なことを考えれば、n=9が間違いとも言い難いものがあります。ただ現実問題として生物学的には様々な要因でバラツキが生じるものなので、現実的に考えれば、異なる階層のものをまぜこぜにするのは実験結果の解釈を困難にするだけで科学研究のやり方として筋が良いこととは言えません。
上の例では個体数3xtriplicateの3でしたが、細胞株の実験で、細胞を起こしてからの実験が3回、最終段階の培養で3ウェルにtriplicateということもあるでしょう。これをn=9としていいかどうかも、研究者本人の考え方次第といえそうです。正しいか間違いかという議論は意味をなさず、そのやり方をしていて現実的に再現性が高い報告といえるのか、真理にどれだけ近づける研究態度なのかという問題だと思います。ちょっと違った見方をすれば、実験が現実的に成り立つやり方なのかどうか(つまり論文化可能なのかどうか)ともいえます。
自分と同じ疑問がフォーラムに投稿されていました。
ある実験でA vs Bの2群で比較するとき、 A(n=3) vs B(n=3)を3回繰り返し評価するとき、 n=9にするのか、1回毎の平均をとって、n=3にするのか どちらを選択されておられますか? 論文を拝見すると両方あるような気がいたします。(実験の取り扱いについて No.11166-TOPIC – 2023/02/02 (木) 05:15:36 – s Bio Technicalフォーラム)
このJCBの論説では、replicate(実験手技のバラツキを補正するためのtriplicateなど)は、nにカウントしてはいけないと明言しています。
- Similarly, a number of replicate cell cultures can be made by pipetting the same volume of cells from the same stock culture into adjacent wells of a tissue culture plate, and subsequently treating them identically. Although it would be possible to assay the plate and determine the means and errors of the replicate wells, the errors would reflect the accuracy of pipetting, not the reproduciblity of the differences between the experimental cells and the control cells.
- If an experiment involves triplicate cultures, and is repeated four independent times, then n = 4, not 3 or 12.
- For n to be greater than 1, the experiment would have to be performed using separate stock cultures, or separate cell clones of the same type.
Error bars in experimental biology Geoff Cumming, Fiona Fidler, David L. Vaux Crossmark: Check for Updates Author and Article Information J Cell Biol (2007) 177 (1): 7–11. April 09 2007 Replicates or independent samples—what is n?
もっともな指摘ですが、実際そうしている人ばかりでないことは明らかです。ですので、注意を喚起しています。たしかに、バラツキが大きくて当然の実験じゃないの?という場合でも、驚くほど小さなエラーバーがついた棒グラフを見かけることがあります。
Whenever you see a figure with very small error bars, you should ask yourself whether the very small variation implied by the error bars is due to analysis of replicates rather than independent samples.
Error bars in experimental biology J Cell Biol (2007) 177 (1): 7–11.
動物個体やヒトの試料を扱う研究であれば、n=個体数 で何も悩まないでしょう。一番問題になるのは、細胞株を用いた実験だと思います。普通は、一つのラボで一つの細胞株のストックを維持しているはずですので、同一の細胞株だとn=1にしかならないの?と考えるのは現実的ではありません。細胞株Aを用いた実験結果はこうなりましたと論文報告する場合には、ラボにストックされているその単一の細胞株(たいてい凍結して保存)を用いて独立に行った実験(凍結されたストックを融解して細胞を生き返らせるところからスタート)の数がnになると思います。ただし、世の中に多数見られる驚くほど短いエラーバーから察するに、triplicate実験をn=3と数えている研究者がかなりの割合いるのではないかと推察されます(望ましいことではない)。
みんながどうしているのか?どんな雑誌に掲載されたどんな実験結果ではどうnを数えているのかを見てみます。
メジャーなジャーナルにもtriplicateをn=3回分と数えたデータ分析をしていて、論文が受理(アクセプト)されています。正しい作法だとは言えませんが、これが現実。指導する側の立場にいる研究者は、これで良しとはしないほうがよいと思います。最低限の倫理として、どういうデータ分析をした結果が図に表現されているのかを図のレジェンドに明記するということが大事だと思います。そういう意味においては、以下紹介する論文は道を外してはいません。
Figure 1e. For the MGMT mRNA means with s.d. of triplicates are displayed.
Figure 2. Luciferase activities are expressed as mean±s.d. of triplicate in one representative experiment (each experiment was repeated two to three times).
Nature Communications https://www.nature.com/articles/ncomms9904
上の論文は、triplicateで測定する実験を2~3回行っていますが、図として見せているのはtriplicateの平均および標準偏差だと説明されています。
Figure 2. The quantified results are expressed as mean ± SEM of three separate experiments, each performed in triplicate (n = 9).
Scientific Reports https://www.nature.com/articles/s41598-017-00997-w
上の論文は、triplicateをn=3として数えて、実験数をかけてn=9としています。
- Figure 4. Data are expressed as the mean ± SEM; *, P < 0.01. Each bar represents data from three experiments performed in triplicate (n = 9).
- All incubations were performed in triplicate, and each experiment was repeated three times using different cell preparations.
- Figure 6. Shown are the mean ± SEM of triplicate determinations of four different experiments.
Endocrinology https://academic.oup.com/endo/article/141/3/1228/2988496
上の例はtriplicateを3回分に数えているようです。
- Experiment 1. Samples were analyzed in triplicate and each experiment was repeated three times.
- Figure FIG. 3. Values represent the mean (± SEM) for data from three independent studies, with each treatment performed in triplicate (n = 9 per observation).
- Figure FIG. 4. Values represent the mean (± SEM) from three independent studies, with each treatment performed in triplicate (n = 9 per observation).
Journal of Bone and Mineral Research (JBMR) https://asbmr.onlinelibrary.wiley.com/doi/full/10.1359/jbmr.2001.16.4.615
上のこの論文もnの数え方が明示されていて、triplicateを3回分に数えています。
HUVECs cultures were plated triplicate on different Ti surfaces and plastic cell culture plate. Data are presented by the relative amount of mRNA with the formula 2 taken plastic plate as a control, statistical analysis (N = 9, three groups repeated three times) was performed by ANOVA with Tukey’s multiple comparison test.
Journal of Biomedical Materials Research https://onlinelibrary.wiley.com/doi/full/10.1002/jbm.a.32539
上の論文もtriplicateを3回と数えていることがわかります。
Figure 2 The results represent the mean of triplicate measurements with PBMC from one healthy donor.
Figure 4 Luciferase activity is expressed as fold increase over control determined as the mean (± SD) of three independent experiments measured in triplicates.
Immunology https://onlinelibrary.wiley.com/doi/full/10.1111/j.1365-2567.2004.01874.x
上のImmunology掲載の論文は、先のJCBが指摘した厳格なnの数え方を踏襲したものになっていました。triplicateはn=3とは数えておらず、図2の棒グラフにはエラーバーを付けていません。図4の実験はtriplicateで行われていますが平均値やSDの計算に用いられたのは3回の独立した実験の結果であることが明記されています。
Figure 3. Results are mean values from experimental triplicates.
Experimental Hematology https://www.sciencedirect.com/science/article/pii/S0301472X0800180X
上の論文も、triplicateからえら得た平均値を示していますがエラーバーは付けていませんので、作法としては正しいと思います。
正しいデータプレゼンテーションができている論文は信頼度が高いと考えてよいでしょう。ちゃんとサイエンスをわかっている人が研究した成果の報告だからです。
以上の議論を簡単に説明しなおすと、nと言ったときにはtechnical repliateと、biological replicateとがあるよということです。測定の誤差を減らすためのnはtechnical replicateであり、これは論文報告で使うべきnではありません。論文にnと書くためには、そのnは、biological replicateである必要があるのです。biological replicateとは、一般的には、動物個体何匹で同じ現象が見られたのか?ということです。
絶対にやってはいけないことは、nと論文に書いておきながらそれがbiological replicateなのかtechnical replicateなのかを明示せず、実はtechnical replicateなのにあたかもbiological replicateのふりをすることです。これは、研究不正とみなされても仕方がない行為です。正直に記述しておけば、不正とはみなされずに済みます。もちろん、論文を投稿した際に査読者から、それを指摘されて却下される理由になるかもしれませんが、だからといって、ごまかすのは研究者としては望ましくない行為だと言えます。nが何かを明示しないような論文を書いていると、他の研究者から信頼を得ることはできないでしょう。
Biological vs Technical Replicates explained Henrik’s Lab チャンネル登録者数 7.61万人