投稿者「PhD」のアーカイブ

データ解析で、エラーバーに表示すべきは標準偏差S.D.か標準誤差S.E.M.か?

科学研究論文の図には測定データの平均値が棒グラフで表示されていてその棒には「エラーバー」がつけられています。エラーバーが短いと測定値のバラツキが少ない、エラーバーが長いと測定値がずいぶんばらついているなと思ったりします。

さてそのエラーバーが意味するところは、標準偏差standard deviation (S.D.)でしょうか、それとも標準誤差standard error of the mean (S.E.M.)?逆の立場でいうと、自分が論文を書くときに図に示すべきはS.D.でしょうかそれともS.E.M.でしょうか?

最初に答えを言ってしまうと、ケースバイケースなのでどちらであるべきと言う言い方はできません。(S.E.M.のほうが測定数nの平方根で割った値のためバーが短くなって見栄えがよいので)「S.E.M.にしとけ」などという先生や先輩がいるかもしれませんが、もしもそんな発言があったとすれば、それは統計のことを全く理解していない証拠だと思います。

  1. Standard Error of the Mean vs. Standard Deviation: What’s the Difference? investopedia.com

生データのバラツキ(母集団のばらつき)を読者に示したければS.D.を見せればよいでしょうし、平均値だけに意味があって、生データのバラツキには興味がないのであれば、得られた平均値の信頼性を示すS.E.M.を見せればよいでしょう。なぜなら、標準誤差(S.E.M.)は、「「平均値」の標準偏差」だからです。

  1. 標準誤差とは|標準偏差との違い、エクセルを活用した計算方法を解説 2023年07月14日 GMOリサーチ 標準誤差(SE:standard error)は、推定量の標準偏差で、標本から得られる推定量そのもののバラツキを指します。

平均値の標準偏差と聞いて意味がわからない人のために説明すると、「母集団から標本をn個抽出(研究者でいえば、n回同じものの測定を繰り返す)して、平均値を求めるという操作」を仮に無限回繰り返したとします。するとこの標本平均(これが一つの確率変数)はどんな分布をするのでしょうか?実は、標本抽出を何回も繰り返してえられる「標本平均」の分布の平均値は、もとの母集団の平均値に一致し、その標準偏差の値は、上で求めた標準誤差(S.E.M.)の値になります。だから、測定データセットの標準偏差母集団のデータのばらつきを示すのに対して、測定データセットの標準誤差は、測定された平均値と言うデータのばらつきを示しているのです(「n回の測定」を、多数繰り返して、多数の「平均値」を得たと仮定)。つまり標準誤差を示すことにいよって、その平均値がどれくらいもっともらしいかを示せるわけです。測定回数nを大きくすればするほど(nの平方根でわるので)標準誤差は小さくなりますが、平均値の推定の信頼性が上がるということになります。

さて結論として、S.D.かS.E.M.かですが、自分の考えですが、例えば動物の行動量のように個体差が大きくて個体差のバラツキも読者に伝えたければS.D.を示すことに意味があると思います。また、生化学実験で何かを定量した場合、本来サンプル間でばらつきは無いはずという前提なのであれば(バラツキの原因が手技のブレや、ピペッティング時の誤差などの避けられないバラツキ)、S.E.M.を示すほうが合理的でしょう。

  1. Question29 同じ実験を繰り返して得られた平均値の誤差を出すときに、標準偏差と標準誤差ではどちらを用いるのでしょうか? バイオ実験に絶対使える 統計の基本 2012年10月1日 羊土社

一番大事なことは、エラーバーがS.D.かS.E.M.かを論文に書くということです。当然S.E.M.のつもりだったので書かなかったというのは科学的な態度ではありません。

産学連携を英語でいうと?university-industry collaboration

産学連携を英語ではなんというのでしょうか?辞書をみると(アルク)、

academic-industrial alliance academic-industrial partnerships business-academia collaboration collaboration with industries and universities an industry-academia partnership industry-university cooperation university-industry relation

さまざまな言い方が紹介されていますが、全部が一般的だとは思えません。どれが一番一般的に使われている単語なのでしょうか。

Collaboration

university-industry collaboration

PUBMED検索により論文タイトルで最も使われている語句を調べたところ、university-industry collaborationが最も多いことがわかりました。学術誌を検索したので「産」「学」の順でなく「学」「産」の順が好まれているのでしょう。日本の政府機関やメジャーな大学もこの用語を使っている例を見かけます。

  1. “university-industry collaboration” [title] PUBMED検索 11件
  2. “university-industry collaboration” グーグルスカラー検索 23900件
  3. University-Industry Collaboration & Intellectual Property information 大阪大学 https://www.osaka-u.ac.jp/en/research/sangaku
  4. Industry-Academia Collaboration 東京医科歯科大学 https://www.tmu.ac.jp/english/research/collaboration.html
  5. RIETI Report October 2006 University-Industry Collaboration Impacting Innovation and Economic Growth The Japanese government’s series of sangaku renkei (university-industry collaboration) reforms, begun in the mid 1990s, sought to increase the contribution to national economic growth from Japan’s universities. 経済産業研究所 https://www.rieti.go.jp/en/rieti_report/075.html
  6. Best Practices for Industry-University Collaboration https://sloanreview.mit.edu/article/best-practices-for-industry-university-collaboration/
  7. University-industry collaboration: A glossary of terms As for our role in academia-industry collaboration, IN-PART operates online matchmaking platforms that simplify the initial connection between teams in academia and industry based on the alignment of research interests and priorities. https://in-part.com/blog/university-industry-collaboration-a-glossary-of-terms/
  8. COI management, research universities, and university-industry collaboration 筑波大学 https://coi-sec.tsukuba.ac.jp/en/management/collaboration/
  9. What is University-Industry Collaboration https://www.igi-global.com/dictionary/knowledge-management-in-university-software-industry-collaboration/48150
  10. A guide to university-industry collaboration for early career researchers October 23, 2020 https://ecrcommunity.plos.org/2020/10/23/a-guide-to-university-industry-collaboration-for-early-career-researchers/
  11. Barriers and facilitators of university-industry collaboration for research, development and innovation: a systematic review Published: 26 April 2023 (2023) https://link.springer.com/article/10.1007/s11301-023-00349-1
  12. Establishing successful university–industry collaborations: barriers and enablers deconstructed Open access Published: 30 March 2022 volume 48, pages900–931 (2023) https://link.springer.com/article/10.1007/s10961-022-09932-2
  13. In “Why two heads are better than one: the power of university-industry collaborations(opens in new tab/window),” a recent episode of the Research 2030 podcast, Dr. Tony Boccanfuso(opens in new tab/window), President of UIDP(opens in new tab/window) (University-Industry Demonstration Partnership), notes that, in the United States, the government’s role has been relatively hands-off, but that trend is changing globally. https://www.elsevier.com/academic-and-government/university-industry-collaboration
  14. Scandinavian Journal of Management Volume 31, Issue 3, September 2015, Pages 387-408 Scandinavian Journal of Management Universities–industry collaboration: A systematic review Author links open overlay panelSamuel Ankrah a, Omar AL-Tabbaa b https://www.sciencedirect.com/science/article/abs/pii/S0956522115000238
  15. https://www.oecd.org/innovation/university-industry-collaboration-e9c1e648-en.htm
  16. What makes industry–university collaboration succeed? A systematic review of the literature. Industry–university collaborations (IUCs) have received increased attention in management practice and research.https://link.springer.com/article/10.1007/s11573-018-0916-6
  17. How can university-industry collaboration foster innovation and entrepreneurship? https://www.linkedin.com/advice/1/how-can-university-industry-collaboration
  18. The Power of University–Industry Collaborations: Collaborating with Universities Makes Products More Attractive to Consumers 7.25.2023 Lukas Maier, Martin Schreier, Christian V. Baccarella and Kai-Ingo Voigt https://www.ama.org/2023/07/25/the-power-of-university-industry-collaborations-collaborating-with-universities-makes-products-more-attractive-to-consumers/
  19. University-Industry Collaboration in Teaching and Learning Review https://www.education.gov.au/higher-education-reviews-and-consultations/university-industry-collaboration-teaching-learning-review
  20. A framework to improve university–industry collaboration Richa Awasthy, Shayne Flint, Ramesh Sankarnarayana, Richard L. Jones Journal of Industry – University Collaboration ISSN: 2631-357X Open Access. Article publication date: 25 February 2020 Issue publication date: 8 April 2020 https://www.emerald.com/insight/content/doi/10.1108/JIUC-09-2019-0016/full/html
  21. Factors impacting university–industry collaboration in European countries Bojan Ćudić, Peter Alešnik & David Hazemali Journal of Innovation and Entrepreneurship volume 11, Article number: 33 (2022) https://innovation-entrepreneurship.springeropen.com/articles/10.1186/s13731-022-00226-3

industry-academia collaboration

産学連携の直訳としては、industry-academia collaborationではないかと思います。日本の政府系のウェブサイト(AMEDなど)を見てもこの単語が使われているように思います。

  1. “industry-academia collaboration” [title] PUBMED検索 6件
  2. “industry-academia collaboration” グーグルスカラー検索 5500件
  3. The Gibco™ CTS™ Rotea™ system story-a case study of industry-academia collaboration https://pubmed.ncbi.nlm.nih.gov/34108630/
  4. The purpose of this initiative is to conduct a wide range of industry-academia collaborations in non-competitive areas over multiple years against the area that are difficult for single academia or company to address (Areas where basic research and drug discovery technologies have not produced sufficient results due to the limited number of patients or the necessity for collaboration among different industries etc.), and to implement research and development for innovative pharmaceuticals, medical devices, healthcare, etc. that cannot be created through conventional schemes. https://www.amed.go.jp/en/program/list/18/03/002.html
  5. Hopefully we will see this very wonderful industry, academia collaboration happening between a global university, like Oxford University, and a company in India. https://www.elsevier.com/academic-and-government/university-industry-collaboration
  6.  The study highlights a number of considerations and concerns that need to be addressed in future industry-academia collaborations that draw on trace data or usage telemetry. https://pubmed.ncbi.nlm.nih.gov/37251306/
  7. We additionally report feedback from the technology developers to demonstrate impact of industry-academia collaboration. https://pubmed.ncbi.nlm.nih.gov/36937251/
  8. Co-designing the model based on previous knowledge demonstrates a viable approach to industry-academia collaboration and provides a practical solution that can support practitioners in making informed decisions based on a holistic analysis of business, organisation and technical factors. https://pubmed.ncbi.nlm.nih.gov/36875006/
  9. This study shows the role of digital transformation in amplifying the effects of TMT diversity on green innovation and the crucial role of industry-academia-research collaboration as a mediator. https://pubmed.ncbi.nlm.nih.gov/37954178/
  10. How Grenoble has mastered industry-academia science collaborations https://pubmed.ncbi.nlm.nih.gov/36658353/

academia industry collaboration

  1. As for our role in academia-industry collaboration, IN-PART operates online matchmaking platforms that simplify the initial connection between teams in academia and industry based on the alignment of research interests and priorities. https://in-part.com/blog/university-industry-collaboration-a-glossary-of-terms/

business-academia collaboration

  1. “business-academia collaboration” グーグルスカラー検索 261件
  2. Another example of this business-academia collaboration is our work on building acoustics.  https://hbr.org/2016/05/industry-academic-partnerships-can-solve-bigger-problems

Partnership

industry-academia partnership

  1. “industry-academia partnership” グーグルスカラー検索 1780件
  2. We expect that such a model of industry-academia partnership could well be a fountainhead for creating the sustainable buildings that hot and humid climates will need in the future. https://hbr.org/2016/05/industry-academic-partnerships-can-solve-bigger-problems
  3. The Industry-Academia Partnership (IAP) is association founded in 2013 that brings together industry and university experts to pursue research in Web 2.0 and 3.0 applications and infrastructure, including AI and machine learning, hardware acceleration, networking, security, and storage. https://www.industry-academia.org/

academic-industry partnership

  1. “academic-industry partnership” グーグルスカラー検索 1080件
  2. The discovery of a novel antibiotic for the treatment of Clostridium difficile infections: a story of an effective academic-industrial partnership https://pubmed.ncbi.nlm.nih.gov/26949507/

University-industry partnership

  1. Why University-Industry Partnerships Matter ANTHONY M. BOCCANFUSOAuthors Info & Affiliations SCIENCE TRANSLATIONAL MEDICINE 29 Sep 2010 Vol 2, Issue 51 p. 51cm25 DOI: 10.1126/scitranslmed.3001066 https://www.science.org/doi/10.1126/scitranslmed.3001066

Alliance

academia industry alliance

  1. “academia industry alliance” グーグルスカラー検索47件
  2. The Academia Industry Alliance aims to connect entrepreneurs, scientists, technology workers and businesses. https://www.cuanschutz.edu/services/academia-industry-alliance

Cooperation

  1. University-Industry Research Cooperation 日本学術振興会 https://www.jsps.go.jp/english/e-soc/

産学官連携についても見てみます。

  1. Outlook on Industry-Academia-Government Collaborations Impacting Medical Device Innovation https://pubmed.ncbi.nlm.nih.gov/37860788/
  2. Industry-government-academia collaboration takes many forms, typical examples at Kyoto University being: 京都大学 https://www.kyoto-u.ac.jp/en/global/global-partners/industry
  3. We are an organization at Hokkaido University that establishes the Policy on Government-Industry-Academia Collaborations and crystallizes the integration of research findings into society. 北海道大学 https://www.mcip.hokudai.ac.jp/en/service/collaboration/

日本語の論文を英文論文で引用するときの書法は?

英語で論文を書くときに、日本語で和雑誌に発表された論文を引用したい場合がありますが、そのときはどのように引用すればよいのでしょうか。著者氏名や論文タイトルを日本語で書くのは明らかに不適切です。最近は日本語論文であっても、概要とタイトルだけは英語も付いている例が多いですが、そうでない場合には自分で英訳してしまってよいものなのでしょうか?

英語で論文を書く際に日本語の文献を引用した場合において、
①文献名の表記方法について、参考になる資料はないか。
②引用部分を翻訳して記載することに問題はないか。

レファレンス協同データベース

自分が抱いた疑問と全く同じ質問がすでにネット上にありました。回答を読むと、自分で翻訳して引用するのはOKのようです。また、原著が日本語であることを注釈としてつけることもしてよいようです。

95%信頼区間とは?やっと理解できた一番わかりやすい説明

統計学の教科書を読んでいて、今までどうも腑に落ちなかったというか、しっくりこなかったことの一つが、「95%信頼区間」です。

区間推定とは真の母数の値θが、ある区間(L,U)に入る確率を1-α以上になるように保証する方法であり、‥

具体的に数値として計算した現実の信頼区間に対して、”1-αの確率でθを含む”ということはない

統計学入門 東京大学教養学部統計学教室編 1991年 東京大学出版会 225ページ

教科書を読んでいて、さっき言ったことと逆のこと言ってない??みたいな説明に惑わされている人は自分以外にもたくさんいるのではないでしょうか・

95%信頼区間とは、何か知りたい値(真の値と呼びましょう)があったとします。血圧の値でもいいし、ある遺伝子の発現量でもいいでしょう。それを知るために「観察」あるいは「観測」をして値を得ます(観測値と呼びましょう)。観測値には誤差がつきものなので、観測は複数回行ってその平均値を求めておくことが多いです。そして、統計学的な計算によって、95%信頼区間を求めます。95%信頼区間は、

(8.3 ~ 11.5)

などとなるわけです(数字はテキトーです)。今問題にしたいのはこの解釈です。

統計学の教科書やネット解説記事で良く見かける注意として、「真の値は95%の確率でこの区間内にある」と解釈するのは間違いですというものがあります。

そうではなく、「真の値が含まれる範囲がこの区間である確率が95%」と解釈するのが正しいのです。

  • 「真の値は95%の確率でこの区間内にある」
  • 「真の値が含まれる範囲がこの区間である確率が95%」

この2つの解釈は日本語の字面だけを見ていると、何が違うの?日本語の意味同じだよね?と思って、いつも混乱させられてきました。今日は、この問題に決着をつけたいと思います。

真の値は未知なのですが、あるきまった値です。信頼区間が(8.3 ~ 11.5) だからといって、真の値(もしくは母平均)が9だったり、10だったり11だったり(観察するたびごとに)変化する可能性はないのです。未知なだけで、もしそれが10なら10です。真の値というものは、観察を繰り返しても絶対に変化しない値です。

因果関係で言えば、真の値は「原因」であり、観測値(信頼区間)は「結果」です。「原因」は最初から決まっているので、原因が変動するという解釈は許されないのです。

それに対して、95%信頼区間は観察ごとに(観測値ごとに)変わり得るものです。観測値は毎回異なるものですし、その観測値に基づいて信頼区間を算出するのですから、信頼区間が毎回観察ごとに変わるのは当たり前です。ただし研究者は通常、観察は一回(測定は複数しても、それら全体を一つの観察と考えた場合)しかしませんので、現実的には、信頼区間は一つしか求めません。信頼区間が多数ありえるというのは、あくまで、観察を仮に何回も繰り返したらという仮定の話です。信頼区間を正しく解釈するためには、この仮定が重要なのです。

ある観察では信頼区間が(8.3 ~ 11.5)と計算されたとしても、もう一度観察をすると観測値が少し変わるでしょうから、得られる平均値も変わり、信頼区間は今度は (7.9 ~ 10.3) と計算されるかもしれません。観察を何回も繰り返すと、真の値はホントウは10なのにも関わらず、95%信頼区間として(6.1 ~ 8.9) などという結果を得るかもしれません。つまり95%信頼区間はあくまで95%信頼できる区間であって、100回観察して信頼区間が100通り得られた場合に、95回くらいは正しいが、残り5回くらいの結果は間違っている可能性があるというわけなのです。(6.1 ~ 8.9) を得てしまった場合は、その間違いの5%のくじを引いてしまったようなものです。

真の値=10.000だったとして、ある観察により95%信頼区間が(6.1 ~ 0.8) だと結論したとします。観測値は毎回ブレるので、このように真の値が実は観測値に基づいて算出した信頼区間に入っていない!なんてことも起こりえるのです。このケースの場合、真の値がこの区間(つまり、6.1から0.8の間)にある確率が95%という解釈が間違いだということを納得して頂けるのではないでしょうか。[6.1 ~ 0.8]という区間はたまたま得られた観測値に基づいた値に過ぎず、その区間自体に大した意味はないので、その区間を基準に真の値がどこにあるかを議論することは意味をなしません。

「真の値が含まれる範囲がこの区間である確率が95%」ということだけのことで、実際は5%の確率で間違っちゃうのですから、ある観察により(ホントウは真の値=10.000であるのにも関わらず)、 (6.1 ~ 0.8)という95%信頼区間を得たとしても、なんら不思議ではないのです。

真の値は未知ではあるがどこかある値で固定されたものなのに対して、95%信頼区間は、観察ごとに得られる数値であって、観察するたびに(観測値ごとに)毎回変わるということが、理解のために必須の大事なポイントですね。

じゃあ、ある観察に基づいて95%信頼区間が与えられました。その区間内に真の値が存在する確率は?と聞かれたら95%という答えになりそうです。さっきと何も違わないじゃないか?ということで、堂々巡りです。

本質的な違いは一体何なのでしょうか???

真の値は、ある区間がひとつ与えられたときにその区間に沿って(もしくはその区間の内外を)動くわけではない、動きながらこの辺である確率はこうみたいなことにはならないというのが論点なのでしょう。(観察のたびに)動くのは区間の方なのです。

結局何が間違いなのかというと、区間が与えられてそれが固定した状態で「真の値」が動く、つまり確率的にいろいろな値を取ると考えたり解釈するとしたらそれは間違いですよということだと思います。

これで決着がついたのかというと、そうでもありません。決着をつける準備が整ったのです。既に定まっていることの確率を考えるのはおかしいというのが、ここまでの議論でした。ところが、世の中にはベイズの定理というものに基づいた「事後確率」という概念が存在します。複数の原因があったときに、今得られた結果から、原因が何だったのかを推定しましょうというものです。ベイズの考え方では、既に起きてしまっていること(原因)をあたかも確率変数のように捉えて、事後で得られた情報をもとに原因を推定することをよしとしています。これこそまさに、95%信頼区間の「誤まった解釈」そのものでしょう。真の値はすでに決まっているとはいえ、現実問題としてその値を知らないわけだから、それを確率変数(すなわちいろいろな値を取りえるもの)とて考えて何が悪い!というわけですね。

伝統的頻度論での真値は点であり、信頼区間は「範囲内に真の値を含む確率」として理解されるが、ベイズ統計学では真値は確率分布し信用区間は「真の値が存在する確率範囲」として理解される。 頻度主義統計学でしばしば間違いであると指摘される、「□□の値が a から b の間に入る確率は○%である」との言い方は、ベイズ統計学においては正しい。(信用区間 ウィキペディア)

  1. 信頼区間を正しく理解してますか?確信区間との違いって何ですか? 2017年08月13日 @katsu1110 Qiita
  2. ベイズ信用区間(Credible Interval)とは何ですか? 2020.04.28/2020.05.08 猫薬プロジェクト3rd〜ある薬剤師の備忘録〜

さきほどこの記事の上のほうで、

因果関係で言えば、真の値は「原因」であり、観測値(信頼区間)は「結果」です。「原因」は最初から決まっているので、原因が変動するという解釈は許されないのです。

と書きましたが、ベイズ流の考えかたでは、まさにこの「原因」が確率的に決まると考えるわけですね。だからこそ、ベイズ流の考え方は異端としてなかなか受け入れられなかったのです。当然、従来の統計学の考え方に則れば、受け入れられません。

現在、IT やリスクマネジメント、経済学、意志決定理論の各分野で非常に 重要な役割を果たしているベイズ統計。しかし、その250 年あまりの歴史の ほとんどにおいて、統計学界では異端視され、冷遇されてきた。 それはなぜなのか? またそれにもかかわらず、死に絶えることなく生き残り、 現在、広く利用されているのはなぜなのか? 今まで語られることのなかったベイズ統計の数奇な遍歴。

異端の統計学 ベイズ 単行本 – 2013/10/23 シャロン・バーチュ マグレイン (著), Sharon Bertsch McGrayne 書籍紹介ページより

結局、ベイズ的な立場でものを話すか、そうでないかで変わるということのようです。基本的に多くの研究論文で使われる統計学(とくに臨床系の論文)は、ベイズ統計の考えではなく従来の統計学の考え方でデータ処理をしているのが普通だと思います。なので、真の値を確率変数と考えるという考え方は、間違いと言わざるを得ないんでしょう。立場が違うと、正しいか間違いかの議論すらできなくなるのですね。95%信頼区間の解釈をなぜ多くの人が”間違う”のかというと、普通の人にはベイズ的な考えかたが意識せずとも普通に受け入れられているからなのだと思います。

もうこうなると何が間違いで何が間違いでないのかがわかりにくくなりますが、態度を先に決めないといけないのです。科学的態度は唯一無二だという前提があるから、議論がかみ合わないのでしょう。

 

統計学の教科書にどんな説明があるか見てみます。

区間推定とは真の母数の値θが、ある区間(L,U)に入る確率を1-α(αはθが区間に入らない確率)以上になるように保証する方法であり、

P(L≦θ≦U)≥1-α

となる確率変数L,Uを求めるものである。

同一の母集団から抽出した標本でも、標本ごとに信頼区間の推定値は変化する。θは未知ではあるが決まった定数である。したがって、一つの標本から信頼区間を具体的な数値として推定してやれば、これは信頼区間に含まれる含まれないかのいずれかしかない。すなわち、具体的に数値として計算した現実の信頼区間に対して、”1-αの確率でθを含む”ということはない。信頼区間の意味は、繰り返し多くの異なった標本について信頼区間をここで述べた方法によって何回も計算した場合、θを区間内に含むものの割合が1-αとなるということである。

(統計学入門 東京大学教養学部統計学教室編 1991年 東京大学出版会 255ページ)

上の説明を読むと自分の解釈ですが、母集団の定数はあるきまった値(例えば平均値)であって、それを確率変数であるかのように捉えて議論してはいけないということなのかなと思います。

母集団の定数が固定された状態で、95%信頼区間の上限と下限が動くのであって、それを逆にして、信頼区間の上限と下限を固定して母集団の定数を確率変数のように捉える考え方は違いますよということでしょう。

こうした区間の設定はX平均をたとえば100回観測し、そのつど上述の区間を作った場合に95回程度は母数μの真の値を覆うという信頼度をもっていることになる。

(統計入門 中村隆英 ほか 1984年 東京大学出版会 195ページ)

コインをN枚投げてx枚が表になった場合、

このxとμ=N/2、σ=√N /2 から、z=x-μ /σ と計算したzが、

不等式-1.96≦z≦+1.96を満たす確率は0.95です。

つまり、xを観測し、そのxからzを計算してNを棄却していく作業をした場合、本当の正しい枚数Nが生き残る確率は、おのおのの観測値xに対して、どれも0.95にとなるわけです。したがってどのような観測値xが出た場合でもこの方法でNを推定していく手続きを繰り返すなら、そのうち95パーセントの推定結果は当たっているというのが正しい解釈なのです。

95パーセントというのは、「区間13≦N≦30に、本当のNとしてありうるものの95パーセントが入る」という見積ではなく、「区間推定という手続きを実行し続けるなら、観測値に対応してさまざまな区間が求まるが、その100回のうち95回は本当のNが求めた区間に入る」そういう見積もりになる、そういうパーセントなのです。

(小島寛之 完全独習 統計学入門 ダイヤモンド社 103ページ)

上の『完全独習 統計学入門』の説明が一番詳細で突っ込んだ表現のように思います。「確率」というと混乱しますが、”Nとしてありうるものの95パーセント”ではないと説明されていますので、これはまさにNは確率変数ではないということでしょう。このことはこの本の前のページ(102ページ)にも説明がありました。

「表の枚数が10枚と観測されたとき、母数Nが95パーセントの確率でこの13≦N≦30の範囲に入っている」という意味ではないのです。

そもそもNは、「不確実にこれから決まるもの」ではなく、「すでに確定しているのだが、知らないもの」なのです。「Nが異なれば母集団は異なる」わけです。

私たちの扱っている不確実現象とは、「固定された母集団からどのデータが観測されるか」というものでした。このとき決まった一定の仕組みで確率的に数値が出るのは、母数Nではなく、あくまで観測される数値のほうなのです。

(小島寛之 完全独習 統計学入門 2006年 ダイヤモンド社 102ページ)

母数Nが95パーセントの確率で13≦N≦30の範囲に入ると解釈することが間違いだといった場合、その意味するところは、母数Nが確率変数でありその(いろいろな値を取り得る確率変数Nのうちの)95パーセントが13≦N≦30の範囲に入っていると解釈するのであればその解釈は間違いだということのようです。

すでに確定しているけど未知のものを確率の対象として考えること自体は、一般的に別に問題ないのだと思います。だからこそ自分は何年も混乱したままだったのでした。問題視されているのは、「区間を決めてから母数の真の値を確率変数として取り扱うこと」およびそういう態度から出てきた発言なのでしょう。

区間推定はある確率(信頼度1-α)をもって、推定を区間で示す方法である。

(基礎医学統計学改訂第6版 2011年 南江堂 83ページ)

上の説明の意味は、「95%の確率でその推定が正しい」ということです。「95%の確率でその区間内に問題としている母数が存在する(つまり、その前提として、母数は区間内外のいろいろな値を取り得る確率変数である。つまり、その確率変数(さまざまな値がありえる)はその区間内に95%存在し、その区間外に5%存在する)」という意味にとってはいけないということが、今ならわかります。母数は、一つしかないので区間内に存在するか、しないかでしかないわけですね。確率的に決まる、さまざまな値を取り得る変数だという扱いをしてはいけないわけです。

結局、混乱を引き起こしていた元凶は日本語の意味するところの曖昧さ、多義性なのだと思います。

「母数が95%の確率で区間内に存在する」という日本語には2つの解釈があり得て、

(1)(母数は一つしか存在しない値だが)そういう推定が正しい確率が95%(母集団をまず決め、観測を行い、推定を行った)

(2)(母数は確率変数であり)区間内で見つかる確率が95%(区間をまず決め、母数を変数であるかのように扱おうとしている)

という解釈の(2)は間違いで(1)は間違いではないということなのでしょう。

また、それ以前の話として、原因となるもの、真の値、母集団の統計値を確率変数のように考えて事後確率を計算する立場に身を置いているか、そうでないかが根本的な違いとして存在していました。

 

95%信頼区間の説明が腑に落ちるまで、一体何年(何十年?)かかったんだろう、自分。。わかりやすい説明(=そう説明してもらえれば自分でも理解できるという説明(『完全独習 統計学入門』))に出会うのに何十年もかかってしまった。もしくは、真剣に考える時間をとろうと決心するのに、それだけの時間がかかってしまっただけなのかもしれません。

区間推定とは真の母数の値θが、ある区間(L,U)に入る確率を1-α以上になるように保証する方法であり、‥

なお、同一の母集団から抽出した標本でも、標本ごとに信頼区間の推定値は変化する。θは未知ではあるが決まった定数である。したがって、一つの標本から信頼区間を具体的な数値として推定してやれば、これは信頼区間に含まれるか含まれないかのいずれかしかない。すなわち、具体的に数値として計算した現実の信頼区間に対して、”1-αの確率でθを含む”ということはない。信頼区間の意味は、繰り返し多くの異なった標本について信頼区間をここで述べた方法によって何回も計算した場合θを区間内に含むものの割合が1-αとなるということである。

統計学入門 東京大学教養学部統計学教室編 1991年 東京大学出版会 225ページ

あらためて統計学の教科書を読み直すと、なんだ、ちゃんと書いてあるじゃんと思えました。

きちんと書かれた教科書(しかしどの教科書がそうかは、勉強中の人間には判断がつかない!)をじっくり読み込み、読み返すことも大事ですが、もっとわかりやすい説明をしてくれる教科書を他で探すのもまた良い戦略です。

参考

95パーセント信頼区間とは、さまざまな観測値から同じ方法で区間推定をすると、そのうちの95パーセントは正しい母数を含んでいる、そういう区間のことである。

小島寛之 『完全独習 統計学』ダイヤモンド社 106ページ

『完全独習 統計学』は、今までの統計のモヤモヤを解消してくれる素晴らしい本だと思いました。下の説明は、自分にはあまりわかりやすくありません。”95%の試験結果が収まる”って何?って思いました。どんな説明が一番わかりやすいと思えるかは、人それぞれです。自分にとってのベストの説明を探すしかありません。もしくは自分で考え抜いて、腑に落ちるところまで妥協しないか。

。「95%信頼区間」は、同じ試験を繰り返したときの結果の範囲のうち、95%の試験結果が収まる範囲のことである(区間推定)。

医療情報をわかりやすく発信するプロジェクト理解しにくい医学研究用語有意差、95%信頼区間

確率変数XをaX+bに変換したときの平均値と標準偏差、および、いわゆる偏差値の計算方法

確率変数X(あるいは標本値X)をaX+bに変換したときの平均値と標準偏差は、平均はbを足したものとなり、標準偏差はa倍になります。

この事実を利用すると、標本値から標本平均を引いた場合の平均は、平均―平均=0となり、標本値から標本平均を引いたものを標準偏差で割ったものをあらたな変数と考えると、標準偏差に標準偏差分の1をかけることになるので(定数項は関与しない)、変数変換した場合の標準偏差が1になります。つまりZ=(Xーμ)/σ という変数変換を行うとZは、標準偏差が1で、平均が0になるわけですね。

  1. 小島寛之『完全独習統計学入門』(ダイヤモンド社)49ページ 加工されたデータの平均値と標準偏差

今まで、この変数変換の話がどの統計の教科書を読んでもしっくりこなかったのですが、小島寛之『完全独習統計学入門』の説明を読んで、この変数変換のご利益がなんて素晴らしい!と思いました。

この考え方がわかると、偏差値も簡単に理解できます。

偏差値とは

ある人のテストの点数Xとして、そのテストの平均点がμ、標準偏差がσだったとすると、

Z=(X-μ)/σ と変数変換したときに、Zの平均は0,標準偏差は1になります。ある人の点数がx点だったとすると、それを変数変換してz点とし、標準偏差を単位として表そうというわけです。

z=(x-μ)/σ

これをいわゆる偏差値にするには、これに10をかけて(つまり標準偏差1ユニットを10とする)、さらに50をたします(つまり平均を50とする)。

z点を取った人の偏差値は、

偏差値=zx10+50 = ((x-μ)/σ) x 10 +50

です。この考えかたのミソは、点数を「標準偏差」を単位として表すというところです。テストの点数は2SDでしたというのもなんなので、2x10+50=70 偏差値は70でしたというわけです。偏差値60は、1SDです。偏差値80は3SDですね。偏差値が40~60の間に全体の68%が入る(正規分布に従うとして)というわけです。偏差値70の人は2SDのところにいるので、上位2.5%にはいっています。

  1. 小島寛之『完全独習統計学入門』(ダイヤモンド社)53ページ

偏差値というのは、標準偏差を単位にしたスコアというのが核心ですね。今日からは、「あの人は偏差値が80だって!スゲー!」というかわりに、「あの人は3SDの成績だって!スゲー!」といったほうが、凄さが伝わるような気がします。

標準偏差の意味

小島寛之『完全独習統計学入門』(ダイヤモンド社)に標準偏差の考え方として面白い例が紹介されていました。模擬テスト10回分の成績が平均60点、標準偏差10点のA君と、平均50点、標準偏差30点のB君とでは、どちらが難関大学に合格できるチャンスがあるでしょう?というお話です。A君の成績は安定していますが、合格ラインが80点の大学には届かないでしょう。それに対して、B君は標準偏差30点つまり、ムラッ気があるためにトンデモなく悪い点を取ることもあればかなり良い点も取ることがあるわけで、80点をとる可能性もあるということがわかります。なので、平均点が低いB君のほうが、ワンチャンが期待できるということです。

  1. 小島寛之『完全独習統計学入門』(ダイヤモンド社)48ページ 複数のデータセットの比較

この本、面白いですね。自分が今まで考えたことがなかったような統計の見方を教えてくれます。

標準偏差 1SD、2SDの意味 

実験データでアウトライヤーをはじくとに2SD離れているものを捨てるという処理をしている例を見たことがあります。正規分布の場合、1SDつまり平均値+/-1SDの中には、データの68.26%が入っています。また平均値+/-2SDにはおよそ95%(95.44%)が入ります。つまり平均よりも2SD以上離れた値というのは、全体のおよそ5%、もし片側で考えれば全体のトップ2.5%もしくはビリ2.5%というわけです。

  1. 68–95–99.7則(ウィキペディア)

SDというのは標準偏差のことで(Standard Deviation;SD)、データにばらつきがあるほど大きな値になります。計算は、データから平均値を引いて2乗したものを、各データに関して足し合わせて、データの数nで割って得られる「分散」の平方根が標準偏差です。標準偏差には種類がありますが、今の場合は標本データに関する標準偏差です。

偏差値

1SDや2SDの感覚をつかむのに一番馴染がある例は、偏差値ではないでしょうか。

学力の指標としてよくみながつかう「偏差値」はまさに「標準偏差」そのものです。ただし、標準正規分布の平均値が0、標準偏差が1なのに対して、いわゆる偏差値の場合は、平均値が50標準偏差の大きさが10になるように変数変換されています。1SDや2SDがどれくらいの割合かを知っていれば、偏差値60の人がトップ何%なのかがすぐにわかります。偏差値60=平均+1SD なので、正規分布を仮定した場合はその右側の面積は32%の半分の16%です。つまり仮に1000人の学生がいたとして、その1000人がテストを受けた結果得られた偏差値だったとした場合は、偏差値60の学生は1000人中160番くらいに位置しているということになります。同様に、偏差値70(つまり平均より2SD右側)だった学生は、1000人中上位25番(1000人の5%は50人で、上位側に25人、下位側に25人いるので)に位置しています。ちなみに平均値+/-3SDの間には99.7%のデータが入りますので、偏差値80の学生は、上位0.15%、すなわち1000人中トップ1.5人に入ります。要するに1000人の学生の中で1番か2番ということになりますね。

標本標準偏差

名称が混乱しそうですが、これとは別の標準偏差として、「標本標準偏差」(sample standard deviation)があります。標本標準偏差とは、母集団の標準偏差の推定量すなわち不偏分散の正の平方根をとったもの。この場合はnでなくn-1で割ります。

  1. https://bellcurve.jp/statistics/glossary/1168.html
  2. 宮川 基本統計学 第5版 201ページ nの代わりにn-1を使った次の式 $\hat\sigma^2 = \frac{1}{n-1} \sum_{i=1}^n (x_i – \bar{x})^2$ で定義される。 $\hat\sigma^2$は、標本分散、$\hat\sigma$ は標本標準偏差と呼ばれる。

 

腕の解剖学 上腕 upper arm  前腕 fore arm

腕は、肘と肩の間の長い部分が上腕upper arm、肘から手首までの長い部分が前腕forearmと呼ばれます。腕を曲げて力こぶをつくったときの力こぶの部分の筋肉が、上腕二頭筋 biceps 。上腕二頭筋の裏側にあって、上腕二頭筋が収縮するときには弛緩し、上腕二頭筋がが弛緩するときには収縮しているのが、上腕三頭筋 tricepsです。英語のサイトをみていると、上腕のことを単にarmと示しているものも見かけます。

  1. Arm muscles anatomy  lybrate.com
  2. Bony landmarks of the arm Anatomy for the Sculptors

皮膚の構造

皮膚の表面を見ても、細胞の形がはっきり見えるわけではありません。肌の肌理(きめ)と呼ばれる、網目状の凹凸が見えるだけです。

肌理

  1. 肌理(キメ)doctors-organic.com 皮溝 皮丘
  2. crista cutis 皮膚小稜
  3. area cutanea 皮野

皮膚の構造

皮膚はいくつもの層から成り立っていますが、大きく分けて基底膜の外側にある表皮epidermisと、基底膜 basal membraneの内側にある真皮dermis、さらにその深部にある皮下組織とに分かれます。

表皮epidermisの層構造と各層を構成するケラチノサイトの分化段階

表皮epidermisは、表層側から、角質層(角質層細胞層;stratum corneum;cornfied layer) , 透明層(淡明層;staratum lucidum)、顆粒層(顆粒細胞層;stratum glranulosum;granular layer), 有棘層(有棘細胞層;stratum spinosum; spinous layer;prickle cell layer), 基底層(基底細胞層;stratum basale; basal laer)の4層~5層に分かれます。ラテン語と英語の2つの呼称が使われるのでややこしいですが、語を良く見たら同じことを言っているのがわかります。

表皮でケラチンを産生する細胞は、ケラチノサイトと呼ばれますが、これは総称で、分化段階(どの層に存在するか)で固有の名称で呼ばれることもあります(顆粒細胞、有棘細胞、基底細胞)。

角質層(stratum corneum;cornfied layer)は、プログラム細胞死(アポトーシス)を起こして核も自己消化してしまった死んだケラチノサイトが20~30層重なったものです。名前のとおり、ケラチンという細胞骨格タンパク質(繊維状のタンパク質)を多量に細胞内に持っています。

  1. 角質層 doctors-organic.com

透明層(淡明層;staratum lucidum)は、足底など特に皮膚が厚い部分にしか見られないそうです。中身は角質層と同様、細胞死を起こしたケラチノサイトの重なりです。

顆粒層(stratum glranulosum;granular layer)は、核を失ったケラチノサイトが存在する層です。核をなくすことにより、ケラチンを大量に抱え込むスペースができるというわけです。顆粒層のケラチノサイトは、顆粒細胞とも呼ばれます。

有棘層(stratum spinosum; spinous layer)は、基底層から離れたケラチノサイトが、いよいよケラチンを産生し始める場所です。有棘層のケラチノサイトは、有棘細胞とも呼ばれます。

基底層(stratum basale; basal laer)は、基底細胞と呼ばれるまだ未分化なケラチノサイトの細胞一層からなる層で、細胞分裂を行っています。細胞分裂を終えた細胞は、基底膜から離れて表層部分へと移動していきます。

  1. 皮膚科科医 清水宏 オフィシャルサイト あたらしい皮膚科学 第3版 全文公開 表皮epidermis
  2. 皮膚の構造と機能 大河 原章
  3. The Structure, Functions, and Mechanical Properties of Keratin (ResearchGate.com) April 2012JOM: the journal of the Minerals, Metals & Materials Society 64(4):449-468 DOI:10.1007/s11837-012-0302-8
  4. https://www.researchgate.net/figure/Differentiation-of-epidermal-keratinocytes-Keratinocyte-differentiation-begins-in-the_fig2_5667138
  5. What are the layers of the epidermis? socratic.org
  6. Anatomy of the Epidermis verywellhealth.com
  7. 表皮とは?厚さや表皮細胞の構造、ケラチノサイトを紹介 om-clinic.com

メラニン色素

肌の色が黒いのは、皮膚の細胞であるケラチノサイトにメラニン色素が含まれているからですが、実はケラチノサイトはメラニン色素を自分で合成しておらず、メラニン色素を合成するメラノサイトという細胞から、メラニンを移送されています。最初にこれを知ったときは自分はかなり驚きました。生物って精巧にできているんですね。

Melanin migration: how does this protect your skin? Kyoto University / 京都大学 チャンネル登録者数 8920人

  1. Safety in darkness Published on 2016/12/12 京都大学
  2. Melanosome transfer to keratinocyte in the chicken embryonic skin is mediated by vesicle release associated with Rho-regulated membrane blebbing Scientific Reports volume 6, Article number: 38277 (2016)  Published: 02 December 2016

Pigment transfer in Skin cells (Melanosome transfer from MELANOCYTE to KERATINOCYTE) I Dr Somit Jain SOMIT JAIN チャンネル登録者数 5030

メラニンを産生する細胞メラノサイトは、基底細胞層の位置に存在しています。メラニンはメラノサイトで産生され、ケラチノサイトに受け渡されます。

  1. Melanosomes Are Transferred from Melanocytes to Keratinocytes through the Processes of Packaging, Release, Uptake, and Dispersion Journal of Investigative Dermatology Volume 132, Issue 4, April 2012, Pages 1222-1229
  2. Melanocyte Embryology and Histology The Histology Wizard チャンネル登録者数 1.88 (27:33動画)
  3. Melanocyte 5- Skin color Wendy Riggs チャンネル登録者数 9.54 (6:17動画)
  4. 7. Pigment Transfer in Skin Cells UMass Amherst Libraries チャンネル登録者数 3870人
  5. How do Melanocytes Make Melanin?: Melanogenesis Mechanism Catalyst University チャンネル登録者数 32.5

細かいことをいうとメラニンには、eumelaninと pheomelaninの2種類の色がある層です。eumelaninは茶色い色を与える色素で、pheomelaninは赤味をもつもの。唇、乳首、亀頭、膣などのピンク色は、pheomelaninの色だそう。

  1. pheomelanin biosynthesis In skin pheomelanin is particularly concentrated in the lips, nipples, glans of the penis, and vagina.
  2. Do blondes have pheomelanin? Quora

お肌にシミが出来る理由

  1. シミのメカニズム daiichisankyo-hc.co.jp

参考

  1. 皮膚の発生と恒常性維持における 転写因子Tbx3の機能解析( Digest_要約 ) 京都大学
  2. 創傷を負った表皮組織に特異的な遺伝子の組み替えを用いた、創傷治癒過程の追跡と表皮再生メカニズムの決定 京都大学

 

ギルバート Scott F. Gilbert 発生生物学 Developmental Biology

ギルバート

Developmental Biology XE (English Edition) Kindle版 英語版 Michael Barresi (著), Scott Gilbert (著) 第13版のアマゾンキンドル書籍 バージョンがあります。

Developmental Biology Thirteenth Edition 2023/3/1 Michael J. F. Barresi, Scott F. Gilbert オックスフォード出版局のサイト

ギルバート第12版

ギルバート第11版

ギルバート第10版原書 2013/6/30

ギルバート 発生生物学 原書第10版邦訳 監訳:阿形清和、高橋淑子 2015年3月20日メディカル・サイエンス・インターナショナル

本書は、われわれが40年間かけてリアルタイムで学んできたことを、次世代を担う若者が1か月で習得することを目的に書かれている。(阿形清和 監訳者の序)

発生生物学の疑問(2ページ)するのか

  1. 細胞がどうやって複雑な器官(機能を担う3次元構造)を作るのか
  2. 細胞はどうやって組織・器官のサイズに合わせて成長し、成長をやめることができるのか
  3. 生殖細胞はどのようにつくられるのか
  4. 再生はどのようにして起こるのか。幹細胞はどうやって成体になってからでも新たに必要な形態の組織をつくるように分化、増殖できるのか。
  5. 進化の過程で発生がどのように変化して新しい体の形をつくってきたのか。
  6. 生息環境に応じてどのように発生を適応させているのか

ギルバート第9版

ギルバート第8版

ギルバート第7版

  1. https://bgc.ac.in/pdf/study-material/developmental-biology-7th-ed-sf-gilbert.pdf

ウォルパート

Principles Of Development 5E [Paperback] [Jan 01, 2015] Wolpert, Tickle,Martinez Arias ペーパーバック – 2015/1/1 英語版 Wolpert (著)

ウォルパート発生生物学 原書第4版 2012/10/1 武田洋幸 (翻訳), 田村宏治 (翻訳)

Principles of Development 4th edition  2010/12/1Lewis Wolpert (著), Cheryll Tickle (著), Thomas Jessell (著), Peter Lawrence (著), Elliot Meyerowitz (著)

スラック

エッセンシャル発生生物学改訂第2版