たかはしけいのにっき

理系研究者の日記。

数理統計学_たかはしけいが統計力学までお伝えする物理会

2024-06-06 02:51:18 | たかはしけいが統計力学までお伝えする物理会
 Google drive 数理統計学_物理会

 高校物理、高校数学を前提として、YouTube上で数理統計学について23回にわたって説明した板書ノートのリンクです↑。2023年5月8日から2023年12月26日にかけて講義しました。
 著作権は髙橋慧にあります © 2024 Kei Takahashi

 主に、入門・演習数理統計 - 野田 一雄 (著), 宮岡 悦良 (著)を教科書として使いました。

 こちらのファイルに関する質問や指摘、コメントに関しては、実名による投稿のみ受け付けております。(匿名の場合はコメントを削除します) -
 メール(soudan.atamanonaka.2.718_attoma-ku_gmail.com)やTwitterのDM(@KayT0309)については匿名でも構いませんが、必ずしも返信するとは限りませんのでご了承ください。

【目標】
 確率論および確率変数の基本、いくつかの代表的な分布について理解する。

【各回の概要】
 1. 集合論の基本
 高校数学の復習。集合論のまとめ。標本空間や標本点などの定義。

 2. 確率の公理
 確率の公理として3つを紹介。加法定理など。

 3. 条件付き確率、独立性
 上記についての定義や性質、演習。

 4. 独立性続き、全確率の定理
 全確率の定理の証明。

 5. 全確率の定理続き、ベイズの定理
 全確率の定理の演習、ベイズの定理証明と演習(3囚人のジレンマなど)。

 6. 確率変数と分布関数
 確率変数の範囲へ。確率変数、分布関数の定義。

 7. 分布関数
 分布関数の演習。

 8. 確率密度関数
 離散型の確率関数、連続型の確率密度関数。

 9. 確率密度関数の具体例、多次元
 演習。多次元確率分布への拡張。

 10. 多次元続き、周辺確率密度関数
 結合確率密度関数。周辺分布関数などの定義。その具体例。

 11. 条件付き確率密度関数具体例、独立性
 上記についての演習。

 12. n次元確率密度関数、平均と分散へ
 n次元への拡張。平均と分散の導入(離散型および連続型)。

 13. 平均、分散
 平均や分散の基本公式。平均についてn次元への拡張。

 14. 分散続き
 演習続き。分散についてn次元拡張。

 15. 中央値、演習、積率
 メジアンの定義、演習。積率の定義。

 16. 積率母関数、チェビシェフの不等式
 離散型、連続型のそれぞれについて積率母関数の定義。またチェビシェフの不等式(統計力学田崎本より)。

 17. 共分散
 共分散の定義、性質。シュワルツの不等式の証明。

 18. 共分散続き、条件付き期待値
 共分散演習。n次元への拡張。離散型、連続型について条件付き期待値の定義など。

 19. 条件付き期待値続き、線形回帰
 性質や具体例。線形回帰の例。

 20. MSE、ベルヌーイ分布、二項分布
 平均二乗誤差の定義、性質。また、有名な分布の章へ。ベルヌーイ分布と二項分布の確率関数および積率母関数。

 21. 二項分布性質、具体例
 上記について。また(弱)大数の法則の一例を紹介。

 22. 二項分布具体例、ポアソン分布
 超幾何分布紹介。ポアソン分布の確率関数および積率母関数。

 23. ポアソン過程、正規分布
 ポアソン分布の性質。ポアソン過程の紹介と例。多項分布、正規分布をまとめた。

【総評・反省】
 理系で誤差解析を行わない学部学科は殆どないため(数学科や情報学科くらい?)、このくらいの数理統計学の基本は理系はみんな知らないといけないはずだが、意外と抜けている人が多い。「意外と多い」と書くと、そこまで多くはないニュアンスを持たれるかもしれないが、普通にマジョリティーでびっくりする。
 たとえば条件付き期待値を知らないで、一体全体どーやって線形回帰とかやってるんだ?と思うけれど、昨今はエクセルでちょちょいのちょいっとやってくれちゃうわけで、中身を何も理解しないでも使えてしまうわけだから困ったものである。まぁこのあたりをどこまできちんとやるか?厳密にやるか?という部分はあって、マッチの原理を事細かに知り実際に自分で作ったこともないのに「火」なんて高等技術を使っておって、まったく最近の現代人は、と原始時代の人は思うのかもしれないだが…、いくらなんでも研究者が数理統計(しかもこの程度の)を知らないのは流石にまずいんじゃないか、と思わなくもない。研究者が、と書いたが、あなたが将来、品質保証部や品質管理部、生産技術部などに所属するのであっても絶対に必要なはずだし、ゆーてそこまで難しくないやろ、と思っている。
 現実にこのレベルを理解している理系が少ないというのはとてつもない大問題で、企業の不正や倫理観の欠如が公になるとき、そこには必ず数理統計学の無理解があると言って良い。「今まで事故が起きていないのだからこれからも大丈夫なはずだ」などと平然と言う経営陣に心から疑問を持ち、事故を避けさせるように仕向け、最悪の場合に備えて責任を逃れたいなら、ちゃんと基本から数理統計学を学んでいなければならないが、昨今は結果(っぽい何かをとにかく出す)主義が横行しており学部3年生で研究らしき作業をしている人も多く(数理統計をまともに知らない者が研究などできるわけがないが)、驚くばかりである。

 聴講者も「途中からは難しくなった」と思った人もそれなりには多かったようだ。
 量子論に比べればついてこれている印象はあったが、全確率の定理あたりで「うん?高校の範囲超え始めたぞ?」となり、ベイズの定理の3囚人の問題で「私は信じないぞ!」となり、確率変数のあたりから何をやっているのかが現実と乖離し始めてしまう人が多かった。自分が行っている実験や計測と見比べて、どのようなことを指しているのかが分かれば、数理統計ほど勉強し甲斐のある範囲もないのだが、統計の勉強というのは意外とやりにくいのかもしれない。

 この会は「統計力学のために」と銘打っており、統計力学の範囲として必要なことを述べる目的が大きかったが、本来理系が最低限持っておいて欲しい数理統計と誤差解析の知識として、この会で扱ったもの以外には、標本分布、推定、仮説検定、さらに誤差解析の基本的な演習をしておく必要がある。
 統計力学をやる上では、まぁ確率密度関数がきちんと分かっていればそれで良い気もするのだが(それがみんなにとってそこそこハードル高いわけよね…)。

 他の科目に比べて厳しめなのは、理系として特に必須の範囲だからである。
 なので、この会でも演習の時間をかなり取った。他の科目だと、演習はやっておいてね、まぁ最悪やらんでも良いけど、ガチで理解したいならこの計算はいつかやっておいたほうが良いよ的な感じで進めたが、数理統計に関しては、その場で時間をとって聴講者に演習をしてもらい、できた人から答えを言っていくようなやり方をとった。これは特にめちゃくちゃ必須だからである。
 会全体を通して思うのは、大学との一番の違いは(聴講者にとっては)「試験がないこと」である。試験は定着に一役買っており、大きい復習の機会として重要であることを認識した。そのことに気が付き始めたのが数理統計をやり始めたときなので、その場で演習してもらうことを意識した。

 機会があれば、統計力学を意識せずに数理統計と誤差論の会をやっても良いかもしれないと思っている。
コメント    この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« 量子力学_たかはしけいが統計... | トップ | 統計力学_たかはしけいが統計... »
最新の画像もっと見る

コメントを投稿

たかはしけいが統計力学までお伝えする物理会」カテゴリの最新記事