はしがき
著者:梅谷 武
『確率論を学ぶ』のはしがき
作成:2012-02-12
更新:2021-04-04
更新:2021-04-04
リンク切れを次のような方針で修正しました。
- 参考文献のスポンサーサイトへのリンクは有効。
- 絶版になっているものはリンク無しで書誌情報のみ記載。
- 出版形態が変化しているものは新しい形態へ変更。
- 現在有効な公的サイトへのリンクは有効。
- 一般サイトへのリンクは削除。
第8章「誤差論」、第9章「シミュレーション」を追加した。放射線計測に関してはおもにGlenn F.Knoll『放射線計測ハンドブック』[K1]を参考にした。検出限界についても最終的にはこの本の記述によった。
放射性崩壊シミュレーションは指数分布乱数を生成し、それらから検出パルスを作成する方法で行なった。これを応用すれば検出器の設計シミュレーションができるものと思われる。ランダムノイズの重畳実験により、Poisson分布へのχ2適合度検定が強力な検証ツールになりそうだということがわかった。
追加訂正項目
- 第4章 4.5
- 第5章 5.1
- 第7章 7.2
- 第8章 8.1, 8.2
- 第9章 9.1, 9.2, 9.3
第7章「統計的推測」を追加した。統計的推測の用語や基本概念の整理をしながら、確率論との関係について述べた。注意すべき点として「標本」という言葉の意味が文脈によって使い分けられていることを指摘しておいた。統計学の入門書は数多くあるが、このことをはっきり述べているのは稲垣宣生『数理統計学』[T5]だけであった。
特性関数はFourier変換で、積率母関数はLaplace変換である。積率母関数は特性関数よりも有効な場合が多く、この技法を体系的に整理することの必要性を感じた。やや古く入手が難しいが印東太郎『確率および統計』[T1]は、他には書いていないような積率母関数の計算が丁寧に書かれており参考になった。ごく少数しか調べられなかったが、この種の技法やそれを使った証明がすべて網羅されているような文献は見当たらなかった。
7.1「適合度検定」にはRutherfordとGeigerの実験データを使って、Poisson分布への適合度検定を行なう例を示した。
第7章をまとめるにあたり、いくつか関連項目を追加し、気がついた誤りを訂正した。
追加訂正項目
- 第3章 3.1, 3.2, 3.4
- 第4章 4.1, 4.3, 4.5
- 第5章 5.1, 5.2, 5.3, 5.4, 5.5, 5.6
- 第6章 6.1
近年、天気予報、地震予知、金融商品におけるリスク計算等々、確率論がさまざまな分野で利用されている。不確実な事柄について、その見込みを数値化してくれる確率はわかりやすく、多くの人々の行動に影響を与えるようになった。
しかし、最近になってその問題点もあきらかになってきている。2008年9月15日にリーマン・ブラザーズが破綻した、いわゆるリーマンショックは、過去の統計から推定された貸倒率によりリスクを計算されたサブプライムローンが、貸倒れの急増により紙屑同然になったことに端を発している。
2011年3月11日に発生した東北地方太平洋沖地震とその後の津波は東北地方沿岸部に壊滅的な被害を与え、福島第一原発において全電源喪失による炉心溶融、水素爆発を引き起こし、10万人近い周辺住民が避難するというかつて経験したことがないような大規模災害となった。専門家がこの複合災害を語る際にも、確率によるリスク計算が引き合いに出され、想定外という言葉で表現されたことは記憶に新しい。
また原発事故により広範囲に放射性物質が拡散したことにより、市民が自ら放射線計測を行なう必要性に迫られ、放射線物理学に対する関心が高まり、原子核の放射性崩壊が量子力学に支配される確率現象であることも広く知られるようになった。
このように最近起こっているさまざまな現象に共通するキーワードである「確率論」を、短期間で習得するために作られたのがこの学習ノートである。
この学習ノートを作るに当たって目標としたことは、確率論を応用したさまざまな主張が正しいかどうかを検証できる能力を身に付けようということである。そのためには大数の法則や中心極限定理の厳密な証明にまで踏み込む必要があると考えた。
そこで解析学で使われる手法については事前に復習しておくことにした。Lebesgue測度を使うことについては、偏微分方程式論を学んだ経験から楽観していた。しかし、さまざまな独特の概念、記号を駆使して構築される世界観は、これまで経験したことのない異質なものであり、今もっているスキルだけでは対応できないことが徐々にわかってきた。
限られた時間内にある程度の成果を出すため、最初に大数の法則と中心極限定理までを区切りとしてそこまでの論理体系をまとめることにした。証明の細部までは追わず、主要な定理の証明に至るまでのあらすじを追うようにした。ほとんどの書は大数の法則と中心極限定理の証明を目標とし、著者独自の体系を作り上げるという書き方なので、それに合わせることにした。
また理論だけで完結せずに具体的な応用を最終目標としている。そのために実際に計算してみることを重視し、その道具としてR言語を用意した。
最初、理工系向けの和達三樹『キーポイント確率・統計』[S3]、薩摩順吉『確率・統計』[S4]から始めた。しかし、これらは物理向けの応用に特化した内容で、数学的理論を学ぶことを目的としていないことがわかった。
次に小針晛宏『確率・統計入門』[M1]を読んだ。これは優れた入門書ではあるが、厳密な議論まで追うという目的には向かないことがわかった。具体例が数多く説明されており、応用には役立つ。
そこで本格的な数学書をあたることにした。まず伊藤清『確率論の基礎』[P2]、『確率論』[P3]に目を通した。これらは評判が高いものの、素人が短期間で読めるものではないことはすぐにわかった。しかし、どの部分も細部まで念入りに書かれているので、最近は何かわからないことがあれば、まずこれらを調べるようにしている。
わかりやすい数学書をいろいろ探して辿りついたのが、佐藤 坦『はじめての確率論 測度から確率へ』[P5]、志賀 徳造『ルベーグ積分から確率論』[P6]、熊谷 隆『確率論』[P7]の三冊である。これらはそれぞれ著者独自の視点で書かれた読みやすい入門書であり、内容はかなり異なるが、これらすべてに目を通すことにより確率論における数学がどういうものかがわかってきた。
測度論については小谷眞一『測度と確率』[L3]が新鮮であった。学生時代に読んだ溝畑 茂『ルベーグ積分』[L1]は力技で地を這っていくようなやり方であったが、[L3]は空から測度論の全貌を見渡すような爽快感がある。
大数の法則と中心極限定理の証明まで終わった段階で、演習として具体例の計算を行なうことにした。そのときに現象に対応する確率空間を実際に構築することにこだわった。それが書いてある本がほとんどなかったためである。有限事象の場合は問題は無い。しかし、無限事象になると難しくなる。独立同分布確率変数列が具体的にどのような確率空間上で存在し得るのかということにも関係してくる。
この問題の答えを見つけるまでに一ヶ月ぐらいかかった。この過程で、コルモゴロフ『確率論の基礎概念』[P1]、『コルモゴロフの確率論入門』[M2]を読んだ。これらは日本人数学者とはやや違った視点や証明技法を使って書かれているため、理解の幅が広がる。後者はコルモゴロフの「叙述の面白さとわかりやすさは、十分な論理的厳密さと結びついていることが必要である」という思想を具現化したもので、高校生でもわかるように丁寧に書かれているので参考になった。
結局、伊藤清『確率論の基礎』[P2]を読みながら基礎概念を復習しているときにイメージが出来上がり、最終的には小谷眞一『測度と確率』[L3]の無限直積測度でうまく構成できることを確認した。
具体的な現象の計算のために小川重義,森真『現象から学ぶ確率論入門―実験からはじめよう』[M3]、逆瀬川浩孝『理工基礎 確率とその応用』[S1]を参考にした。前者は測度論と確率シミュレーションの入門も兼ねており、[M2]と合わせて一番最初に読むべき本であることがわかった。
放射性崩壊を表現するPoisson過程については熊谷隆『確率論』[P7]と伏見正則『確率的方法とシミュレーション』[S6]を参考にした。
この学習ノートは、文献を読みながら書いたノートの全体を見渡しながら、自分の感性で再構成したものである。PC上でテキストエディタとftexを使ってまとめた。これまでftexであまり解析学の文書を書いたことがないので機能が足りず、¥hat、¥widehat、¥ud命令を追加した。また気がついた不具合を修正した。これらをまとめてftex 2.5.5版とした。
理論に関してはあくまでもあらすじだけを書くようにしている。証明まで読みたい方は、参考文献に挙げてある中から必要なものを選んでいただきたい。
応用に関しては具体的な計算やR言語のプログラムを載せている。
確率論を学んでいて感じるのは、独特の記号や言い回しのため、よく知っているはずのことが、よくわからないような書き方になっているということである。そのため最初は確率論から解析学を分離することに主眼を置いていた。この段階でまとめたのが第1章「測度論からの準備」である。この頃は、確率論を普通の数学の言葉だけで書けるような気がしていた。しかし、コルモゴロフや伊藤清の書き方をすべて置き換えるのは無理であることがだんだんわかってきた。それでもなるべく自然な書き方で確率論の基礎概念をまとめる努力をした結果が第3章「確率論の基礎」である。記号は他書と比較しやすいように確率論の標準的なものを踏襲した。
第1章と第3章では重要な定理については証明の概略を記したが、それ以外についてはほとんど証明を省略している。応用を主眼とする場合、第1章を読む必要は無い。第3章は証明抜きでも読めるように書いている。
第4章「離散分布」、第5章「連続分布」を書きながら、具体例の検証や計算を行った。Poissonの少数の法則の原型である二項分布のPoisson近似や中心極限定理の原型であるde Moivre-Laplaceの定理の古典的な証明は丁寧に書いた。ついでにこれらの準備として第2章「漸近近似」を追加した。Starlingの公式の証明はEuler-Maclaurinの公式を使うやり方にした。
第6章「確率過程」は本格的にやると奥が深いので、もっとも単純なPoisson過程を素朴な方法で導入した。放射性崩壊を扱うにはこれで十分である。
近年、測度論の形式が整備され、学習環境は劇的に改善されている。しかし、それでもさらに本質的な部分も含めて整備し直す余地があるのではないかと思われる。
測度論の面倒なところは一つには非可測集合が存在することにある。このためにわざわざσ-加法族という可測集合族を考えなければならない。この非可測集合の存在は選択公理から証明される。選択公理は非常に強力な道具であり、これによりバナッハ-タルスキーの定理のように直感的には異常として思えない現象が証明されてしまう。
現代数学はZF+Cという公理的集合論上に構築されている。ZFはZermelo-Frankelの集合論を意味し、Cは選択公理(axiom of choice)を意味している。1968年にMycielskiはZFと決定性公理を仮定するとすべての実数の部分集合はLebesgue可測になり、選択公理が否定されることを証明している。この体系で実際にさまざまな数学が構築されたという情報は見当たらなかったが、選択公理からの脱却を望む数学者は少なくないという話は聞いている。