1.1 事象と確率

  • 事象(event)…おこりうる事柄のこと。
    • 全事象または標本空間(sample space)…可能な結果全ての集合。\(\Omega\)で表す。
    • 標本点(sample point)…全事象の元。\(\omega\)で表す。
    • 事象は全事象の部分集合である。
    • 空事象(empty event)…標本点を含まない事象。\(\{\}\)または\(\emptyset\)で表す(\(\phi\)で代用されることが多い)。
    • 積事象(intersection)…2つの事象\(A\)\(B\)が両方共起こる事象。
      • \(A \cap B = \{x | x \in A \land x \in B\}\)
    • 和事象(union)…2つの事象\(A\)\(B\)の少なくともどちらかが起こる事象
      • \(A \cup B = \{x | x \in A \lor x \in B\}\)
    • 補集合(complement)…\(A\)に属さない元の集合。\(A^c\)と表す。
    • 差集合(relative complement)…\(A\)に属するが\(B\)に属さない元の集合。
      • \(A \setminus B = A \cup B^c\)
    • 対称差(symmetric difference)…\(A\)に属し\(B\)に属さないものと、\(B\)に属し\(A\)に属さないものの集合。
      • \(A \Delta B = (A \setminus B) \cup (B \setminus A)\)
    • ド・モルガンの法則
      • \((A \cup B)^c = A^c \cap B^c\)
      • \((A \cap B)^c = A^c \cup B^c\)
  • 確率(probability)…事象\(A\)に対して確率\(P(A)\)は、区間\([0, 1]\)の間の実数を対応させる関数である。
    • 集合族…事象の集合。事象は\(\Omega\)の部分集合であるので、部分集合の集合ということ。
    • 可測集合族…確率を定義できる集合族\(\mathcal{B}\)は、次の3つの性質を満たす必要がある。
      1. \(\emptyset \in \mathcal{B}, \Omega \in \mathcal{B}\)
      2. \(A \in \mathcal{B}\)ならば\(A^c \in \mathcal{B}\)
      3. \(A_k \in \mathcal{B}, k = 1, 2, ,...\)ならば\(\bigcup_{k=1}^\infty A_k \in \mathcal{B}\)
    • 可測集合…可測集合族の元。
    • 確率(probability)…可測集合\(A\)に対して実数を対応する関数\(P(\cdot)\)で、次の条件を満たすもの。なお、2を除く条件を満たす関数を測度(measure)と呼ぶ。
      1. すべての\(A \in \mathcal{B}\)に対して\(P(A) \geq 0\)
      2. \(P(\Omega) = 1\)
      3. \(A_k \in \mathcal{B}, k = 1, 2, ...\)が互いに排反であるとき、\(P(\bigcup_{k=1}^\infty A_k) = \sum_{n=1}^\infty P(A_k)\)が成り立つ
    • 確率空間\((\Omega, \mathcal{B}, P)\)のこと。
    • 確率変数\(\omega \in \Omega\)に対して、実数値\(X(\omega) \in \mathbb{R}\)を対応させるような関数\(X\)のこと。任意の\(x \in \mathbb{R}\)について、\(X \leq x\)である確率は\(P(\cdot)\)を用いて次のように与えられる。
      • \(P(X \leq x) = P(\{\omega \in \Omega | X(\omega) \leq x\})\)
      • つまり、事象を実数に翻訳する関数ということである。
      • \(P(\cdot)\)は可測集合族\(\mathcal{B}\)の上に定義したものなので、厳密には\(\{\omega \in \Omega | X(\omega) \leq x\} \in \mathcal{B}\)でなければならない。
      • \(\omega\)に対して定まる値\(X(\omega) = x\)実現値と呼ぶ。
      • 実現値全体を\(\mathcal{X} = {X(\omega) | \omega \in \Omega}\)で表し、\(X\)標本空間(sample space)と呼ぶ。

1.1.1 確率の計算

  • 確率の定義から次の性質が導かれる。
    1. \(P(A^c) = 1 - P(A)\)
    2. \(A \subset B\)ならば\(P(A) \leq P(B)\)
    3. \(P(A \cap B) \leq min(P(A), P(B))\)
    4. \(P(A \cup B) = P(A) + P(B) - P(A \cap B)\)

1.1.2 統計的独立

2つの事象\(A\)\(B\)があったとき、片方の事象が起こるかどうかがもう片方の事象が起こるかどうかに影響を及ぼさないとき、2つの事象は独立であると言う。

独立であるための必要十分条件は次の式で示される。

\[ P(A \cap B) = P(A)P(B) \]

また、条件付き確率の定義から、上記の式は次のように変形できる。

\[ P(A|B) = P(A) \]

\[ P(B|A) = P(B) \]

1.1.3 条件付き確率

2つの事象\(A\)\(B\)があり、\(P(B) > 0\)のとき、次の値を\(B\)を与えたときの\(A\)条件付き確率(conditional probability)と呼ぶ。

\[ P(A|B) = \frac{P(A \cap B)}{P(B)} \]

上記の式の両辺に\(P(B)\)を掛けると、

\[ P(A|B)P(B) = P(A \cap B) \]

が得られるが、同様の操作を\(P(B|A)\)に対しても行うことで、次の関係が得られる。

\[ P(A \cap B) = P(A|B)P(B) = P(B|A)P(A) \]

1.1.4 ベイズの定理

1.1.4.1 全確率の公式

\[ P(A) = \sum_{k=1}^\infty P(A|B_k)P(B_k) \]

ただし、\(B_1, B_2, ...\)は互いに排反であり、\(\bigcup_{k=1}^\infty B_k = \Omega\)でなければならない。

1.1.4.2 ベイズの定理

\(B_1, B_2, ...\)は互いに排反であり、\(\bigcup_{k=1}^\infty B_k = \Omega\)を満たすとき、\(P(B_j|A)\)を次のように表す。

\[ P(B_j|A) = \frac{P(A|B_j)P(B_j)}{\sum_{k=1}^\infty P(A|B_k)P(B_k)} \]

これをベイズの定理と呼ぶ。これは、条件付き確率の関係から得られる次の式

\[ P(A|B)P(B) = P(B|A)P(A) \]

の両辺を\(P(A)\)\(P(B)\)で割り、分母に全確率の公式を適用することで得られる。

1.1.5 包除原理

和集合の元の数を計算するには、それぞれの集合の元の数の合計から共通部分を引けば良い、というもの。数学的に扱いにくい「または」を扱いやすい「かつ」だけの式に変換できる点が優れている。

集合が2つの場合は

\[ |A \cup B| = |A| + |B| - |A \cap B| \]

となり、3つなら

\[ |A \cup B \cup C| = |A| + |B| + |C| - |A \cap B| - |B \cap C| - |C \cap A| + |A \cap B \cap C| \]

となる。

要するに「かつ」で繋がる集合の数が増えると、正負の記号が交互に現れる。これにより帳尻が合わせられ、共通部分は式の中で1回だけ出現することになる。