Create  Edit  Diff  ホーム  Index  Search  Changes  History  Source  RSS  wikifarm  Login

Pr.Cont.8

期待値と分散・標準偏差

期待値

実数値の確率変数の期待値については、また「定義の拡張」がまず必要です。 それには、整数値の確率変数の期待値を、神様視点で見ておくのがいいでしょう。

整数値の確率変数 X に対して、その期待値は、

E[X] = Σ_i i P(X = i)

(Σ_i は「X のとり得るすべての値 i について和をとる」) で計算されました。 この計算は、次のように図示できました (→Pr.Disc.5の「神様視点と雪国の話でおさらい」)。

disc_snow2m.png

つまり、「あらゆるパラレルワールドの集合Ω」にもう一本縦軸を生やし、 「各世界ωでの X の値」を縦軸にプロットして、できたグラフの体積を 答えれば良いわけです (底面Ωの面積は 1 という約束だから、高さ=体積)。 もっと端的に言えば、

関数 X(ω) のグラフの体積

が E[X] です。 「神様視点では、確率変数 X とはただの関数 X(ω) のこと」という話を 思い出してください(→ Pr.Def.4「確率変数」)。

これをそのまま流用して、実数値の確率変数 X についても、 「関数 X(ω) のグラフの体積」を「X の期待値 E[X]」と定義するのが自然です。

cont_expect1.png

X の確率密度関数 f_X を使えば、この体積は

E[X] = ∫ x f_X(x) dx

という式で計算できます。理由は次の図を見てください。

cont_expect2.png

このオブジェの体積を測りたいわけですが、そのままでは手が出にくいので、 ブロックに分割して測ります。 Δx を小さな正数として、 高さが x から x + Δx までの部分を切り出せば、このブロックの底面積は おおよそ f_X(x) Δx のはずです(それが確率密度関数 f_X の定義でした)。 すると、このブロックの体積は、おおよそ

高さ×底面積 = x f_X(x) Δx

となります*1。 この図で幅 Δx を小さくしていけば、極限は

「各部分の体積 x f_X(x) Δx」の合計 → ∫ x f_X(x) dx   (Δx → +0)

となります(ぴんとこなければ解析学を復習)。

結局、得られた結論「E[X] = ∫ x f_X(x) dx」は、 「Σ が ∫ に化けた」といういつもの格好でした。 同様に、任意の関数 g に対して

E[g(X)] = ∫ g(x) f_X(x) dx

も成り立ちます。 納得いかなければ離散値のときを復習してください(→Pr.Disc.5)。

\memo{例題をここに}

【演習】 次の性質を、積分計算から導け。

E[3 X] = 3 E[X]
E[X + 3] = E[X] + 3

→ 積分の一般的な性質から

E[3 X] = ∫3 x f_X(x) dx = 3 ∫x f_X(x) dx = 3 E[X]
E[X + 3] = ∫(x + 3) f_X(x) dx = ∫x f_X(x) dx + 3∫f_X(x) dx = E[X] + 3・1 = E[X] + 3

(後者は ∫f_X(x) dx = 1 に注意) 【演習終】

【演習】 次の性質を、積分計算から導け。

E[X + Y] = E[X] + E[Y]
X と Y が独立なら E[X Y] = E[X] E[Y]

→ Z = (X, Y) と置き、関数 g(Z) = X + Y を考えれば、

E[X + Y]
= E[g(Z)] = ∫ g(z) f_Z(z) dz = ∫∫(x+y) f_{X,Y}(x,y) dx dy
= ∫∫x f_{X,Y}(x,y) dx dy + ∫∫y f_{X,Y}(x,y) dx dy
= ∫x (∫f_{X,Y}(x,y) dy) dx + ∫y (∫f_{X,Y}(x,y) dx) dy
= ∫x f_X(x) dx + ∫y f_Y(y) dy
= E[X] + E[Y]

また、関数 h(Z) = X Y を考えれば、

E[X Y] = E[h(Z)] = ∫ h(z) f_Z(z) dz = ∫∫x y f_{X,Y}(x,y) dx dy

ここで X と Y が独立なら、f_{X,Y}(x,y) = f_X(x) f_Y(y) だから、上式は

E[X Y] = ∫∫x y f_X(x) f_Y(y) dx dy

と書き直される。それをさらに変形して、

E[X Y] = (∫x f_X(x) dx) (∫y f_Y(y) dy) = E[X] E[Y]

【演習終】

分散・標準偏差

期待値さえ定義されれば、分散や標準偏差はストレートです。

E[X] = μ

のとき、

分散 V[X] = E[(X - μ)^2]
標準偏差 σ = √V[X]

のように、これらは期待値を使って定義されていましたから。

\memo{分散・標準偏差の性質を積分計算としておさらい}

\memo{例題}

「整数値のときの話の実数値版を作ろう」シリーズは、ここまでで終了。 結局、「確率のΣ」を「確率密度の∫」に書き直すだけで、 整数値のときの話はあらかた通用します。 表しているものの違い(確率と確率密度の違い)には気をつけないといけませんが、 格好自体はそのままですから、頭は楽でしょう。


コメントはプログラミングのための確率統計


Last modified:2006/01/03 05:15:49
Keyword(s):
References:[Pr.Cont] [Pr.Disc.5]

*1 もう少しまじめに言うと、「少なめに見て x f_X(x) Δx くらい、多めに見て (x + Δx) f_X(x) Δx くらい」。ですが、Δx が小さければ Δx の自乗はさらに小さいので、少なめと多めとの誤差はここでは気にしません。