Create  Edit  Diff  ホーム  Index  Search  Changes  History  Source  RSS  wikifarm  Login

Pr.Multi.1

面積計算の練習:各県の土地利用

確率だと思うとこんがらがってしまうのかもしれませんが、 神様視点の面積計算としては、本章の話題は手頃な算数にすぎません。 そこで、考え方の練習として、イメージのわきやすい題材で、 その「算数」だけ先に見ておくことにします。

とりあえず確率のことは気にせず、面積計算の算数として、さらっと読んでください。 次節以降では、同じ計算を、こんどは確率として解釈していきます。

同時確率と周辺確率の練習

ある国には、3 つの県(A県・B県・C県)があって、 それぞれ面積は P(A), P(B), P(C) だとします。 面積の合計、つまり国の総面積は 1 です。

P(A) + P(B) + P(C) = 1

この国の土地はすべて、住宅・工場・田畑のどれかに使われています。 それぞれの面積を P(住宅), P(工場), P(田畑) とすれば、合計はやはり 国の総面積である 1 になります。

P(住宅) + P(工場) + P(田畑) = 1
joint.png

これだけでは内訳がわかりませんから、もう少しくわしく、 「A県の住宅の面積」は P(A, 住宅)、「B県の田畑の面積」は P(B, 田畑) のように調査したとしましょう。 当然

P(住宅) = P(A, 住宅) + P(B, 住宅) + P(C, 住宅)
P(工場) = P(A, 工場) + P(B, 工場) + P(C, 工場)
P(田畑) = P(A, 田畑) + P(B, 田畑) + P(C, 田畑)

のはず(各県の住宅面積の合計が、国の住宅の総面積)だし、また

P(A) = P(A, 住宅) + P(A, 工場) + P(A, 田畑)
P(B) = P(B, 住宅) + P(B, 工場) + P(B, 田畑)
P(C) = P(C, 住宅) + P(C, 工場) + P(C, 田畑)

でもあります(県内の住宅・工場・田畑の面積をあわせたのが、その県の総面積)。 さらに、全合計は国の総面積に一致します。

P(A, 住宅) + P(B, 住宅) + P(C, 住宅)
  + P(A, 工場) + P(B, 工場) + P(C, 工場)
  + P(A, 田畑) + P(B, 田畑) + P(C, 田畑)
= 1

条件つき確率の練習

他の県とくらべて、A県は工場を重視しているようです。 その様子を知るために、各県内の工場の面積である

P(A, 工場) と P(B, 工場) と P(C, 工場)

を比べ……たのでは、不公平になってしまいます。 C県はA県よりずっと広いので、面積でいえばA県はどうしても負けてしまい、 P(A, 工場) < P(C, 工場) となるからです。 重視具合を見るなら、面積そのものではなくて「割合」を見るべきでしょう。

そこで、 「A県の中での工場の割合」といった値を P(工場 / A) のように表すことに します(本節だけの臨時の記号です)。 計算のしかたはもちろん、

「A県内の工場の面積を、A県の総面積で割ったものが、工場の割合」

という調子です。

P(住宅 / A) = P(A, 住宅) / P(A)
P(工場 / A) = P(A, 工場) / P(A)
P(田畑 / A) = P(A, 田畑) / P(A)

割合の合計は 1 になります。

P(住宅 / A) + P(工場 / A) + P(田畑 / A) = 1

また、面積と割合から、

P(A, 住宅) = P(住宅 / A) P(A)
P(A, 工場) = P(工場 / A) P(A)
P(A, 田畑) = P(田畑 / A) P(A)

という関係も成り立ちます。

「A県の面積に、A県の中での工場の割合をかければ、A県の工場の面積が出る」

というわけです。 いずれも式から明らかではありますが、式だけでなくイメージとしても、 「あたりまえっぷり」を味わっておいてください。

joint.png

こういう「工場の割合」を

P(工場 / A) = P(A, 工場) / P(A)
P(工場 / B) = P(B, 工場) / P(B)
P(工場 / C) = P(C, 工場) / P(C)

のように各県について計算し、

P(工場 / A) と P(工場 / B) と P(工場 / C)

を比べれば、各県が工場を重視している具合がわかるでしょう。 ここで気をつけてほしいのは、

P(工場 / A) + P(工場 / B) + P(工場 / C)

は 1 とは限らないことです。

P(住宅 / A) + P(工場 / A) + P(田畑 / A) = 1

とどう事情が違うのか、納得しておいてください。

(A県全体の中での)住宅の割合 + 工場の割合 + 田畑の割合

は 1 になりますが、

工場の割合 + 工場の割合 + 工場の割合

なんて計算しても、それはあまり意味のある量ではありません。

さて一方、国の大臣としては、やはり工場の総面積が気になります。 工場の総面積 P(工場) のうちで、A県、B県、C県はそれぞれどんな割合を 占めているでしょうか。さっきとは逆側の話になっていることを注意してください。

  • P(工場 / A) は、「A県の土地の 50%は工場」といった話
  • P(A / 工場) は、「国の工場の総面積のうちで、A県にあるのは 20%」といった話

A県は狭いので、県の半分を工場に費しても、 国の工場全体から見るとたった 20%を占めるに すぎません。 こういう調子で、P(工場 / A) と P(A / 工場) は別物です。

記号にまどわされて

P(工場 / A) = 1 / P(A / 工場)  … ×

なんて勘違いしないでくださいね。 P(工場 / A) も P(A / 工場) も「割合」だから、0 から 1 までの値しかとりません。

P(A / 工場) などの具体的な値は、

P(A / 工場) = P(A, 工場) / P(工場)
P(B / 工場) = P(B, 工場) / P(工場)
P(C / 工場) = P(C, 工場) / P(工場)

のように計算されるわけですが、この合計は 1 になりますか? ……自信を持って答えられたでしょうか。意味をちゃんと見れば、

(工場全体の中での)A県の割合 + B県の割合 + C県の割合

で、合計 1 になることがわかるはずです。

Bayesの公式の練習

いろいろな量が出てきましたが、その中でも特にイメージしやすいのは、 各県の面積

P(A), P(B), P(C)

と、各県内での利用割合

P(住宅 / A), P(工場 / A), P(田畑 / A)
P(住宅 / B), P(工場 / B), P(田畑 / B)
P(住宅 / C), P(工場 / C), P(田畑 / C)

ではないでしょうか。

ここで問題です。 これらの「イメージしやすい量」だけを使って、

「国の田畑の総面積に占める、A県の寄与の割合 P(A / 田畑)」

を表してください。 必要なてがかりはもうすべて出ているはずです。

joint.png

……とりあえず、P(A / 田畑) のまま眺めていても進まないので、 これを別のもので表してみましょう。 P(A / 田畑) を求めるには、「A県の田畑の面積」を「国の田畑の総面積」で 割ってやればよい。

P(A / 田畑) = P(A, 田畑) / P(田畑)

この分子 P(A, 田畑) は、

「A県の田畑の面積」 = 「A県の面積」 × 「A県の中での田畑の割合」
P(A, 田畑) = P(田畑 / A) P(A)

のように、「イメージしやすい量」で書き直せます。 分母の方も、まず

P(田畑) = P(A, 田畑) + P(B, 田畑) + P(C, 田畑)

のように県別に分けておけば、それぞれいまと同様に

P(A, 田畑) = P(田畑 / A) P(A)
P(B, 田畑) = P(田畑 / B) P(B)
P(C, 田畑) = P(田畑 / C) P(C)

と書き直せます。 こうして結局、

P(A / 田畑) = ○ / □
○ = P(田畑 / A) P(A)
□ = P(田畑 / A) P(A) + P(田畑 / B) P(B) + P(田畑 / C) P(C)

が答です。

前項までの話、とくに

P(A, 田畑) = P(田畑 / A) P(A)
P(A, 田畑) = P(A / 田畑) P(田畑)

がしっかり頭にしみていれば、「暗記」しなくても、 必要なときにその場でささっと導出できるでしょう。

独立性の練習

もし各県がまったく同じ割合で住宅・工場・田畑を割り当てたら、 どうなるでしょうか。

P(住宅 / A) = P(住宅 / B) = P(住宅 / C)
P(工場 / A) = P(工場 / B) = P(工場 / C)
P(田畑 / A) = P(田畑 / B) = P(田畑 / C)

どの県を訪れてみても、

  • 住宅が30%
  • 工場が20%
  • 田畑が50%

のような割合は一定で、全く画一的です。 特色がなくてつまらない旅行になることでしょう。

気をつけてほしいのは、

P(A, 住宅) と P(B, 住宅) と P(C, 住宅)

は依然違っているという点です。 C県はA県よりもずっと広くて、住宅の面積もやはりずっと広いのです。 上のような画一性を知るためには、面積そのものではなく、 各県での「割合」を見る必要があります。

indep.png

興味深いことに、この画一性は、いろいろな表現で言いかえることができます。 例えば、比を使って

P(A, 住宅) : P(A, 工場) : P(A, 田畑)
= P(B, 住宅) : P(B, 工場) : P(B, 田畑)
= P(C, 住宅) : P(C, 工場) : P(C, 田畑)

と言っても同じことになります。

県内の住宅面積 : 県内の工場面積 : 県内の田畑面積

という比率が、どの県でも同じだというわけです。

あるいは、「どの県でも、土地利用の割合は、国全体での割合と同じ」と 言いかえてもいいでしょう。

P(住宅 / 県) = P(住宅)
P(工場 / 県) = P(工場)
P(田畑 / 県) = P(田畑)

がどの県(A・B・C)でも成り立つ、 という現象が、上の画一性と等価なことを納得してください。

さらに、次のような特徴も、上の画一性と等価になります。

P(A, 住宅) = P(A) P(住宅), P(B, 住宅) = P(B) P(住宅), P(C, 住宅) = P(C) P(住宅)
P(A, 工場) = P(A) P(工場), P(B, 工場) = P(B) P(工場), P(C, 工場) = P(C) P(工場)
P(A, 田畑) = P(A) P(田畑), P(B, 田畑) = P(B) P(田畑), P(C, 田畑) = P(C) P(田畑)

まとめて一言で言えば、

P(県, 用途) = P(県) P(用途)

です。 本来は P(A, 住宅) = P(住宅 / A) P(A) のように 計算しないといけなかったはずですが、画一的な場合には、 県に関係なく住宅の割合は一定です(P(住宅 / A) = P(住宅))。 なので、県ごとの割合を持ち出さなくても、単純に

「A県の面積」 × 「国全体での住宅の割合」 = 「A県の住宅の面積」

となるのです。国の総面積がちょうど 1 だったために、

国全体での住宅の割合 = 国全体での住宅の面積

なことを思い出してください。 また、逆に、こうなっていれば画一的と言えることも確認しておいてください。 これでは確かに、どの県でも土地利用の割合は同じになってしまいます。

うっかりする人が多いので念を押しておきますが、

P(A, 住宅) = P(A) P(住宅)

のように計算していいのは、 「画一的」だったからです。 ふつうは、県ごとに住宅の割合が違いますから、ちゃんと「その県での割合」を 使って

P(A, 住宅) = P(住宅 / A) P(A)

としなくてはいけません。

ちょっと意外かもしれないのはここから。 画一性は、逆側から

P(A / 住宅) = P(A / 工場) = P(A / 田畑)
P(B / 住宅) = P(B / 工場) = P(B / 田畑)
P(C / 住宅) = P(C / 工場) = P(C / 田畑)

と表現することもできます。 国全体から見て、A県の寄与が、

  • 住宅の総面積のうちでA県が占める割合は 20%
  • 工場の総面積のうちでA県が占める割合も 20%
  • 田畑の総面積のうちでA県が占める割合も 20%

のようにどの用途でも等しいよ、という調子です。 これも、上で最初に述べた画一性と等価になります。 てっとりばやくこれを納得するには、 一つ前の条件を吟味するといいでしょう。

P(県, 用途) = P(県) P(用途)

という条件では、「県」と「用途」が対等です。 対等ですから、両者の役割をいれかえたものも元と等価になります。 そして、この条件はここまでのどの「画一性条件」とも等価だったのでした。 となれば、結局、 どの画一性条件でも「県と用途との役割をいれかえてよい」ことになります。

そういうわけで、

P(A, 住宅) : P(B, 住宅) : P(C, 住宅)
= P(A, 工場) : P(B, 工場) : P(C, 工場)
= P(A, 田畑) : P(B, 田畑) : P(C, 田畑)

というのもやはり画一性の条件として等価です。 言葉で書けば、用途別に見た各県の寄与の比率

  • A県の住宅面積 : B県の住宅面積 : C県の住宅面積
  • A県の工場面積 : B県の工場面積 : C県の工場面積
  • A県の田畑面積 : B県の田畑面積 : C県の田畑面積

が、住宅か工場か田畑かによらず一定だということです。

また、

P(A / 用途) = P(A)
P(B / 用途) = P(B)
P(C / 用途) = P(C)

がどの用途(住宅・工場・田畑)でも成り立つ、というのも等価です。 用途に関係なく、 「各県の寄与の割合は、各県の総面積の割合と同じ」というわけです。 国の総面積が 1 なので、

県の面積 = 国の総面積の中でその県が占める割合

なことを思い出してください。

indep3d.png

練習完了

joint.png indep.png

これで練習は完了です。 この先の話で、もしイメージがわかなくなったときには、 いつでも本節へ戻ってきてください。


コメントはプログラミングのための確率統計


Last modified:2005/10/16 23:46:37
Keyword(s):
References:[Pr.Disc.5] [Pr.Multi]