越境するコンピューター

越境するコンピューター ~日記~

新しいコンピューターとの付き合い方 〜コンピューターと意思決定と人間〜

ベイズ的な考え方

ベイズ的な考え方をクイズ番組の最終問題にありそうな設定でお話します。

『さて最終問題です。客席に座っている100名の観客から1名を選んでください。選んだ方が広島出身ならあなたに100万円を差し上げます。選ぶ前に観客のみなさんに一つだけ質問することができます。質問を考える手がかりとして観客の皆様に事前に行ったアンケート結果をお渡しします。さあ強運と頭脳でチャンスをつかんでください。』

 

質問しないで運に任せると (事前確率)

 アンケート情報によれば100名のうち10名が広島出身者、質問しないで運に任せて選ぶと当たる確率は10パーセント、くじ運わるいから厳しいか。。。

 

どんな質問をする? (尤度と事後確率)

質問を考えるためにアンケート情報をみているとこんなのを発見しました

  • 広島出身者の90パーセントが和食派

おー!広島出身者の90パーセントが和食派、ということは「あなたは和食派ですか?」と聞いて手を上げた人から選べば当たる確率あがる! ん、、、、なんか違うか。。

 

これは『広島出身者が和食派である』確率と『和食派が広島出身者である』確率を混同している例ですね。

「広島出身者の90パーセントが和食派」からわかるのは『広島出身者が和食派である』確率が高いということ。

「あなたは和食派ですか?」という質問で当選確率があがるのは『和食派が広島出身者である』確率が高い場合です。

 

「あなたは和食派ですか?」と質問すると当選確率はあがるのか?

「あなたは和食派ですか?」の質問が有効かを判断するためには追加で情報が必要です。アンケートを読んでいるとその情報を発見。

  • 他県出身者の90パーセントが和食派

広島県出身者も他県出身者も90パーセントが和食派、ということはこの質問をして挙手した人から選んでも確率は変わりません。図示するとこうなります。

f:id:kenshi18:20160225092219g:plain

*この質問に挙手する人は広島出身者の9名と他県出身者の81名で合計90名、ここから選んで広島出身者があたる確率は質問前と変わらず10パーセントです。

 

「あなたはカープファンですか?」で当選確率はあがるのか?

 アンケートを調べているともうひとつ情報を発見しました。

  • 広島出身者の70パーセントがカープファン
  • 他県出身者の10パーセントがカープファン

カープファンの確率は広島出身者の方が高い、ということはこの質問は有効です。図示するとこうなります。

f:id:kenshi18:20160225092320g:plain

*この質問に挙手する人は広島出身者の7名と他県出身者の9名で合計16名、ここから選んで広島出身者があたる確率は約 44パーセント、この質問は正解率あげるのに有効です。

 

ベイズ的な考え方

事前確率

質問する前の正解確率10パーセント (100名中10名が広島県人)を事前確率といい、式ではこう表します。

事後確率

質問した後の正解確率を事後確率といい、式ではこう表します。

尤度

広島出身者が和食派である確率、他県出身者が和食派である確率、広島県人カープファンである確率、他県人がカープファンである確率を尤度といい、式ではこう表します。

  1. P(和食派|広島県人) = 90%       広島出身者の90パーセントが和食派
  2. P(和食派|他県人) = 90%           他県出身者の90パーセントが和食派
  1. P(カープファン|広島県人) = 70%   広島出身者の70パーセントがカープファン
  2. P(カープファン|他県人) = 10%     他県出身者の10パーセントがカープファン

質問によって事後確率があがるのは1の確率が2の確率より高い場合です。

 

カープファンが広島県人である事後確率を求める式はこんなかんじ。これがベイズの定理です。

P(広島県人|カープファン) = P(カープファン|広島県人)  x P(広島県人) /P(カープファン)