意思決定へのデータ活用 ~その1~
「データ活用による最適意思決定が競争力の源泉」という小難しい(だけどよくわからん)お話ってたまに聞きますね。
実際のところ、データ使うといい判断できるんでしょうか?それって具体的にどうやればいいんでしょうか??
これから数回に分けてそこの根っこのところを記していきたいと思います。
まず、ざっくりと知っておこう!意思決定とは?
やりたいことを決めて、それを実現するためのやりかた考えて実行する、これが意思決定の流れです。もうちょっと細かく書くと
- なんかやりたいことがあって(目標設定)
- どうやったらできるかなと考えて(仮設立案)
- ほんとにそれでできるかなと確認して(仮設検証)
- やってみる(実行)
- やってみて目標達成できたかなと確認する(評価)
この流れの中でどうやってデータが活用できるのでしょうか?
意思決定に必要なものって何なんだろう?
では質の高い意思決定を行うためには何が必要なのでしょう?ポイントは下記3つ。どれが欠けても駄目、三つをバランスよく使って初めて質の高い意思決定が可能になると思います。
- 豊富な経験 (経験に基づく洞察力)
- バイアスの理解 (経験が邪魔をすることがある)
- データの活用 (バイアスを排除した洞察力)
今回は「豊富な経験 」のお話とその課題
豊富な経験
意思決定に経験と直感は重要です。職人技ってまさにそうですし、ビジネスの世界でも豊富な経験を元に意思決定を行うのって王道ですよね。そのやり方のノウハウを書いた書籍もいろいろあります。
元BCG(Boston Consulting Group)日本代表の内田和成は著書[1]の中で正しい課題設定を行うことで問題解決力が劇的に向上すると述べており,その能力をアップさせるためには経験が重要だと述べてます。
同じく元BCG日本代表の御立 尚資も著書[2]の中で正しい課題設定をする能力をインサイトという言葉で定義し,その重要性を述べており,その能力の向上には経験が重要だと述べています。
マルコム・グラッドウェルは著書[3]の中で,贋作を一瞬の直感で見抜いた美術館員の例をあげている.これは経験により高い問題解決力を身につけた例であり,経験の重要性を示す典型的な例です。
しかし課題も
でも状況によっては、経験に頼りすぎてしまった結果生じる思い込みや自信過剰が、誤った意思決定に走らせてしまうケースもあります。
イノベーションの泰斗であるクレイトン M.クリステンセンはその代表的著作[4]の中で過去のビジネスモデルでの成功体験に縛られた企業が正しい意思決定をできず衰退していく例を記しています。
リチャード・P・ルメルトは著書[5]の中でこの思い込み,自信過剰を無意識の罠と表現し,これにはまらないことが戦略思考の極意であるとしてます。
リチャード S テドローは著書[6]の中で企業のリーダーが成功体験に起因する思い込み,自信過剰によって誤った選択をしてしまう例をあげています。
イアン・エアーズは著書[7]の中で,ワインの価格予測でワイン専門家による判断より,簡単な数式を用いた予測の方が高い精度で予測した例をあげている.これは経験による問題解決力の限界と課題を示す典型的な例ですね。
経験は問題解決能力を向上させる重要な要素であると同時に,問題解決能力を低下させる要因にもなるのです。
ではどうすればいいのか?
第一のポイントは自分の思い込みに気づくこと
第二のポイントはデータを使って客観的な判断材料を得ること
おのお話は次回に!!!
[3]マルコム・グラッドウェル:第1感 「最初の2秒」の「なんとなく」が正しい
人口知能を語る前に 脳について知っておこう
最近「人工知能」という言葉がちょっとしたブームで、いろんなところでこの言葉を聞きます。
役立つ情報も多いのですが、中には間違った理解に立って無意味に危機感を煽るだけに思えるものも見受けられます。
こんな状況の中、人工知能について偏らない客観的な視座を得るためには "人口知能を構成する要素" である「コンピューター」と"人口知能がめざす先"である「脳」について正しく把握しておくことが肝心だと思います。
ということで、今回は「脳」について
脳の配線はまだ分かっていない
脳はニューロンとシナプスで構成されています。この仕組みを模したのがニューラルネットワーク、ディープラーニングはその代表的なものです。
しかしこれだけでは脳をシミュレーションすることは出来ません。脳には1000億個のニューロンと160兆に及ぶであろうシナプスから構成されています。現在までの研究の脳の機能を生んでいるのは個別要素ではなくニューロンとシナプスで構成されたネットワークであるとされています。脳のネットワーク地図はコネクトームと呼ばれており、まだこれは作成されていません。
コネクトームが作成され、脳の仕組みがわからない限り、脳のシミュレーションの可能性を検討することは難しいと思います。
現在は脳の構成要素を模しているだけで、例えるなら「ピカソが使っているのと同じ絵の具を使っている」のと「ピカソのような絵を描く」くらいの差がある状態です。たとえいまいちですが。。。
現在成功しているディープラーニングの技術自体は、脳の機能と似たものを使って役立つものを作るいわゆる「弱いAI的アプローチ」で、こちらは多くの実績をあげています。
ただコンピューターで脳と同等のものを作る「強いAI的アプローチ」は上に述べた理由でまだまだ実現までには壁があります。しかももしコネクトルームが解明されたとしても、脳の最大の謎「意識」の仕組みを解明するにはさらに時間がかかるでしょう。
機械学習とは何か?
機械学習とは何か? 一言で言うと「今までと少し違うコンピューターの使い方」です。
- 面積 = 底辺 x 高さ ÷ 2
- カードの履歴データから不正使用データを見つけたい
- たくさんくるメールの中から迷惑メールを判別して削除したい
- カードの履歴データから不正使用データを見つけたい
- たくさんくるメールの中から迷惑メールを判別して削除したい
ベイズ的な考え方
ベイズ的な考え方をクイズ番組の最終問題にありそうな設定でお話します。
『さて最終問題です。客席に座っている100名の観客から1名を選んでください。選んだ方が広島出身ならあなたに100万円を差し上げます。選ぶ前に観客のみなさんに一つだけ質問することができます。質問を考える手がかりとして観客の皆様に事前に行ったアンケート結果をお渡しします。さあ強運と頭脳でチャンスをつかんでください。』
質問しないで運に任せると (事前確率)
アンケート情報によれば100名のうち10名が広島出身者、質問しないで運に任せて選ぶと当たる確率は10パーセント、くじ運わるいから厳しいか。。。
どんな質問をする? (尤度と事後確率)
質問を考えるためにアンケート情報をみているとこんなのを発見しました
- 広島出身者の90パーセントが和食派
おー!広島出身者の90パーセントが和食派、ということは「あなたは和食派ですか?」と聞いて手を上げた人から選べば当たる確率あがる! ん、、、、なんか違うか。。
これは『広島出身者が和食派である』確率と『和食派が広島出身者である』確率を混同している例ですね。
「広島出身者の90パーセントが和食派」からわかるのは『広島出身者が和食派である』確率が高いということ。
「あなたは和食派ですか?」という質問で当選確率があがるのは『和食派が広島出身者である』確率が高い場合です。
「あなたは和食派ですか?」と質問すると当選確率はあがるのか?
「あなたは和食派ですか?」の質問が有効かを判断するためには追加で情報が必要です。アンケートを読んでいるとその情報を発見。
- 他県出身者の90パーセントが和食派
広島県出身者も他県出身者も90パーセントが和食派、ということはこの質問をして挙手した人から選んでも確率は変わりません。図示するとこうなります。
*この質問に挙手する人は広島出身者の9名と他県出身者の81名で合計90名、ここから選んで広島出身者があたる確率は質問前と変わらず10パーセントです。
「あなたはカープファンですか?」で当選確率はあがるのか?
アンケートを調べているともうひとつ情報を発見しました。
カープファンの確率は広島出身者の方が高い、ということはこの質問は有効です。図示するとこうなります。
*この質問に挙手する人は広島出身者の7名と他県出身者の9名で合計16名、ここから選んで広島出身者があたる確率は約 44パーセント、この質問は正解率あげるのに有効です。
ベイズ的な考え方
事前確率
質問する前の正解確率10パーセント (100名中10名が広島県人)を事前確率といい、式ではこう表します。
- P(広島県人) = 10%
事後確率
質問した後の正解確率を事後確率といい、式ではこう表します。
尤度
広島出身者が和食派である確率、他県出身者が和食派である確率、広島県人がカープファンである確率、他県人がカープファンである確率を尤度といい、式ではこう表します。
- P(和食派|広島県人) = 90% 広島出身者の90パーセントが和食派
- P(和食派|他県人) = 90% 他県出身者の90パーセントが和食派
質問によって事後確率があがるのは1の確率が2の確率より高い場合です。
越境するITというタイトルについて
このブログのタイトルは「越境するIT」です。このタイトルにしたのは、ITの適用範囲がここ数年でどんどん拡大してこれまでカバーしていなかった場所に "越境して" 進出している印象を持ったからです。越境後の世界で必要となる新しいITリテラシーをこれから記す3つのエリアで語ってみたい、という思いを込めて「越境するIT」を選びました。
"越境の様子" を3つのエリアで表したのがこちらの図です。
それぞれ簡単に説明すると
データ ~構造化データから非構造化データへ~
これまでコンピューターは主に「構造化データ」を扱ってきました。ざっくりいうと "Excelのシートでまとめることができる、きちんと形式の決まったデータ" です。
しかし世の中見渡してみると「構造化データ」は全体の20%にすぎません。残りの80%は「非構造化データ」といわれるもの。ざっくりいうと つぶやき,メール内容、 画像、声など形式の決まっていないデータです。これを活用しない手はない、ということで非構造化データをコンピューターが処理できる形式にして活用しようというのが最近の流行です。
処理方法 ~演繹から帰納へ~
コンピューターはこれまで「論理的にやり方を説明できる」ものを実行することが得意でした。足し算、掛け算、会計の決算処理、その他色々。これらはそのやり方をプログラムとして作成し、それをコンピューターに実行させればOKです。この場合同じ入力に対して必ず同じ答えを出します。これを演繹的とか確定的とかいいます。
一方世の中を見渡すと私たちがやってる行動には「論理的にやり方を説明できない」けど無難にこなしているものが多くあります。人の顔を見て喜怒哀楽を判断したりするのも"判別の仕方を教えて"といわれても難しいですよね、もっと身近な例でいうと椅子っていろんな形のものがあるのにぱっと見て「あ、これは椅子だ」って判別できるのも"椅子を判別する論理的なロジックを教えて"といわれると言葉につまるのではないでしょうか?人間は「人の喜怒哀楽」、「これは椅子?」を過去の経験から学習して判断していると思われています。同じことをコンピューターにやらせようというのが『機械学習』といわれる分野です。機械学習では判断のロジックを埋め込むのではなく、判断の精度をあげる学習方法をロジックとして組み込んでいます。この方法だと常に正しい一定の答えを得るわけでは無く、人間と同じく間違えることもあります。経験から一般法則を導き出しておおよそ正しい結果を高い確率で出すことができるので帰納的といわれています。
目的 ~生産性から創造性へ~
コンピューターはこれまで主に生産性を上げるために使われてきました。
家計簿つけるのにそろばんと家計簿用のノートでやってると計算に時間かかるし間違いもする、検算してノートに書いて、でもやっぱり間違ってた!となると取消線でノート修正したり。これエクセルでやると段違いに効率が良くなり生産性が上がります。企業の決算にコンピューター使うのも基本的には同じ理由。
二つの確率
一言で確率と言いますが実は確率には2種類あります。
- サイコロで偶数が出る確率 50パーセント
- 太郎さんが大学に合格する確率 50パーセント
色んな判断力
判断力といってもいろんなのがあるので、独断で区分けしてみました
- スポーツの判断力
- ビジネスの判断力
- 経済の判断力
- 自然科学の判断力
スポーツの判断力
一瞬で次のアクションを決める判断力、意識で考えるのでなく自然に体が動く判断力。
古い話ですが「プロ野球日本シリーズ最終戦で満塁一打逆転のピンチ、マウンドには江夏豊、投球に入ってからバッターがスクイズをしてくる気配を感じカーブの握りのままボールをウェストしてスクイズを防いだ」江夏の21球として語り継がれるこのお話。この意思決定は論理的に考えるのではなく気配を察知して瞬時の対応している、スポースの意思決定の代表的な例。
ビジネスの判断力
ビジネスでは限られた時間で入手できる情報と担当者の過去の経験を元に意思決定が行われる。
ビジネスの世界では適切なタイミングで適切な判断を下すことが最も重要。「さーてこの新製品投入しようか、どうしようか?」と1年も考えていたらまわりの環境が変わってしまってその製品自体の魅力がなくなってしまう可能性もある、迅速な判断ってのがビジネスに求められること。データという客観的な情報と担当者の経験という主観的な情報をミックスして意思決定がなされます。
経済の判断
経済も限られた時間で入手できる情報と担当者の過去の経験を元に施作が選択されるのはビジネスと一緒。大きく異なるのは、ビジネスが自分の組織、会社が幸せになることを考えるのに対して、経済は経済というシステム全体の最適化を考えるものであること。
自然科学
自然科学の分野ではどんなに時間がかかろうと客観的な情報で論理的に証明できる真理を見つけるのがお作法。