この記事は第134回のオススメ記事に選ばれました! よりニコニコできるような記事に編集していきましょう。 |
食べれば食べるほど食欲がわくものよ。
期待効用とは、効用の期待値である・・・といっても意味不明だと思うので、以下で(1)期待値、(2)期待効用の順に説明する。
はじめに
自分の行動が吉と出るか凶と出るかわからない。人生においてそんな状況に直面することは多い。そんな「賭け」「ギャンブル」に出ざるを得ない時、自分の行動がどれくらいの利益・損失をもたらすのかを予想しておく必要がある。運よく確率、結果についてはっきりしている場合[1]、(以下で説明する)期待値、期待効用は行動の指針となり得る。
期待値・期待利得
確実・不確実と期待値
まずは、以下の状況を考えてみよう。
どっちがうれしいかと問われれば、1がうれしいはずである(リンゴ嫌いの人を除く)。1は確実にもらえるのに対して2は不確実(uncertain)である。
- リンゴを1個ももらえない
確実に何ももらえない3は論外だとして、「2より1のほうがまし」だということを数学的に表すには、取得できる確率を掛ければよい。通常確率はパーセントで書かれることが多いが、本来は0≦p≦1の値をとる。「確実にもらえる」ということは、確率1を掛ければよく、確実にもらえないということは確率0を掛ければよい。「五分五分」は50%。つまり0.5を掛ければよい。
- 1×1 = 1
- 1×0.5 = 0.5
となり、1のほうが数値が大きくなる。かくして1のほうが2よりも大きいので1が望ましいという結論になる。
このように、「結果として予想される事象」に「生起確率」を掛けたものを期待値(expected value)と呼ぶ。
うれしくないことにも応用できる。この場合ダメージを負の数として定義すればよい。
このような場合は
となり、2のほうが大きい。2のほうがましな状況だと判断できる。経済学や意思決定論などの分野で、不確実下の意思決定を理論化する際には、このような得られるもの(利得)、失うもの(損失)の期待値を計算する。利得、損失の期待値を期待利得(期待損失)とよぶ。数学的には期待利得は期待値と同じものである。
期待値・期待利得の性質
期待値は単位が同じならば足すことができる。
- 100円を50%の確率で、300円を10%の確率でもらえる→100×0.5 + 300×0.1 = 50+30 = 80円
- 勝敗の確率が五分五分の賭けで、勝ったら1000円もらえる、負けたら1000円払わされる→1000×0.5 + (-1000)×0.5 = 0
単位が違う場合は併記することになる。
- リンゴ10個を10%の確率で、みかん4個を25%の確率でもらえる→リンゴとみかんを1個ずつ
- 花20個を50%の確率で、ゆめ30個を3分の1の確率でもらえる→花とゆめを10冊ずつ
- 栗10個を10%の確率で、栗鼠2匹を50%の確率でもらえる→エロいこと書いてあると思ったの。ばかなの。死ぬの。
たくさん試行して平均すればだいたいあってる。
賭けやギャンブルで一発で利得や損失を考えたとき、その賭けを1回やっただけでは期待値ちょうどになることはほぼない。しかし、何回も繰り返すと、平均的には期待値、期待利得に近づいていく(大数の法則)。
である。
実際さいころを振ると・・・(誰が1,000回も振るんだよ・・・excelに決まってるだろ。)
試行回数 | 平均値 |
1 | 4 |
10 | 3.2 |
20 | 3.8 |
50 | 3.7 |
100 | 3.52 |
200 | 3.58 |
500 | 3.526 |
1000 | 3.519 |
となり、期待値の3.5に近づいていくことがわかる。
もっとも、現実問題としては、試行を繰り返すことは出来ないという問題があるのだが・・・。
例)宝くじの期待値
ここでは、いちばん簡単な年末ジャンボ宝くじを例にとる。2009年の年末ジャンボ宝くじ(第573回全国自治宝くじ)を7億枚販売した場合、当選金は以下のとおりである。1等は2億円が当選数70本。前後賞5千万円が当選数140本、2等が1億円で140本、等。一番少額の7等は300円で7000万本当選がある。
等級 | 当選金(A) | 当選数(B) | 当選確率(C) | 期待値(D) |
1等 | ¥200,000,000 | 70 | 0.0000001 | 20 |
1等の前後賞 | ¥50,000,000 | 140 | 0.0000002 | 10 |
1等の組違い賞 | ¥100,000 | 6,930 | 0.0000099 | 0.99 |
2等 | ¥100,000,000 | 140 | 0.0000002 | 20 |
3等 | ¥5,000,000 | 700 | 0.000001 | 5 |
4等 | ¥100,000 | 42,000 | 0.00006 | 6 |
5等 | ¥10,000 | 700,000 | 0.001 | 10 |
6等 | ¥3,000 | 7,000,000 | 0.01 | 30 |
7等 | ¥300 | 70,000,000 | 0.1 | 30 |
元気に2010年賞 | ¥1,000,000 | 7,000 | 0.00001 | 10 |
合計(E) | 141.99 |
期待値を求めるためには、まず各等級の当選確率(C)を求める。これは当選数(B)70を総数70,000,000で割ってやればよい。1等は7億本のうちの70本が当選なので70÷700,000,000 = 0.0000001つまり、1000万分の1である。
次に、2億円が当選確率1000万分の1で当たる場合の期待値(D)を求める。これは当選金(A)に先ほど求めた当選確率(C)をかけてやればよい。200,000,000×0.0000001 = 20。よって、宝くじが1等だけだった場合は20円の期待値である。
宝くじは1等から7等まであるので、それぞれの期待値(D)を求め、合計(E)すれば、宝くじ1枚買った時の期待値が得られる。合計した結果は142円弱で ある。宝くじは1枚300円である。期待値の考え方では、「300円払った結果、平均すると142円が払い戻される」ということになる。
ギャ ンブル全体に言えることだが、期待値が購入金額を超えることはない。手数料、運営費などがあるためである。期待値の考えで行けば、ギャンブルは平均的には 必ず損をするようにできている。計算上は宝くじ1枚を買うたびに158円を失っているといえる。もっとも、残りの158円を「捨てている」と思うか、「そのお金で夢(スリル?)を買っている」と思うかでその評価が変わってくるのだろう。
期待値でいいのか?--サンクトペテルブルクのパラドックス
こんなギャンブルを考えてみよう。
- じゃんけんで勝ったら1円もらえる。負けたらゲームオーバー。
- 次もじゃんけんして、そこで勝ったら2円もらえる。負けたらゲームオーバー。
- 次もじゃんけん。勝ったら4円もらえる。負けたらゲ(ry
- まだじゃんけん。勝ったら8円もらえる。負け(ry
このように、勝ち続ける限り掛け金が倍になっていくギャンブル。
そこで問題。あなたはこのギャンブルに参加料があった場合、いくら払うか?
まずは期待値を考えてみればよい。
- 1/2の確率で1円もらえる→1×(1/2) = 1/2
- その1/2の確率((1/2)×(1/2)=1/4)で2円もらえる→2×(1/2)×(1/2) = 1/2
- さらにその1/2の確率((1/2)×(1/2)×(1/2) = 1/8)で4円もらえる→4×(1/2)×(1/2)×(1/2) = 1/2
- またさらにその1/2の確率((1/2)×(1/2)×(1/2)×(1/2) = 1/16)で8円もらえる→8×(1/2)×(1/2)×(1/2)×(1/2) = 1/2
- 以下打ち止めがないので無限に続く・・・
すると期待値は1/2+1/2+1/2+1/2+1/2+1/2+・・・ = ∞となり、いくら払っても大丈夫ということになる。たとえば参加費が100億円でも参加するべきということである。これは直感に反するのではないか。
この問題を提示したのがダニエル・ベルヌーイ(1700-1782)である。彼がサンクトペテルブルクに住んでいたため、この問題はサンクトペテルブルクのパラドックス(St. Petersburg paradox)と呼ばれる。
期待効用
効用
期待値、期待利得の話から少しはなれて、自分に以下のことを問いかけてみよう。
確かに悪い話ではないが、リンゴは腐る。一人暮らしをしていて腐敗させる前に消費するのは困難である。誰かに売りつければいいのかもしれないが、手間がかかる。リンゴ1000個じゃなくて海老1000匹だったらあちこち海老臭くなって大変である。
たとえばリンゴ10万個もらえるとしたら、倉庫代もかかるし、管理も大変だし、もらわないほうがましだ[2]。
このように、取得できる利得と「うれしさ」というのは必ずしも比例しない。「過ぎたるはなお及ばざるが如し」である。
効用関数――効用・限界効用
ではどうすればいいか。
利得を「うれしさ」を表現する指標を設定すればよい。リンゴ1個もらったときの「うれしさ」を1とする。2個もらったときのうれしさは2ではなく、1.5とか。この「うれしさ」を効用(utility)と呼ぶ。効用は必ずしも利得と比例関係にないが、利得が変化すれば効用も変化する。そういった対応関係をあらわすものを関数と呼び、利得を効用に変換する関数を効用関数(utility function)と呼ぶ。効用関数は次のような特徴を持っていると思われる。
このような特徴を持つ関数は右のように図示される。横軸のxが利得、縦軸のu(x)が効用を表している。リンゴ1個をもらったときのうれしさはu(1)、リンゴ2個をもらったときのうれしさはu(2)で表される。
1個目のうれしさはu(1)だが2個目のうれしさu(2)-u(1)は1個目のうれしさより小さい。
このように1個の価値がだんだん小さくなっていくことを限界効用逓減(げんかいこうようていげん:diminishing marginal utility)とよぶ。
さて、もしこれが「リンゴもらう」ではなく「リンゴを食べる」時の効用だったらどうだろう。リンゴ1個丸ごと食べるのはしんどいので一切れずつで考えてみよう。
- 一切れ目を食べたらうれしい。
- 二切れ目になるとうれしいけど一切れ目よりはうれしさは増えない。
- だんだん食べていくにつれて限界効用が逓減していくのだが、ある点で満腹になる。これ以上食べるとかえって気持ち悪くなる。
そんな状況を表した効用関数は右図のようになるだろう。
人はZの点で満腹になる。Aの区間にあるうちは食べていればうれしさは増える。Zを過ぎると、一口食べるごとに気持ち悪くなる。Yを通り過ぎると「最初から食べなきゃ良かった」という状況になる。Z以降は効用が下がっていくという点で効用逓減である。
もっとも、効用関数は人によっても、状況によっても異なる。記事冒頭で紹介した方のような場合は「食べれば食べるほど食欲が増す」のであるから、限界効用は逓増していく。グラフで書くと右のようになるだろう。
効用は他人と比較することはできない。
期待効用
さて、元の話に戻ろう。
私たちは「賭け」「ギャンブル」に直面したときの行動指針となる指標を検討していた。期待値、期待利得はそれなりに有効であるが、運よく何かを得られるとしても、「たくさんもらってうれしいとは限らない」。
そこで「効用」の期待値を求めてみよう。効用の期待値のことを期待効用(Expected utility)と呼ぶ。
利得 (リンゴの個数) |
効用 (うれしさ) |
1 | 1 |
2 | 1.41 |
3 | 1.73 |
4 | 2 |
この状況下で
を比較してみる。
状況 | 期待値 | 期待効用 |
リンゴ1個を確実にもらえる | 1 | 1 |
リンゴ2個を五分五分の確率でもらえる | 2×0.5 = 1 | 1.4×0.5 = 0.7 |
期待値では1,2の状況ともに1であり、どちらでも良いということになる。しかし、期待効用では1の状況のほうが高い価を得ることができる。
限界効用が逓減する効用関数を持つ場合、人は不確実なギャンブルより確実なオプションを選ぶ。このような状況をリスク回避(risk-averse)とよぶ。限界効用が逓増する場合はリスク志向(risk-seeking)になる。
サンクトペテルブルクのパラドックス再訪
さて、先に触れたサンクトペテルブルクのパラドックスに立ち戻ってみよう。
重要なのは適切な効用関数の設定である。お金はもらえばもらえるほどうれしい。しかし、単位が大きくなるにつれて1円のありがたみは減っていく。つまり限界効用は逓減する。他方お金はリンゴを食べるときのように満腹になるということはおそらくないだろう。だから効用が逓減することはない。
そんな特徴を持つ関数にu(x) = √xがある(前節のリンゴの効用関数もこれを用いている)。
利得 | 効用 | 生起確率 | 期待利得 | 期待効用 |
1 | 1 | 1/2 | 1/2 | 1/2 |
2 | √2 | 1/4 | 1/2 | √2/4 |
4 | 2 | 1/8 | 1/2 | 1/4 |
8 | 2√2 | 1/16 | 1/2 | √2/8 |
16 | 4 | 1/32 | 1/2 | 1/8 |
・・・ | ・・・ | ・・・ | ・・・ | |
合計 | ∞ | 1/(2-√2) ≒ 1.71 |
このような効用関数を持っていれば、期待効用は約1.71。この効用に見合う金額は2円ほどである。
かくしてサンクトペテルブルクのパラドックスは適当な効用関数を導入することで解決することができた。
なお、あなたはこの賭けで胴元になってはいけない。じゃんけんで負け続ければ払戻金は天文学的な数値となる。
おわりに
本記事では確率に支配された現象に対する意思決定を記述する基本的な概念を概観してきた。
期待効用は、期待利得と比較してより現実に近い指標であるといえる。中級以上のゲーム理論では期待効用を導入することによって選択肢AかBかという問題を「Aをpの確率で、Bを1-pの確率で」というように行動を確率的に記述することが可能になる(混合戦略)。
批判を越えて
効用関数の恣意性
たとえば効用関数の恣意性である。利得が具体的な単位で表されるのに対し、効用はあいまいな概念である。効用関数の設定は恣意的になりやすい。サンクトペテルブルクのパラドックスで導入したu(x) = √xという関数は恣意的である。限界効用が逓減する効用関数としてu(x) = logxを使ってもよい。どちらが「正しい」かは実験を通じて検証する問題であるが、人それぞれ、そして状況によって異なってくるはずである。
効用関数の可測性
実際「効用は数値として計測できるのか」という問いは経済学の抱える難問のひとつである。ノーベル経済学賞を受賞したJ・ヒックスは効用を数値として計測せず経済行動を説明する「無差別曲線」の理論を導入している。無差別曲線の導入により、経済学の諸分野では具体的な効用関数に依存しなくなっている。
フレーミングの問題
人口が600人の小集落でなぞの病気EFBが猛威を振るっている。医者であるあなたはAかBかの選択肢をとることができる。さてあなたはどちらの選択肢を選ぶだろうか。
選択肢 | 予想される結果 | |
状況1 | A | 200人が救われる。 |
B | 1/3の確率で600人が救われ、2/3の確率で誰も救われない。 | |
選択肢 | 予想される結果 | |
状況2 | A | 400人が死ぬ。 |
B | 1/3の確率で誰も死ぬことはないが、2/3の確率で600人が死ぬ。 |
状況1と状況2は同じである。が書き方が異なる。実験では、状況1ではAが選ばれる傾向が強く、状況2ではBが選ばれることが多い。問題の提示の仕方(フレーミング)によって人間の行動は変化する。期待効用ではこの問題は処理できない。現在では期待効用理論にを補完するプロスペクト理論(prospect theory)という理論枠組みが整備されつつある。
現実のあいまい性
より根源的な問題として、現実味がないという問題がある。現実では、生起確率や予想される結果が数値として表されることは少ない。確率は「大体」とか「たぶん」といった修飾語によって記述される。では「大体」や「たぶん」は確率何パーセントを意味するのだろうか。
また、現実の賭けではどんな結果になるのかさえはっきりと予想できないことも多い。「戦争を起こす」というような大規模な決定では勝率予想だけでなく、勝ち方・負け方によって「勝った結果」「負けた結果」も大きく変わってくるはずである。そうした複雑な成り行きについては最初の決定時点で想像することは不可能である。そういった意思決定はあいまい下の意思決定(decision-making under ambiguity)と呼ばれる。現段階でこうした状況を数理的に分析することは難しい。
われわれは現実では適当に意思決定をしているのかもしれない。では「どのように適当に決定しているのか」。現在では心理学的実験を基にした人間の意思決定メカニズムの研究が行われている。
関連動画
関連商品
関連項目
脚注
- 33
- 0pt