期待効用単語

2件

キタイコウヨウ

7.3千文字の記事

掲示板へ

記事編集

この記事は第134回のオススメ記事に選ばれました！
よりニコニコできるような記事に編集していきましょう。

斬ってみなければわからない。
斬ってみればわかる。

白玉楼　庭師兼剣術指南役

食べれば食べるほど食欲がわくものよ。

白玉楼　亭主

期待効用とは、効用の期待値である・・・といっても意味不明だと思うので、以下で（１）期待値、（２）期待効用の順に説明する。

はじめに

自分の行動が吉と出るか凶と出るかわからない。人生においてそんな状況に直面することは多い。そんな「賭け」「ギャンブル」に出ざるを得ない時、自分の行動がどれくらいの利益・損失をもたらすのかを予想しておく必要がある。運よく確率、結果についてはっきりしている場合^[1]、（以下で説明する）期待値、期待効用は行動の指針となり得る。

期待値・期待利得

確実・不確実と期待値

まずは、以下の状況を考えてみよう。

リンゴ１個もらえる
五分五分の確率でリンゴ１個もらえる

どっちがうれしいかと問われれば、１がうれしいはずである（リンゴ嫌いの人を除く）。１は確実にもらえるのに対して２は不確実（uncertain）である。

リンゴを１個ももらえない

これは、確実(ce rtain)である。

確実に何ももらえない３は論外だとして、「２より１のほうがまし」だということを数学的に表すには、取得できる確率を掛ければよい。通常確率はパーセントで書かれることが多いが、本来は0≦p≦1の値をとる。「確実にもらえる」ということは、確率１を掛ければよく、確実にもらえないということは確率０を掛ければよい。「五分五分」は50％。つまり0.5を掛ければよい。

1×1 = 1
1×0.5 = 0.5

となり、１のほうが数値が大きくなる。かくして1のほうが2よりも大きいので1が望ましいという結論になる。

このように、「結果として予想される事象」に「生起確率」を掛けたものを期待値（expected value）と呼ぶ。

うれしくないことにも応用できる。この場合ダメージを負の数として定義すればよい。

100円取られる
五分五分の確率で100円取られる

このような場合は

-100×1 = -100
-100×0.5 = -50

となり、2のほうが大きい。２のほうがましな状況だと判断できる。経済学や意思決定論などの分野で、不確実下の意思決定を理論化する際には、このような得られるもの（利得）、失うもの（損失）の期待値を計算する。利得、損失の期待値を期待利得（期待損失）とよぶ。数学的には期待利得は期待値と同じものである。

期待値・期待利得の性質

期待値は単位が同じならば足すことができる。

100円を50％の確率で、300円を10％の確率でもらえる→100×0.5 + 300×0.1 = 50+30 = 80円
勝敗の確率が五分五分の賭けで、勝ったら1000円もらえる、負けたら1000円払わされる→1000×0.5 + (-1000)×0.5 = 0

単位が違う場合は併記することになる。

リンゴ10個を10％の確率で、みかん4個を25％の確率でもらえる→リンゴとみかんを1個ずつ
花20個を50％の確率で、ゆめ30個を3分の1の確率でもらえる→花とゆめを10冊ずつ
栗10個を10%の確率で、栗鼠2匹を50％の確率でもらえる→エロいこと書いてあると思ったの。ばかなの。死ぬの。

たくさん試行して平均すればだいたいあってる。

賭けやギャンブルで一発で利得や損失を考えたとき、その賭けを1回やっただけでは期待値ちょうどになることはほぼない。しかし、何回も繰り返すと、平均的には期待値、期待利得に近づいていく（大数の法則）。

さいころの期待値は1×(1/6) + 2×(1/6) + 3×(1/6) + 4×(1/6) + 5×(1/6) + 6×(1/6) = 3.5

である。

実際さいころを振ると・・・（誰が1,000回も振るんだよ・・・excelに決まってるだろ。）

試行回数	平均値
1	4
10	3.2
20	3.8
50	3.7
100	3.52
200	3.58
500	3.526
1000	3.519

となり、期待値の3.5に近づいていくことがわかる。

もっとも、現実問題としては、試行を繰り返すことは出来ないという問題があるのだが・・・。

例）宝くじの期待値

簡単な練習問題として、宝くじの期待値を求めてみよう。

ここでは、いちばん簡単な年末ジャンボ宝くじを例にとる。2009年の年末ジャンボ宝くじ（第573回全国自治宝くじ）を7億枚販売した場合、当選金は以下のとおりである。１等は２億円が当選数７０本。前後賞５千万円が当選数１４０本、２等が１億円で１４０本、等。一番少額の７等は３００円で７０００万本当選がある。

等級	当選金（Ａ）	当選数（Ｂ）	当選確率（Ｃ）	期待値（Ｄ）
1等	¥200,000,000	70	0.0000001	20
1等の前後賞	¥50,000,000	140	0.0000002	10
1等の組違い賞	¥100,000	6,930	0.0000099	0.99
2等	¥100,000,000	140	0.0000002	20
3等	¥5,000,000	700	0.000001	5
4等	¥100,000	42,000	0.00006	6
5等	¥10,000	700,000	0.001	10
6等	¥3,000	7,000,000	0.01	30
7等	¥300	70,000,000	0.1	30
元気に2010年賞	¥1,000,000	7,000	0.00001	10
			合計（Ｅ）	141.99

期待値を求めるためには、まず各等級の当選確率（Ｃ）を求める。これは当選数（Ｂ）70を総数70,000,000で割ってやればよい。１等は７億本のうちの７０本が当選なので70÷700,000,000 = 0.0000001つまり、１０００万分の１である。

次に、２億円が当選確率１０００万分の１で当たる場合の期待値（Ｄ）を求める。これは当選金（Ａ）に先ほど求めた当選確率（Ｃ）をかけてやればよい。200,000,000×0.0000001 = 20。よって、宝くじが１等だけだった場合は２０円の期待値である。

宝くじは１等から７等まであるので、それぞれの期待値（Ｄ）を求め、合計（Ｅ）すれば、宝くじ１枚買った時の期待値が得られる。合計した結果は１４２円弱である。宝くじは１枚３００円である。期待値の考え方では、「３００円払った結果、平均すると１４２円が払い戻される」ということになる。

ギャンブル全体に言えることだが、期待値が購入金額を超えることはない。手数料、運営費などがあるためである。期待値の考えで行けば、ギャンブルは平均的には必ず損をするようにできている。計算上は宝くじ１枚を買うたびに１５８円を失っているといえる。もっとも、残りの１５８円を「捨てている」と思うか、「そのお金で夢（スリル？）を買っている」と思うかでその評価が変わってくるのだろう。

期待値でいいのか？－－サンクトペテルブルクのパラドックス

倍プッシュだ

天才ギャンブラー

こんなギャンブルを考えてみよう。

じゃんけんで勝ったら1円もらえる。負けたらゲームオーバー。
次もじゃんけんして、そこで勝ったら2円もらえる。負けたらゲームオーバー。
次もじゃんけん。勝ったら4円もらえる。負けたらゲ（ry
まだじゃんけん。勝ったら8円もらえる。負け(ry

このように、勝ち続ける限り掛け金が倍になっていくギャンブル。

そこで問題。あなたはこのギャンブルに参加料があった場合、いくら払うか？

まずは期待値を考えてみればよい。

1/2の確率で1円もらえる→1×(1/2) = 1/2
その1/2の確率（(1/2)×(1/2)=1/4）で2円もらえる→2×(1/2)×(1/2) = 1/2
さらにその1/2の確率（(1/2)×(1/2)×(1/2) = 1/8）で4円もらえる→4×(1/2)×(1/2)×(1/2) = 1/2
またさらにその1/2の確率（(1/2)×(1/2)×(1/2)×(1/2) = 1/16）で8円もらえる→8×(1/2)×(1/2)×(1/2)×(1/2) = 1/2
以下打ち止めがないので無限に続く・・・

すると期待値は1/2+1/2+1/2+1/2+1/2+1/2+・・・ = ∞となり、いくら払っても大丈夫ということになる。たとえば参加費が100億円でも参加するべきということである。これは直感に反するのではないか。

この問題を提示したのがダニエル・ベルヌーイ(1700-1782)である。彼がサンクトペテルブルクに住んでいたため、この問題はサンクトペテルブルクのパラドックス（St. Peter sburg paradox）と呼ばれる。

期待効用

効用

期待値、期待利得の話から少しはなれて、自分に以下のことを問いかけてみよう。

リンゴの話では、1個より10個、10個より100個のほうが良いとしてきた。しかし、たとえばリンゴ 1000個もらってうれしいか？

確かに悪い話ではないが、リンゴは腐る。一人暮らしをしていて腐敗させる前に消費するのは困難である。誰かに売りつければいいのかもしれないが、手間がかかる。リンゴ 1000個じゃなくて海老 1000匹だったらあちこち海老臭くなって大変である。

たとえばリンゴ10万個もらえるとしたら、倉庫代もかかるし、管理も大変だし、もらわないほうがましだ^[2]。

このように、取得できる利得と「うれしさ」というのは必ずしも比例しない。「過ぎたるはなお及ばざるが如し」である。

効用関数――効用・限界効用

ではどうすればいいか。

利得を「うれしさ」を表現する指標を設定すればよい。リンゴ1個もらったときの「うれしさ」を１とする。２個もらったときのうれしさは２ではなく、1.5とか。この「うれしさ」を効用(utility)と呼ぶ。効用は必ずしも利得と比例関係にないが、利得が変化すれば効用も変化する。そういった対応関係をあらわすものを関数と呼び、利得を効用に変換する関数を効用関数(utility function)と呼ぶ。効用関数は次のような特徴を持っていると思われる。

リンゴ１個もらったらうれしい。
リンゴ２個もらったら1個よりはうれしいけど、1個目と比べるとリンゴ1個の価値は小さい。
だんだん1個の価値が下がってくる。

このような特徴を持つ関数は右のように図示される。横軸のxが利得、縦軸のu(x)が効用を表している。リンゴ1個をもらったときのうれしさはu(1)、リンゴ2個をもらったときのうれしさはu(2)で表される。

1個目のうれしさはu(1)だが2個目のうれしさu(2)-u(1)は1個目のうれしさより小さい。

このように1個の価値がだんだん小さくなっていくことを限界効用逓減(げんかいこうようていげん：dimini shing mar ginal utility)とよぶ。

さて、もしこれが「リンゴもらう」ではなく「リンゴを食べる」時の効用だったらどうだろう。リンゴ1個丸ごと食べるのはしんどいので一切れずつで考えてみよう。

一切れ目を食べたらうれしい。
二切れ目になるとうれしいけど一切れ目よりはうれしさは増えない。
だんだん食べていくにつれて限界効用が逓減していくのだが、ある点で満腹になる。これ以上食べるとかえって気持ち悪くなる。

そんな状況を表した効用関数は右図のようになるだろう。

人はZの点で満腹になる。Aの区間にあるうちは食べていればうれしさは増える。Zを過ぎると、一口食べるごとに気持ち悪くなる。Yを通り過ぎると「最初から食べなきゃ良かった」という状況になる。Z以降は効用が下がっていくという点で効用逓減である。

もっとも、効用関数は人によっても、状況によっても異なる。記事冒頭で紹介した方のような場合は「食べれば食べるほど食欲が増す」のであるから、限界効用は逓増していく。グラフで書くと右のようになるだろう。

効用は他人と比較することはできない。

期待効用

さて、元の話に戻ろう。

私たちは「賭け」「ギャンブル」に直面したときの行動指針となる指標を検討していた。期待値、期待利得はそれなりに有効であるが、運よく何かを得られるとしても、「たくさんもらってうれしいとは限らない」。

そこで「効用」の期待値を求めてみよう。効用の期待値のことを期待効用(Expected utility)と呼ぶ。

まず限界効用が逓減していくような効用関数を設定してみる。

利得 (リンゴの個数)	効用 (うれしさ)
1	1
2	1.41
3	1.73
4	2

この状況下で

リンゴ1個を確実にもらえる場合
リンゴ2個を五分五分の確率でもらえる場合

を比較してみる。

状況	期待値	期待効用
リンゴ1個を確実にもらえる	1	1
リンゴ2個を五分五分の確率でもらえる	2×0.5 = 1	1.4×0.5 = 0.7

期待値では1,2の状況ともに1であり、どちらでも良いということになる。しかし、期待効用では1の状況のほうが高い価を得ることができる。

限界効用が逓減する効用関数を持つ場合、人は不確実なギャンブルより確実なオプションを選ぶ。このような状況をリスク回避(risk-ave rse)とよぶ。限界効用が逓増する場合はリスク志向(risk-seeking)になる。

サンクトペテルブルクのパラドックス再訪

さて、先に触れたサンクトペテルブルクのパラドックスに立ち戻ってみよう。

重要なのは適切な効用関数の設定である。お金はもらえばもらえるほどうれしい。しかし、単位が大きくなるにつれて1円のありがたみは減っていく。つまり限界効用は逓減する。他方お金はリンゴを食べるときのように満腹になるということはおそらくないだろう。だから効用が逓減することはない。

そんな特徴を持つ関数にu(x) = √xがある（前節のリンゴの効用関数もこれを用いている）。

利得	効用	生起確率	期待利得	期待効用
1	1	1/2	1/2	1/2
2	√2	1/4	1/2	√2/4
4	2	1/8	1/2	1/4
8	2√2	1/16	1/2	√2/8
16	4	1/32	1/2	1/8
	・・・	・・・	・・・	・・・
		合計	∞	1/(2-√2) ≒ 1.71

このような効用関数を持っていれば、期待効用は約1.71。この効用に見合う金額は2円ほどである。

かくしてサンクトペテルブルクのパラドックスは適当な効用関数を導入することで解決することができた。

なお、あなたはこの賭けで胴元になってはいけない。じゃんけんで負け続ければ払戻金は天文学的な数値となる。

おわりに

本記事では確率に支配された現象に対する意思決定を記述する基本的な概念を概観してきた。

期待効用は、期待利得と比較してより現実に近い指標であるといえる。中級以上のゲーム理論では期待効用を導入することによって選択肢AかBかという問題を「Aをpの確率で、Bを1-pの確率で」というように行動を確率的に記述することが可能になる（混合戦略）。

批判を越えて

ただし、期待効用という概念に対する批判も強い。

効用関数の恣意性

たとえば効用関数の恣意性である。利得が具体的な単位で表されるのに対し、効用はあいまいな概念である。効用関数の設定は恣意的になりやすい。サンクトペテルブルクのパラドックスで導入したu(x) = √xという関数は恣意的である。限界効用が逓減する効用関数としてu(x) = logxを使ってもよい。どちらが「正しい」かは実験を通じて検証する問題であるが、人それぞれ、そして状況によって異なってくるはずである。

効用関数の可測性

実際「効用は数値として計測できるのか」という問いは経済学の抱える難問のひとつである。ノーベル経済学賞を受賞したJ・ヒックスは効用を数値として計測せず経済行動を説明する「無差別曲線」の理論を導入している。無差別曲線の導入により、経済学の諸分野では具体的な効用関数に依存しなくなっている。

フレーミングの問題

人口が600人の小集落でなぞの病気 EFBが猛威を振るっている。医者であるあなたはAかBかの選択肢をとることができる。さてあなたはどちらの選択肢を選ぶだろうか。

	選択肢	予想される結果
状況１	A	２００人が救われる。
状況１	B	１／３の確率で６００人が救われ、２／３の確率で誰も救われない。
	選択肢	予想される結果
状況2	A	４００人が死ぬ。
状況2	B	１／３の確率で誰も死ぬことはないが、２／３の確率で６００人が死ぬ。

状況1と状況2は同じである。が書き方が異なる。実験では、状況1ではAが選ばれる傾向が強く、状況2ではBが選ばれることが多い。問題の提示の仕方（フレーミング）によって人間の行動は変化する。期待効用ではこの問題は処理できない。現在では期待効用理論にを補完するプロスペクト理論（pro spect theory）という理論枠組みが整備されつつある。

現実のあいまい性

より根源的な問題として、現実味がないという問題がある。現実では、生起確率や予想される結果が数値として表されることは少ない。確率は「大体」とか「たぶん」といった修飾語によって記述される。では「大体」や「たぶん」は確率何パーセントを意味するのだろうか。

また、現実の賭けではどんな結果になるのかさえはっきりと予想できないことも多い。「戦争を起こす」というような大規模な決定では勝率予想だけでなく、勝ち方・負け方によって「勝った結果」「負けた結果」も大きく変わってくるはずである。そうした複雑な成り行きについては最初の決定時点で想像することは不可能である。そういった意思決定はあいまい下の意思決定（dec is ion-maki ng under ambig uity）と呼ばれる。現段階でこうした状況を数理的に分析することは難しい。

われわれは現実では適当に意思決定をしているのかもしれない。では「どのように適当に決定しているのか」。現在では心理学的実験を基にした人間の意思決定メカニズムの研究が行われている。

脚注

*結論部で述べるとおり、生起確率や結果が数値的に分かっている事例は少ない。
*リンゴ農家の方をdisってっるわけじゃないです。あくまで例として・・・。

ページ番号: 4231930
初版作成日: 09/12/14 09:33

リビジョン番号: 1033381
最終更新日: 11/01/08 11:39

編集内容についての説明/コメント:

誤字訂正しました！thnx!

記事編集編集履歴を閲覧

キーワード「期待効用」でニコニコ動画を検索

タグ「期待効用」でニコニコ動画を検索

ニコニ広告で宣伝された記事

まちカドまぞく (単) 記事と一緒に動画もおすすめ！

提供：まどもあぜる☆まりぃ

53842500pt

この記事の掲示板に最近描かれたお絵カキコ

お絵カキコがありません

この記事の掲示板に最近投稿されたピコカキコ

ピコカキコがありません

期待効用

期待効用の記事へ戻る

11 ななしのよっしん非表示 2011/01/10(月) 18:15:09 ID: QXs8pHnqzZ レスを非表示にする レスを表示する IDを非表示にする IDの書き込みを表示: 関連になるかどうか分からないけど
「埋没費用」こんな記事もあった; 👍
高評価

0
👎
低評価

0
12 ななしのよっしん非表示 2011/09/29(木) 21:28:47 ID: yonYdihiEr レスを非表示にする レスを表示する IDを非表示にする IDの書き込みを表示: 謎の病気 EFBって何かと思ったらエターナルフォースブリザードかよｗｗ; 👍
高評価

0
👎
低評価

0
13 ななしのよっしん非表示 2011/10/07(金) 23:51:41 ID: 8N6mnRvDUw レスを非表示にする レスを表示する IDを非表示にする IDの書き込みを表示: たまに真面目な考察記事があるから面白いよな; 👍
高評価

0
👎
低評価

0
14 ななしのよっしん非表示 2012/11/10(土) 04:29:18 ID: 08r31l0Y7v レスを非表示にする レスを表示する IDを非表示にする IDの書き込みを表示: サンクトペテルブルクのパラドックスのところ、このギャンブルだと
賞金が1円になるのは1回目勝って2回目負けたときだから確率1/4じゃないかと。; 👍
高評価

0
👎
低評価

0
15 ななしのよっしん非表示 2013/02/08(金) 18:31:39 ID: /c5BRFmQSt レスを非表示にする レスを表示する IDを非表示にする IDの書き込みを表示: 栗と栗鼠・・・; 👍
高評価

0
👎
低評価

0
16 ななしのよっしん非表示 2014/05/25(日) 19:30:35 ID: /BUoVaKlFL レスを非表示にする レスを表示する IDを非表示にする IDの書き込みを表示: 凄くわかりやすい記事で助かる

けど、細かいこと言うようだけど、じゃんけんだと勝つ確率は1/2じゃなくて1/3だから、
コイントスとかにした方がいいかも; 👍
高評価

0
👎
低評価

0
17 ななしのよっしん非表示 2016/02/06(土) 13:07:51 ID: 5K1xx0aydU レスを非表示にする レスを表示する IDを非表示にする IDの書き込みを表示: >>16
普通のじゃんけんはあいこで止めないだろ; 👍
高評価

0
👎
低評価

0
18 ななしのよっしん非表示 2017/05/03(水) 05:50:54 ID: KRg1gbT1AI レスを非表示にする レスを表示する IDを非表示にする IDの書き込みを表示: 負の効用の例（宝くじの逆）として、生命保険を入れてもいい気がする。
時々ある保険無駄論って、だいたい期待値だけみて損得判断してる気がするから。; 👍
高評価

0
👎
低評価

0
19 ななしのよっしん非表示 2017/12/21(木) 02:31:29 ID: mkwOiqp/A8 レスを非表示にする レスを表示する IDを非表示にする IDの書き込みを表示: このような効用関数を持っていれば、期待効用は約1.71。この効用に見合う金額は2円ほどである。

効用＝√金額なら
金額＝効用^2じゃないの？何で2円になんのかさっぱりわかんね。; 👍
高評価

0
👎
低評価

0
20 ななしのよっしん非表示 2018/07/26(木) 21:07:17 ID: QKLmn5xr7B レスを非表示にする レスを表示する IDを非表示にする IDの書き込みを表示: >>19
今の記事の書き方だと分かりにくいけれど、1.71くらいというのはこのギャンブル（サンクトペテルブルクのパラドックスで想定されているもの）でのトータルの期待効用。貴方が言っているのは特定の利得xに対する効用が√xということ。

要は、このギャンブルに参加したら、だいたい1.71円分の「うれしさ」が手に入るだろうということ。だから、2円くらいならまだ払ってもいいかな、という結論になるわけです。; 👍
高評価

0
👎
低評価

0

期待効用の記事へ戻る

期待効用単語

はじめに