ゲーム理論とは、合理的・戦略的意思決定を記述する理論である。
フォン・ノイマンとモルゲンシュテルンの二人によって提唱され、ナッシュが数学的基礎を精緻化した。現在の経済学の基礎となっていると同時に、経営学、政治学、社会学、生物学、など様々な分野で応用されている。
最も単純な二人同時手番ゲームには囚人のジレンマ、チキンゲーム、恋人ゲーム(Battle of Sexes)など有名なゲームがあり、社会の一側面を切り出すことに成功している。
ゲーム理論は数学的に定式化された一つの公理系である。アクター、選択肢、利得が定義される。
便宜性を図るため、以下個々の選択を[アクターAの選択,アクターBの選択]、個々の利得を(アクターAの利得、アクターBの利得)と記述することにする。
最も初等的なものとして二人が同時に2つの選択肢から選ぶという状況を考えてみる(同時手番ゲーム。静学ゲームとも言われる)。
よく知られている「囚人のジレンマ」を取り上げてみよう(より簡潔な解説は囚人のジレンマを参照)。
さて、この状況下ではAには{自白,黙秘}、Bにも{自白,黙秘}の2つの選択肢が与えられている。2×2で合計4通りの結果が与えられる。[自白,自白]、[自白,黙秘]、[黙秘,自白]、[黙秘,黙秘]の4つの結果が存在しうる。それぞれの結果について各アクターはどれが望ましいかを順序付けて考える(序数的効用)。もっとも望ましいものに4を、もっとも望ましくないものに1をつける。
効用は刑期が短ければ短いほど良いので、Aにとってみれば[自白,黙秘]がもっとも望ましい。しかしこれはBにとってみれば4つの中で最悪である。この効用を(4,1)と記述する(4はAの効用,1はBの効用)。[黙秘,黙秘]は互いにとって2番目に望ましい。よって(3,3)が与えられる。[自白,自白]は両者にとって3番目に望ましい。よって(2,2)。最後に[黙秘,自白]はAにとって最も避けるべき状況であるが、Bにとってはもっとも望ましい。よって(1,4)となる。
これを表にすると以下のようになる。
囚人B |
|||
自白 |
黙秘 |
||
囚人A |
自白 |
(2,2) |
(4,1) |
黙秘 |
(1,4) |
(3,3) |
さて、囚人Aはどのような意思決定を行うだろうか。
まずAはBの取りうる選択をひとつづつ比較する。たとえばBが自白すると仮定しよう。Aが見るべきポイントは上の表のうちの以下の部分である。
|
囚人B |
|
自白 |
||
囚人A |
自白 |
(2,2) |
黙秘 |
(1,4) |
このとき、Aは自白すればいいか、黙秘すればいいか。
比べるべき数字はAにとってどちらが望ましいかであるから左側の数字、つまり2、1である。各アクターは効用が大きいものを選ぶので2、つまり自白を選んだ方がいい。2に下線を付けておく。
次に囚人Bが黙秘すると仮定してみよう。
|
囚人B |
|
黙秘 |
||
囚人A |
自白 |
(4,1) |
黙秘 |
(3,3) |
Aは4と3を比較して4を選ぶ。
次にBの選択を考えてみる。BにとってみればAがどのような対応をするか仮定して、それぞれの結果について意思決定すればよい。
まずはAが自白したと考えよう。
囚人B |
|||
自白 |
黙秘 |
||
囚人A |
自白 |
(2,2) |
(4,1) |
今度はBにとっての利得を考えるので、右側の数字、2と1を比較する。自白の方が効用が高い。
次にAが黙秘したと考えよう。
囚人B |
|||
自白 |
黙秘 |
||
囚人A |
黙秘 |
(1,4) |
(3,3) |
右側の数字4,3を比較して大きい効用を与えてくれる自白を選ぶ。
さて、以上をまとめると以下のようになる。
囚人B |
|||
自白 |
黙秘 |
||
囚人A |
自白 |
(2,2) |
(4,1) |
黙秘 |
(1,4) |
(3,3) |
上の表で赤字下線を引いたところは、相手の選択ごとに自分が取るべき最適な選択を示したものである。この例では両者が互いに最適な選択をしている結果が一つだけ存在しており、[自白,自白]である。このように相手の対応を仮定して最適な対応をした場合に安定的な結果が得られることがある。この状態をナッシュ均衡と呼ぶ。ナッシュ均衡は個々人が冷徹に合理的に判断した時の結果である。
なお、囚人のジレンマではAにとってみれば、Bが自白しようが黙秘しようが自白を選んだ方が得である。Bにとってみても、Aが自白しようが黙秘しようが自白したほうが得である。このように相手がどのような選択肢を選んでも自分の取るべき選択(これを戦略とよぶ)が決まっているときに、その選択を支配戦略とよぶ。囚人のジレンマでは両者に支配戦略が存在する。互いに支配戦略を取り合った結果も[自白,自白]である。
さて、ナッシュ均衡はA、Bにとって望ましいのだろうか。[黙秘,黙秘]を考えてみよう。この場合[自白,自白]と比較してA、Bの効用がより高い。全体で見たときに、たがいに黙秘すればより望ましい結果が得られる。しかも相手に迷惑をかけることはない。このように相手に迷惑をかけずに自分の利得を高めることをパレート的改善と呼ぶ。パレート的改善が不可能な場合をパレート最適解と呼ぶ。囚人のジレンマでは[自白,黙秘]、[黙秘,黙秘]、[黙秘,自白]がパレート最適解である(ここ注意。[自白,黙秘]もパレート最適解である。もしかりにそうなった場合、他の結果への移動は必ずBの効用(4)を下げることになる。つまりパレート的改善が得られない。よって[自白、黙秘]もパレート最適解である)。パレート最適解は社会として望ましいもの[1]であるが、ナッシュ均衡ではない場合現実として実現が難しい。
これを先のような利得表に表すと以下のようになる。
B |
|||
譲る |
譲らない |
||
A |
譲る |
(3,3) |
(2,4) |
譲らない |
(4,2) |
(1,1) |
先と同様の方法で考えてみた結果は以下のとおりである。
B |
|||
譲る |
譲らない |
||
A |
譲る |
(3,3) |
(2,4) |
譲らない |
(4,2) |
(1,1) |
このゲームには支配戦略は存在しない。つまり相手の行動によって自分の行動を決めなければならない。
そして[譲らない,譲る]と[譲る,譲らない]の2つの結果がナッシュ均衡である。「相手が譲るなら自分は譲らない」「相手が譲らないなら自分は譲るしかない」という状況である。国際的危機の状況で相手に譲歩を促すことを「瀬戸際政策」と呼ぶが、この状況はこのチキンゲームで近似される。
Aにとっては[譲らない,譲る]の結果の方が望ましいのだが、どうしたらいいだろうか?
答えはBに「Aはハンドルを切らないだろう」と確信させればよい。たとえばハンドルを取り外してBに見える形で投げ捨てればよい。Bはそれを見て、「ああ、Aは道を譲ることはないのだ」とあきらめる。
または、Bに「Aは狂っているので何をするのかわからない」と不安にさせればよい。脅しが通じない相手ならこちらが譲歩するしかない。
要は自分が「話の通じる相手」ではないことを知らせればよいのである。
|
(4,3) |
(2,2) |
|
(1,1) |
(3,4) |
チキンゲームと同様のナッシュ均衡が得られた。しかし、それぞれがパレート最適解であり、チキンゲームより満足度は高い。これは新日暮里、二丁目のどちらに行っても二人一緒であれば歪みねぇということである。
ただし、これを繰り返した場合、相手に対する不満が高まる。こうした摩擦を防ぐためには新日暮里と新宿二丁目を交互に利用することが望ましいとされる。[2]
これまではアクターが同時に意思決定する場合を考えてきた。だが、意思決定には順番が存在する場合もある。どちらかが先手で、どちらかが後手であるといった場合である。意思決定に時系列を取り入れた分析を動学ゲームと呼ぶ。
動学ゲームはこれまで見てきたような表(これを標準型・戦略型と呼ぶ)では分析が難しい。代わりに樹形図(ツリー。ゲームの木)を書いて分析していく(これを展開型と呼ぶ)。
通常順序の早いものを左に、遅いものを右に書くが、必ずしもすべてに当てはまるわけではない。
さて、もしチキンゲームに順番があったらどうだろうか。まずAが道を譲るか譲らないかを決定し、実行する。次にBが道を譲るか譲らないかを決定し、実行する。こんな状況下でA、Bはそれぞれどのような決定を行ったらいいのだろうか。
ゲームの木は以下のように書ける。
┌譲る───(3,3)
┌譲る─── B┤
│ └譲らない─(2,4)
A ┤
│ ┌譲る───(4,2)
└譲らない─ B┤
└譲らない─(1,1)
以前と同様、()内は(Aの利得とBの利得)を表している。
さて、意思決定に順番がある場合には、最後から逆算していく。上の図はAが道を譲った場合にBが行うゲーム(上の図の上方に描かれている)と、Aが道を譲らなかった場合にBが行うゲーム(上の図の下方に描かれている)の2つが存在する。まずは「上のゲーム」を取り出してみよう。
┌譲る───(3,3)
┌譲る─── B┤
│ └譲らない─(2,4)
最終的な意思決定を行うのはBである。Bの気持ちになって道を{譲る,譲らない}を決定してみよう。
Bの利得は右側に書かれている。Bとしては3より4が大きいので「譲らない」が望ましい。よってここまで来た時にBが「譲る」とは考えられない。以上から以下のように示すことができる。
┌譲る───(3,3)
┌譲る─── B┫
│ ┗譲らない━(2,4)
│ ┌譲る───(4,2)
└譲らない─ B┤
└譲らない─(1,1)
Bとしては2と1を比較することになる。どちらも望ましくはないのだが、少しでもましな2(譲る)を選ぶことになる。
│ ┏譲る━━━(4,2)
└譲らない─ B┫
└譲らない─(1,1)
このようにゲームの木の中に小さなゲームが存在すると考えることができる。小さなゲームのことをサブゲームと呼ぶ。
さて元のツリーに戻ってみよう。
┌譲る───(3,3)
┌譲る─── B┫
│ ┗譲らない━(2,4)
A ┤
│ ┏譲る━━━(4,2)
└譲らない─ B┫
└譲らない─(1,1)
Aがとりうる選択肢ごとにBのとる行動を予測できる。Aが道を譲ればBは譲らない。Aが道を譲らなければBが道を譲らざるを得ない。
この状況が予想されたとき、Aはどういう意思決定を行えばいいか。
答えは簡単である。残っている選択肢[譲る,譲らない]と[譲らない,譲る]のうち、Aにとって利得が高いものを選べばよい。Aの利得はそれぞれ2と4である。よって4の利得をもたらしてくれる「譲らない」の選択をすればよい。
┌譲る───(3,3)
┌譲る─── B┫
│ ┗譲らない━(2,4)
A ┫
┃ ┏譲る━━━(4,2)
┗譲らない━ B┫
└譲らない─(1,1)
よってこのゲームではAがハンドルを切らずに突進、Bがハンドルを切って道を譲るという結果になる。チキンゲームは先手必勝のゲームである。
以上のように順番のあるゲームでは未来から逆算して判断をすればよい。この方法は後ろ向き帰納法と呼ばれる。後ろ向き帰納法によって得られる均衡は、各サブゲームの解を総合判断したものであるためサブゲーム・パーフェクト均衡と呼ばれる。
サブゲーム・パーフェクト均衡を、以前の同時手番の場合と比較してみよう。同時手番の時には答え(ナッシュ均衡)が2つ存在した。今回の交代手番のときにはそのうちのひとつだけが答えとなった。一般にサブゲーム・パーフェクト均衡はナッシュ均衡に含まれる。
ビリーとカズヤのハッテン場レスリング場をめぐる争いでも同様の分析を行うことができる。
ビリーが最初に決定を下すとしよう。ゲイムの木は以下のように書ける。
┌新日暮里──(4,3)
┌新日暮里──カズヤ┤
│ └新宿二丁目─(2,2)
ビリー┤
│ ┌新日暮里──(1,1)
└新宿二丁目─カズヤ┤
└新宿二丁目─(3,4)
それぞれカズヤの『さぶ』ゲイム[3]を考えると以下のようになる。
┏新日暮里━━(4,3)
┌新日暮里──カズヤ┫
│ └新宿二丁目─(2,2)
そして
│ ┌新日暮里──(1,1)
└新宿二丁目─カズヤ┫
┗新宿二丁目━(3,4)
これを考慮して、ビリーは新日暮里を選ぶ。(4と3では4の方が利得が高い。)
┏新日暮里━━(4,3)
┏新日暮里━━カズヤ┫
┃ └新宿二丁目─(2,2)
ビリー┫
│ ┌新日暮里──(1,1)
└新宿二丁目─カズヤ┤
└新宿二丁目─(3,4)
『さぶ』ゲイム♂パーフェクト均衡は[新日暮里,新日暮里]であり、戦い♂は新日暮里で無事行われる。歪みねぇな。
ただし、これらの分析では、カズヤが決断を下す前にビリーの決断と結果が明らかになっていなければならない。たとえ意思決定の順番に前後関係があったとしても、相手が結果を知らなければ同時に意思決定しているのと同じである。もしカズヤがビリーの決定を知らなかったらどうなるか。
┌新日暮里──(4,3)
┌新日暮里──カズヤ┤
│ ┊ └新宿二丁目─(2,2)
ビリー┤ ┊
│ ┊ ┌新日暮里──(1,1)
└新宿二丁目─カズヤ┤
└新宿二丁目─(3,4)
『さぶ』ゲイムのカズヤはビリーの決定を知ることができず、ビリーもカズヤの行動を予想できない(二人のカズヤの見分けがつかないという意味で両者は点線で結んである)。このように、意思決定する段階において、自分がどこにいるのかわからないゲームを不完全情報ゲームと呼ぶ。不完全情報ゲームは後ろ掘り♂帰納法だけでは解けない。この例ではビリーもカズヤも新日暮里に行くべきか新宿二丁目に行くべきか判断できず、だらしねぇ結果に終わることになる。
いくつかの前提を置くことによって解ける場合もあるが、やや高度なのでこの記事では割愛する。仕方ないね。
最後に囚人のジレンマが交代手番になったらどうなるだろうか。
┌自白─(2,2)
┌自白─囚人B ┤
│ └黙秘─(4,1)
囚人A ┤
│ ┌自白─(1,4)
└黙秘─囚人B ┤
└黙秘─(3,3)
┏自白━(2,2)
┏自白━囚人B ┫
┃ └黙秘─(4,1)
囚人A ┫
│ ┌自白─(1,4)
└黙秘─囚人B ┤
└黙秘─(3,3)
[自白,自白]。同時手番の時と同様の結果が得られる。残念ながら囚人のジレンマは手番に順序をづけただけでは解決することができない。しかし、現実社会では必ずしも裏切りあいが続いているわけではない。人間は「非合理的な動物」なのだろうか?
現在では囚人のジレンマを複数回繰り返したり、3人以上のアクターで行ったりして、その理論予測を修正する試みも行われている。
以上ごく初等的なゲーム理論を紹介してきた。
実際のゲーム理論で扱われているものは、本記事で扱っているものよりはるかに複雑である。たとえば相手の利得がわからない時も想定している(不完備情報ゲーム。不完全情報ゲームと似ているので注意)。そのような事例では、相手の利得構造を明らかにしながらゲームを進めていかなければならない(ベイジアン均衡)。
また、アクターに繰り返しゲームをさせたり、多数のアクターを同時にゲームに参加させた場合の理論も整備されている。
このほかにもアクターの協力行動を前提とする協力ゲームも存在する。
より詳しくはウィキペディアや本を参照されたい。
他方、ゲーム理論の前提とする戦略的・合理的意思決定が、人間の通常の行動を記述するのに強すぎる仮定ではないかという批判もある。人間は利得ばかりを追い求めているのではなく、ルールの順守やモラルといったものを上位においている場合もある。また「何も考えずに」「適当に」行動する場合もある。そういった行動に対してもゲーム理論は説明を試みているが(規範をゲームの解として定式化し理解する)、現実を十分説明できていないという批判もある。
より現実に近い理論を求めて、現在では心理学と共同で実験が行われており、人間行動をより正確に記述するゲーム理論(行動学的ゲーム理論)も開発されつつある。
さまざまな批判を取り込みながらゲーム理論はますます精緻化、ハッテン発展している。ゲーム理論は今後も社会科学の基礎として人間行動を説明、記述する理論であり続けるだろう。
掲示板
提供: You
提供: ニコニコ生太郎
提供: スージー・デ=シコルスキ
提供: 本ゆとす
提供: すずくろ
急上昇ワード改
最終更新:2025/03/22(土) 13:00
最終更新:2025/03/22(土) 13:00
ウォッチリストに追加しました!
すでにウォッチリストに
入っています。
追加に失敗しました。
ほめた!
ほめるを取消しました。
ほめるに失敗しました。
ほめるの取消しに失敗しました。