ゲーム理論単語

416件

ゲームリロン

8.0千文字の記事

掲示板へ

記事編集

ゲーム理論とは、合理的・戦略的意思決定を記述する理論である。

概要

フォン・ノイマンとモルゲンシュテルンの二人によって提唱され、ナッシュが数学的基礎を精緻化した。現在の経済学の基礎となっていると同時に、経営学、政治学、社会学、生物学、など様々な分野で応用されている。

最も単純な二人同時手番ゲームには囚人のジレンマ、チキンゲーム、恋人ゲーム（Battle of Sexes）など有名なゲームがあり、社会の一側面を切り出すことに成功している。

アクター・選択肢・利得

ゲーム理論は数学的に定式化された一つの公理系である。アクター、選択肢、利得が定義される。

アクター（またはプレーヤー）: ゲームには通常二人以上のアクターが参加する。

選択肢（戦略）: 各アクターはそれぞれ選択肢を持っている。それぞれが２つの選択肢を持つこともあるし、じゃんけんのように３つを持つ時もある。無限個の連続した値のどれかを取ることも可能である。

利得（効用）: アクターがそれぞれの選択を行うと何らかの利得を得ることができる。初等的なゲーム理論ではどのような利得が得られるかあらかじめ明らかであり、さらに相手が得る利得も明らかになっていることが多い。利得には少なくとも大小の関係が与えられており、利得が大きいほどそのアクターにとって望ましい結果となる。ただしアクターAにとって望ましいものがアクターBにとって望ましいとは限らない。

便宜性を図るため、以下個々の選択を[アクターAの選択，アクターBの選択]、個々の利得を（アクターAの利得、アクターBの利得）と記述することにする。

二人同時手番ゲーム（ナッシュ均衡）

最も初等的なものとして二人が同時に２つの選択肢から選ぶという状況を考えてみる（同時手番ゲーム。静学ゲームとも言われる）。

よく知られている「囚人のジレンマ」を取り上げてみよう（より簡潔な解説は囚人のジレンマを参照）。

AとBは共謀してとある軽犯罪を犯したかどで収監された（アクターは囚人Aと囚人B）。しかし彼らにはより重大な殺人事件の容疑がかかっている。
取調官はそれぞれ独立した取調室でAB両者間に一切のコミュニケーション手段を与えず別々に取り調べを行う。
取調官はそれぞれ「相方の罪を告白すれば刑期を短くしてやる」と提案する。
二人とも黙秘すれば軽犯罪のみで刑期は２年ずつである。
二人とも自白すれば殺人事件の共犯で刑期は１０年ずつである。
片方が自白して片方が黙秘すれば、自白したほうは司法取引により刑期は１年、黙秘したほうは刑期が２０年となる。

さて、この状況下ではAには｛自白，黙秘｝、Bにも｛自白，黙秘｝の２つの選択肢が与えられている。２×２で合計４通りの結果が与えられる。[自白，自白]、[自白，黙秘]、[黙秘，自白]、[黙秘，黙秘]の４つの結果が存在しうる。それぞれの結果について各アクターはどれが望ましいかを順序付けて考える（序数的効用）。もっとも望ましいものに４を、もっとも望ましくないものに１をつける。

効用は刑期が短ければ短いほど良いので、Aにとってみれば[自白，黙秘]がもっとも望ましい。しかしこれはBにとってみれば４つの中で最悪である。この効用を（４，１）と記述する（４はAの効用，１はBの効用）。[黙秘，黙秘]は互いにとって２番目に望ましい。よって（３，３）が与えられる。[自白，自白]は両者にとって３番目に望ましい。よって（２，２）。最後に[黙秘，自白]はAにとって最も避けるべき状況であるが、Bにとってはもっとも望ましい。よって（１，４）となる。

これを表にすると以下のようになる。

		囚人B
		自白	黙秘
囚人A	自白	（２，２）	（４，１）
囚人A	黙秘	（１，４）	（３，３）

Aの選択

さて、囚人Aはどのような意思決定を行うだろうか。

まずAはBの取りうる選択をひとつづつ比較する。たとえばBが自白すると仮定しよう。Aが見るべきポイントは上の表のうちの以下の部分である。

		囚人B
		自白
囚人A	自白	（２，２）
囚人A	黙秘	（１，４）

このとき、Aは自白すればいいか、黙秘すればいいか。

比べるべき数字はAにとってどちらが望ましいかであるから左側の数字、つまり２、１である。各アクターは効用が大きいものを選ぶので２、つまり自白を選んだ方がいい。２に下線を付けておく。

次に囚人Bが黙秘すると仮定してみよう。

		囚人B
		黙秘
囚人A	自白	（４，１）
囚人A	黙秘	（３，３）

Aは４と３を比較して４を選ぶ。

Bの選択

次にBの選択を考えてみる。BにとってみればAがどのような対応をするか仮定して、それぞれの結果について意思決定すればよい。

まずはAが自白したと考えよう。

		囚人B
		自白	黙秘
囚人A	自白	（２，２）	（４，１）

今度はBにとっての利得を考えるので、右側の数字、２と１を比較する。自白の方が効用が高い。

次にAが黙秘したと考えよう。

		囚人B
		自白	黙秘
囚人A	黙秘	（１，４）	（３，３）

右側の数字４，３を比較して大きい効用を与えてくれる自白を選ぶ。

ナッシュ均衡・支配戦略・パレート最適解

さて、以上をまとめると以下のようになる。

		囚人B
		自白	黙秘
囚人A	自白	（２，２）	（４，１）
囚人A	黙秘	（１，４）	（３，３）

上の表で赤字下線を引いたところは、相手の選択ごとに自分が取るべき最適な選択を示したものである。この例では両者が互いに最適な選択をしている結果が一つだけ存在しており、[自白，自白]である。このように相手の対応を仮定して最適な対応をした場合に安定的な結果が得られることがある。この状態をナッシュ均衡と呼ぶ。ナッシュ均衡は個々人が冷徹に合理的に判断した時の結果である。

なお、囚人のジレンマではAにとってみれば、Bが自白しようが黙秘しようが自白を選んだ方が得である。Bにとってみても、Aが自白しようが黙秘しようが自白したほうが得である。このように相手がどのような選択肢を選んでも自分の取るべき選択（これを戦略とよぶ）が決まっているときに、その選択を支配戦略とよぶ。囚人のジレンマでは両者に支配戦略が存在する。互いに支配戦略を取り合った結果も[自白，自白]である。

支配戦略解はナッシュ均衡であるが、逆は必ずしも真ではない。

さて、ナッシュ均衡はA、Bにとって望ましいのだろうか。[黙秘，黙秘]を考えてみよう。この場合[自白，自白]と比較してA、Bの効用がより高い。全体で見たときに、たがいに黙秘すればより望ましい結果が得られる。しかも相手に迷惑をかけることはない。このように相手に迷惑をかけずに自分の利得を高めることをパレート的改善と呼ぶ。パレート的改善が不可能な場合をパレート最適解と呼ぶ。囚人のジレンマでは[自白，黙秘]、[黙秘，黙秘]、[黙秘，自白]がパレート最適解である（ここ注意。[自白，黙秘]もパレート最適解である。もしかりにそうなった場合、他の結果への移動は必ずBの効用（４）を下げることになる。つまりパレート的改善が得られない。よって[自白、黙秘]もパレート最適解である）。パレート最適解は社会として望ましいもの^[1]であるが、ナッシュ均衡ではない場合現実として実現が難しい。

チキンゲーム

A、Bの車が２００ｍ離れて向かい合っている。道は３車線あり、両方の車は真ん中の車線にいる。
スタートの合図とともに高速で相手の車に向かって走り出す。
そのまま走って行けば正面衝突するのであるが、ハンドルを右に切って道を譲ることは許されている。
相手が道を譲ってくれれば自分は譲らずに真ん中の車線を走ることができ、「勇気あるもの」とたたえられる。相手は弱虫扱いされる。
双方が道を譲らなければ正面衝突して死亡する。
両方が道を譲れば両方が生き残れるが両方とも弱虫扱いされる。

これを先のような利得表に表すと以下のようになる。

		B
		譲る	譲らない
A	譲る	（３，３）	（２，４）
A	譲らない	（４，２）	（１，１）

先と同様の方法で考えてみた結果は以下のとおりである。

		B
		譲る	譲らない
A	譲る	（３，３）	（２，４）
A	譲らない	（４，２）	（１，１）

このゲームには支配戦略は存在しない。つまり相手の行動によって自分の行動を決めなければならない。

そして[譲らない，譲る]と[譲る，譲らない]の２つの結果がナッシュ均衡である。「相手が譲るなら自分は譲らない」「相手が譲らないなら自分は譲るしかない」という状況である。国際的危機の状況で相手に譲歩を促すことを「瀬戸際政策」と呼ぶが、この状況はこのチキンゲームで近似される。

Aにとっては[譲らない，譲る]の結果の方が望ましいのだが、どうしたらいいだろうか？

答えはBに「Aはハンドルを切らないだろう」と確信させればよい。たとえばハンドルを取り外してBに見える形で投げ捨てればよい。Bはそれを見て、「ああ、Aは道を譲ることはないのだ」とあきらめる。

または、Bに「Aは狂っているので何をするのかわからない」と不安にさせればよい。脅しが通じない相手ならこちらが譲歩するしかない。

要は自分が「話の通じる相手」ではないことを知らせればよいのである。

恋人ゲーム（ゲイ夢理論♂）

ビリーとカズヤはデートレスリングの約束をしていた。
行先は新日暮里か新宿二丁目である。
ビリーは新日暮里がいいと思っていたがカズヤは二丁目に行きたがっていた。
デートレスリングなので二人が一緒の場所に行くことが断然望ましい。

		カズヤ
		新日暮里	新宿二丁目
ビリー	新日暮里	（４，３）	（２，２）
ビリー	新宿二丁目	（１，１）	（３，４）

チキンゲームと同様のナッシュ均衡が得られた。しかし、それぞれがパレート最適解であり、チキンゲームより満足度は高い。これは新日暮里、二丁目のどちらに行っても二人一緒であれば歪みねぇということである。

ただし、これを繰り返した場合、相手に対する不満が高まる。こうした摩擦を防ぐためには新日暮里と新宿二丁目を交互に利用することが望ましいとされる。^[2]

二人交代ゲーム（サブゲーム・パーフェクト均衡）

これまではアクターが同時に意思決定する場合を考えてきた。だが、意思決定には順番が存在する場合もある。どちらかが先手で、どちらかが後手であるといった場合である。意思決定に時系列を取り入れた分析を動学ゲームと呼ぶ。

動学ゲームはこれまで見てきたような表（これを標準型・戦略型と呼ぶ）では分析が難しい。代わりに樹形図（ツリー。ゲームの木）を書いて分析していく（これを展開型と呼ぶ）。

通常順序の早いものを左に、遅いものを右に書くが、必ずしもすべてに当てはまるわけではない。

チキンゲーム再訪

さて、もしチキンゲームに順番があったらどうだろうか。まずAが道を譲るか譲らないかを決定し、実行する。次にBが道を譲るか譲らないかを決定し、実行する。こんな状況下でA、Bはそれぞれどのような決定を行ったらいいのだろうか。

ゲームの木は以下のように書ける。

　　　　　　　　┌譲る───（３，３）　┌譲る─── B┤ 　│　　　　　　└譲らない─（２，４） A ┤ 　│　　　　　　┌譲る───（４，２）　└譲らない─ B┤ 　　　　　　　　└譲らない─（１，１）

以前と同様、（）内は（Aの利得とBの利得）を表している。

さて、意思決定に順番がある場合には、最後から逆算していく。上の図はAが道を譲った場合にBが行うゲーム（上の図の上方に描かれている）と、Aが道を譲らなかった場合にBが行うゲーム（上の図の下方に描かれている）の２つが存在する。まずは「上のゲーム」を取り出してみよう。

　　　　　　　　┌譲る───（３，３）　┌譲る─── B┤ 　│　　　　　　└譲らない─（２，４）

最終的な意思決定を行うのはBである。Bの気持ちになって道を｛譲る，譲らない｝を決定してみよう。

Bの利得は右側に書かれている。Bとしては３より４が大きいので「譲らない」が望ましい。よってここまで来た時にBが「譲る」とは考えられない。以上から以下のように示すことができる。

　　　　　　　　┌譲る───（３，３）　┌譲る─── B┫ 　│　　　　　　┗譲らない━（２，４）

同様にAが道を譲らなかった場合のゲームも見てみよう。

　│　　　　　　┌譲る───（４，２）　└譲らない─ B┤ 　　　　　　　　└譲らない─（１，１）

Bとしては２と１を比較することになる。どちらも望ましくはないのだが、少しでもましな２（譲る）を選ぶことになる。

　│　　　　　　┏譲る━━━（４，２）　└譲らない─ B┫ 　　　　　　　　└譲らない─（１，１）

このようにゲームの木の中に小さなゲームが存在すると考えることができる。小さなゲームのことをサブゲームと呼ぶ。

さて元のツリーに戻ってみよう。

　　　　　　　　┌譲る───（３，３）　┌譲る─── B┫ 　│　　　　　　┗譲らない━（２，４） A ┤ 　│　　　　　　┏譲る━━━（４，２）　└譲らない─ B┫ 　　　　　　　　└譲らない─（１，１）

Aがとりうる選択肢ごとにBのとる行動を予測できる。Aが道を譲ればBは譲らない。Aが道を譲らなければBが道を譲らざるを得ない。

この状況が予想されたとき、Aはどういう意思決定を行えばいいか。

答えは簡単である。残っている選択肢[譲る，譲らない]と[譲らない，譲る]のうち、Aにとって利得が高いものを選べばよい。Aの利得はそれぞれ２と４である。よって４の利得をもたらしてくれる「譲らない」の選択をすればよい。

　　　　　　　　┌譲る───（３，３）　┌譲る─── B┫ 　│　　　　　　┗譲らない━（２，４） A ┫ 　┃　　　　　　┏譲る━━━（４，２）　┗譲らない━ B┫ 　　　　　　　　└譲らない─（１，１）

よってこのゲームではAがハンドルを切らずに突進、Bがハンドルを切って道を譲るという結果になる。チキンゲームは先手必勝のゲームである。

以上のように順番のあるゲームでは未来から逆算して判断をすればよい。この方法は後ろ向き帰納法と呼ばれる。後ろ向き帰納法によって得られる均衡は、各サブゲームの解を総合判断したものであるためサブゲーム・パーフェクト均衡と呼ばれる。

サブゲーム・パーフェクト均衡を、以前の同時手番の場合と比較してみよう。同時手番の時には答え（ナッシュ均衡）が2つ存在した。今回の交代手番のときにはそのうちのひとつだけが答えとなった。一般にサブゲーム・パーフェクト均衡はナッシュ均衡に含まれる。

恋人ゲーム再訪

ビリーとカズヤのハッテン場レスリング場をめぐる争いでも同様の分析を行うことができる。

ビリーが最初に決定を下すとしよう。ゲイムの木は以下のように書ける。

　　　　　　　　　　　　　┌新日暮里──（４，３）　　　┌新日暮里──カズヤ┤ 　　　│　　　　　　　　　└新宿二丁目─（２，２）ビリー┤ 　　　│　　　　　　　　　┌新日暮里──（１，１）　　　└新宿二丁目─カズヤ┤ 　　　　　　　　　　　　　└新宿二丁目─（３，４）

それぞれカズヤの『さぶ』ゲイム^[3]を考えると以下のようになる。

　　　　　　　　　　　┏新日暮里━━（４，３）　┌新日暮里──カズヤ┫ 　│　　　　　　　　　└新宿二丁目─（２，２）

そして

　│　　　　　　　　　┌新日暮里──（１，１）　└新宿二丁目─カズヤ┫ 　　　　　　　　　　　┗新宿二丁目━（３，４）

これを考慮して、ビリーは新日暮里を選ぶ。（４と３では４の方が利得が高い。）

　　　　　　　　　　　　　┏新日暮里━━（４，３）　　　┏新日暮里━━カズヤ┫ 　　　┃　　　　　　　　　└新宿二丁目─（２，２）ビリー┫ 　　　│　　　　　　　　　┌新日暮里──（１，１）　　　└新宿二丁目─カズヤ┤ 　　　　　　　　　　　　　└新宿二丁目─（３，４）

『さぶ』ゲイム ♂パーフェクト均衡は[新日暮里，新日暮里]であり、戦い♂は新日暮里で無事行われる。歪みねぇな。

ただし、これらの分析では、カズヤが決断を下す前にビリーの決断と結果が明らかになっていなければならない。たとえ意思決定の順番に前後関係があったとしても、相手が結果を知らなければ同時に意思決定しているのと同じである。もしカズヤがビリーの決定を知らなかったらどうなるか。

　　　　　　　　　　　　　┌新日暮里──（４，３）　　　┌新日暮里──カズヤ┤ 　　　│　　　　　　　┊ 　└新宿二丁目─（２，２）ビリー┤　　　　　　　┊ 　　　│　　　　　　　┊ 　┌新日暮里──（１，１）　　　└新宿二丁目─カズヤ┤ 　　　　　　　　　　　　　└新宿二丁目─（３，４）

『さぶ』ゲイムのカズヤはビリーの決定を知ることができず、ビリーもカズヤの行動を予想できない（二人のカズヤの見分けがつかないという意味で両者は点線で結んである）。このように、意思決定する段階において、自分がどこにいるのかわからないゲームを不完全情報ゲームと呼ぶ。不完全情報ゲームは後ろ掘り♂帰納法だけでは解けない。この例ではビリーもカズヤも新日暮里に行くべきか新宿二丁目に行くべきか判断できず、だらしねぇ結果に終わることになる。

いくつかの前提を置くことによって解ける場合もあるが、やや高度なのでこの記事では割愛する。仕方ないね。

より詳しく尻知りたい人は尻立新日暮里大学で勉強すること。

囚人のジレンマ再訪

最後に囚人のジレンマが交代手番になったらどうなるだろうか。

　　　　　　　　　　┌自白─（２，２）　　　┌自白─囚人B ┤ 　　　│　　　　　　└黙秘─（４，１）囚人A ┤ 　　　│　　　　　　┌自白─（１，４）　　　└黙秘─囚人B ┤ 　　　　　　　　　　└黙秘─（３，３）

サブゲーム・パーフェクト均衡は

　　　　　　　　　　┏自白━（２，２）　　　┏自白━囚人B ┫ 　　　┃　　　　　　└黙秘─（４，１）囚人A ┫ 　　　│　　　　　　┌自白─（１，４）　　　└黙秘─囚人B ┤ 　　　　　　　　　　└黙秘─（３，３）

[自白，自白]。同時手番の時と同様の結果が得られる。残念ながら囚人のジレンマは手番に順序をづけただけでは解決することができない。しかし、現実社会では必ずしも裏切りあいが続いているわけではない。人間は「非合理的な動物」なのだろうか？

現在では囚人のジレンマを複数回繰り返したり、３人以上のアクターで行ったりして、その理論予測を修正する試みも行われている。

ゲーム理論の展開と限界

以上ごく初等的なゲーム理論を紹介してきた。

さらに先へ

実際のゲーム理論で扱われているものは、本記事で扱っているものよりはるかに複雑である。たとえば相手の利得がわからない時も想定している（不完備情報ゲーム。不完全情報ゲームと似ているので注意）。そのような事例では、相手の利得構造を明らかにしながらゲームを進めていかなければならない（ベイジアン均衡）。

また、アクターに繰り返しゲームをさせたり、多数のアクターを同時にゲームに参加させた場合の理論も整備されている。

このほかにもアクターの協力行動を前提とする協力ゲームも存在する。

より詳しくはウィキペディアや関連商品の本を参照されたい。

批判を越えて

他方、ゲーム理論の前提とする戦略的・合理的意思決定が、人間の通常の行動を記述するのに強すぎる仮定ではないかという批判もある。人間は利得ばかりを追い求めているのではなく、ルールの順守やモラルといったものを上位においている場合もある。また「何も考えずに」「適当に」行動する場合もある。そういった行動に対してもゲーム理論は説明を試みているが（規範をゲームの解として定式化し理解する）、現実を十分説明できていないという批判もある。

より現実に近い理論を求めて、現在では心理学と共同で実験が行われており、人間行動をより正確に記述するゲーム理論（行動学的ゲーム理論）も開発されつつある。

さまざまな批判を取り込みながらゲーム理論はますます精緻化、ハッテン発展している。ゲーム理論は今後も社会科学の基礎として人間行動を説明、記述する理論であり続けるだろう。

脚注

*ここで「社会として望ましい」と書いたが、この「社会」とは2人の犯人だけで構成する社会である。より全体を見渡した場合、犯罪を犯した者が自白をしないという意味では望ましくはない。ただしこの囚人のジレンマの状況は容疑者が犯罪を犯していなくても虚偽の自白したほうが得ということを意味する。すなわち冤罪を誘発しやすいのである。この点から冤罪を誘発するとして司法取引制度を批判する議論も強い。
*中級以上のゲーム理論では「新日暮里か二丁目か」ではなく「新日暮里をp％の確率で二丁目を(1-p)％の確率で実行する」という選択を認める。そうした戦略を混合戦略と呼ぶ。「新日暮里を確実に選ぶ」という戦略を純粋戦略と呼ぶ。
*『さぶ』とは2002年まで続いた伝統ある雑誌。詳しくはこちらで。

ページ番号: 4178644
初版作成日: 09/10/10 17:03

リビジョン番号: 2356343
最終更新日: 16/05/01 04:42

編集内容についての説明/コメント:

自白→黙秘

記事編集編集履歴を閲覧

キーワード「ゲーム理論」でニコニコ動画を検索

タグ「ゲーム理論」でニコニコ動画を検索

ニコニ広告で宣伝された記事

東方Project (単) 記事と一緒に動画もおすすめ！

提供： OKB279

37348400pt

この記事の掲示板に最近描かれたお絵カキコ

お絵カキコがありません

この記事の掲示板に最近投稿されたピコカキコ

ピコカキコがありません