編集  

ゲーム理論単語

ゲームリロン

ゲーム理論とは、合理的・戦略的意思決定を記述する理論である。

概要

フォン・ノイマンとモルゲンシュテルンの二人によって提唱され、ナッシュ数学的基礎を精緻化した。現在経済学の基礎となっていると同時に、経営学、政治学、社会学、生物学、など様々な分野で応用されている。

最も単純な二人同時手番ゲームには囚人のジレンマチキンゲームゲーム(Battle of Sexes)など有名なゲームがあり、社会の一側面を切り出すことに成功している。

アクター・選択肢・利得

ゲーム理論数学的に定式化された一つの公理系である。アクター選択肢、利得が定義される。

クター(またはプレーヤー
ゲームには通常二人以上のアクターが参加する。
選択肢(戦略)
各アクターはそれぞれ選択肢を持っている。それぞれが2つの選択肢を持つこともあるし、じゃんけんのように3つを持つ時もある。限個の連続した値のどれかを取ることも可である。
利得(効用)
クターがそれぞれの選択を行うと何らかの利得を得ることができる。初等的なゲーム理論ではどのような利得が得られるかあらかじめ明らかであり、さらに相手が得る利得も明らかになっていることが多い。利得には少なくとも大小の関係が与えられており、利得が大きいほどそのアクターにとって望ましい結果となる。ただしアクターAにとって望ましいものがアクターBにとって望ましいとは限らない。

便宜性を図るため、以下個々の選択を[アクターAの選択,アクターBの選択]、個々の利得を(アクターAの利得、アクターBの利得)と記述することにする。

二人同時手番ゲーム(ナッシュ均衡)

最も初等的なものとして二人が同時に2つの選択肢から選ぶという状況を考えてみる(同時手番ゲーム静学ゲームとも言われる)。

よく知られている「囚人のジレンマ」を取り上げてみよう(より簡潔な解説は囚人のジレンマを参照)。

  • AとBは共謀してとある軽犯罪を犯したかどで収監された(アクターは囚人Aと囚人B)。しかし彼らにはより重大な殺人事件の容疑がかかっている。
  • 取調官はそれぞれ独立した取調室でAB両者間に一切のコミュニケーション手段を与えず別々に取り調べを行う。
  • 取調官はそれぞれ「相方の罪を告白すれば刑期を短くしてやる」と提案する。
  • 二人とも黙秘すれば軽犯罪のみで刑期は2年ずつである。
  • 二人とも自すれば殺人事件の共犯で刑期は10年ずつである。
  • 片方が自して片方が黙秘すれば、自したほうは法取引により刑期は1年、黙秘したほうは刑期が20年となる。

さて、この状況下ではAには{自,黙秘}、Bにも{自,黙秘}の2つの選択肢が与えられている。2×2で合計4通りの結果が与えられる。[自,自]、[自,黙秘]、[黙秘,自]、[黙秘,黙秘]の4つの結果が存在しうる。それぞれの結果について各アクターはどれが望ましいかを順序付けて考える(序数的効用)。もっとも望ましいものに4を、もっとも望ましくないものに1をつける。

効用は刑期が短ければ短いほど良いので、Aにとってみれば[自,黙秘]がもっとも望ましい。しかしこれはBにとってみれば4つの中で最悪である。この効用を(4,1)と記述する(4はAの効用,1はBの効用)。[黙秘,黙秘]は互いにとって2番に望ましい。よって(3,3)が与えられる。[自,自]は両者にとって3番に望ましい。よって(2,2)。最後に[黙秘,自]はAにとって最も避けるべき状況であるが、Bにとってはもっとも望ましい。よって(1,4)となる。

これを表にすると以下のようになる。

囚人B

黙秘

 

囚人A

(2,2)

(4,1)

黙秘

(1,4)

(3,3)

Aの選択

さて、囚人Aはどのような意思決定を行うだろうか。

まずAはBの取りうる選択をひとつづつ較する。たとえばBが自すると仮定しよう。Aが見るべきポイントは上の表のうちの以下の部分である。

 

囚人B

 

囚人A

,2)

黙秘

(1,4)

このとき、Aは自すればいいか、黙秘すればいいか。

べるべき数字はAにとってどちらが望ましいかであるから左側の数字、つまり2、1である。各アクターは効用が大きいものを選ぶので2、つまり自を選んだ方がいい。2に下線を付けておく。

次に囚人Bが黙秘すると仮定してみよう。

 

囚人B

黙秘

 

囚人A

,1)

黙秘

(3,3)

Aは4と3を較して4を選ぶ。

Bの選択

次にBの選択を考えてみる。BにとってみればAがどのような対応をするか仮定して、それぞれの結果について意思決定すればよい。

まずはAが自したと考えよう。

囚人B

黙秘

囚人A

(2,

(4,1)

今度はBにとっての利得を考えるので、右側の数字、2と1を較する。自の方が効用が高い。

次にAが黙秘したと考えよう。

囚人B

黙秘

囚人A

黙秘

(1,

(3,3)

右側の数字4,3を較して大きい効用を与えてくれる自を選ぶ。

ナッシュ均衡・支配戦略・パレート最適解

さて、以上をまとめると以下のようになる。

囚人B

黙秘

 

囚人A

,1)

黙秘

(1,

(3,3)

上の表で赤字下線を引いたところは、相手の選択ごとに自分が取るべき最適な選択を示したものである。この例では両者が互いに最適な選択をしている結果が一つだけ存在しており、[自,自]である。このように相手の対応を仮定して最適な対応をした場合に安定的な結果が得られることがある。この状態をナッシュ均衡と呼ぶ。ナッシュ均衡は個々人が冷徹に合理的に判断した時の結果である。

なお、囚人のジレンマではAにとってみれば、Bが自しようが黙秘しようが自を選んだ方が得である。Bにとってみても、Aが自しようが黙秘しようが自したほうが得である。このように相手がどのような選択肢を選んでも自分の取るべき選択(これを戦略とよぶ)が決まっているときに、その選択を支配戦略とよぶ。囚人のジレンマでは両者に支配戦略が存在する。互いに支配戦略を取り合った結果も[自,自]である。

支配戦略解はナッシュ均衡であるが、逆は必ずしもではない。

さて、ナッシュ均衡はA、Bにとって望ましいのだろうか。[黙秘,黙秘]を考えてみよう。この場合[自,自]と較してA、Bの効用がより高い。全体で見たときに、たがいに黙秘すればより望ましい結果が得られる。しかも相手に迷惑をかけることはない。このように相手に迷惑をかけずに自分の利得を高めることをパレート的と呼ぶ。パレート的善が不可能な場合をパレート最適解と呼ぶ。囚人のジレンマでは[自,黙秘]、[黙秘,黙秘]、[黙秘,自]がパレート最適解である(ここ注意。[自,黙秘]もパレート最適解である。もしかりにそうなった場合、他の結果への移動は必ずBの効用(4)を下げることになる。つまりパレート的善が得られない。よって[自、黙秘]もパレート最適解である)。パレート最適解は社会として望ましいもの[1]であるが、ナッシュ均衡ではない場合現実として実現が難しい。

チキンゲーム

  • A、Bの200m離れて向かい合っている。は3線あり、両方のん中の線にいる。
  • スタートの合図とともに高速で相手のに向かって走り出す。
  • そのまま走って行けば正面衝突するのであるが、ハンドルを右に切ってを譲ることは許されている。
  • 相手がを譲ってくれれば自分は譲らずにん中の線を走ることができ、「勇気あるもの」とたたえられる。相手は弱扱いされる。
  • 双方がを譲らなければ正面衝突して死亡する。
  • 両方がを譲れば両方が生き残れるが両方とも弱扱いされる。

これを先のような利得表に表すと以下のようになる。

B

譲る

譲らない

 

A

譲る

3,3

(2,4)

譲らない

(4,

(1,1)

先と同様の方法で考えてみた結果は以下のとおりである。

B

譲る

譲らない

 

A

譲る

3,3

譲らない

(1,1)

このゲームには支配戦略は存在しない。つまり相手の行動によって自分の行動を決めなければならない。

そして[譲らない,譲る]と[譲る,譲らない]の2つの結果がナッシュ均衡である。「相手が譲るなら自分は譲らない」「相手が譲らないなら自分は譲るしかない」という状況である。際的危機の状況で相手に譲歩を促すことを「瀬戸際政策」と呼ぶが、この状況はこのチキンゲームで近似される。

Aにとっては[譲らない,譲る]の結果の方が望ましいのだが、どうしたらいいだろうか?

答えはBに「Aはハンドルを切らないだろう」と確信させればよい。たとえばハンドルを取り外してBに見える形で投げ捨てればよい。Bはそれを見て、「ああ、Aはを譲ることはないのだ」とあきらめる。

または、Bに「Aは狂っているので何をするのかわからない」と不安にさせればよい。脅しが通じない相手ならこちらが譲歩するしかない。

要は自分が「話の通じる相手」ではないことを知らせればよいのである。

恋人ゲーム(ゲイ夢理論♂)

カズヤ

新日暮里

新宿二丁

 

ビリー

新日暮里

2,2

新宿二丁

(1,1

チキンゲームと同様のナッシュ均衡が得られた。しかし、それぞれがパレート最適解であり、チキンゲームより満足度は高い。これは新日暮里、二丁のどちらに行っても二人一緒であれば歪みねぇということである。

ただし、これを繰り返した場合、相手に対する不満が高まる。こうした摩擦を防ぐためには新日暮里新宿二丁を交互に利用することが望ましいとされる。[2]

二人交代ゲーム(サブゲーム・パーフェクト均衡)

これまではアクターが同時に意思決定する場合を考えてきた。だが、意思決定には順番が存在する場合もある。どちらかが先手で、どちらかが後手であるといった場合である。意思決定に時系列を取り入れた分析を動学ゲームと呼ぶ。

動学ゲームはこれまで見てきたような表(これを標準戦略と呼ぶ)では分析が難しい。代わりに形図(ツリー。ゲームの木)を書いて分析していく(これを展開と呼ぶ)。

通常順序のいものを左に、遅いものを右に書くが、必ずしもすべてに当てはまるわけではない。

チキンゲーム再訪

さて、もしチキンゲームに順番があったらどうだろうか。まずAがを譲るか譲らないかを決定し、実行する。次にBがを譲るか譲らないかを決定し、実行する。こんな状況下でA、Bはそれぞれどのような決定を行ったらいいのだろうか。

ゲームの木は以下のように書ける。

        ┌譲る───(3,3)
 ┌譲る─── B┤
 │      └譲らない─(2,4)
A ┤
 │      ┌譲る───(4,2)
 └譲らない─ B┤
        └譲らない─(1,1)

以前と同様、()内は(Aの利得とBの利得)を表している。

さて、意思決定に順番がある場合には、最後から逆算していく。上の図はAがを譲った場合にBが行うゲーム(上の図の上方に描かれている)と、Aがを譲らなかった場合にBが行うゲーム(上の図の下方に描かれている)の2つが存在する。まずは「上のゲーム」を取り出してみよう。

        ┌譲る───(3,3)
 ┌譲る─── B┤
 │      └譲らない─(2,4)

最終的な意思決定を行うのはBである。Bの気持ちになってを{譲る,譲らない}を決定してみよう。

Bの利得は右側に書かれている。Bとしては3より4が大きいので「譲らない」が望ましい。よってここまで来た時にBが「譲る」とは考えられない。以上から以下のように示すことができる。

        ┌譲る───(3,3)
 ┌譲る─── B┫
 │      譲らない(2,4)

同様にAがを譲らなかった場合のゲームも見てみよう。

 │      ┌譲る───(4,2)
 └譲らない─ B┤
        └譲らない─(1,1)

Bとしては2と1を較することになる。どちらも望ましくはないのだが、少しでもましな2(譲る)を選ぶことになる。

 │      譲る━(4,2)
 └譲らない─ B
        └譲らない─(1,1)

このようにゲームの木の中に小さなゲームが存在すると考えることができる。小さなゲームのことをサブゲームと呼ぶ。

さて元のツリーに戻ってみよう。

        ┌譲る───(3,3)
 ┌譲る─── B┫
 │      譲らない(2,4)
A ┤
 │      譲る━━━(4,2)
 └譲らない─ B┫
        └譲らない─(1,1)

Aがとりうる選択肢ごとにBのとる行動を予測できる。Aがを譲ればBは譲らない。Aがを譲らなければBがを譲らざるを得ない。

この状況が予想されたとき、Aはどういう意思決定を行えばいいか。

答えは簡単である。残っている選択肢[譲る,譲らない]と[譲らない,譲る]のうち、Aにとって利得が高いものを選べばよい。Aの利得はそれぞれ2と4である。よって4の利得をもたらしてくれる「譲らない」の選択をすればよい。

        ┌譲る───(3,3)
 ┌譲る─── B┫
       譲らない(2,4)
A
       譲る━━━(4,2)
 ┗譲らない━ B┫
        └譲らない─(1,1)

よってこのゲームではAがハンドルを切らずに突進、Bがハンドルを切ってを譲るという結果になる。チキンゲームは先手必勝のゲームである。

以上のように順番のあるゲームでは未来から逆算して判断をすればよい。この方法は後ろ向き帰納法と呼ばれる。後ろ向き帰納法によって得られる均衡は、各サブゲームの解を総合判断したものであるためサブゲーム・パーフェクト均衡と呼ばれる。

サブゲーム・パーフェクト均衡を、以前の同時手番の場合と較してみよう。同時手番の時には答え(ナッシュ均衡)が2つ存在した。今回の交代手番のときにはそのうちのひとつだけが答えとなった。一般にサブゲーム・パーフェクト均衡はナッシュ均衡に含まれる。

恋人ゲーム再訪

ビリーカズヤハッテン場レスリング場をめぐる争いでも同様の分析を行うことができる。

ビリーが最初に決定を下すとしよう。ゲイムの木は以下のように書ける。

             ┌新日暮里──(4,3)
   ┌新日暮里──カズヤ
   │         └新宿二丁─(2,2)
ビリー
   │         ┌新日暮里──(1,1)
   └新宿二丁カズヤ
             └新宿二丁─(3,4)

それぞれカズヤの『さぶ』ゲイム[3]を考えると以下のようになる。

           新日暮里━━(4,3)
 ┌新日暮里──カズヤ
 │         └新宿二丁─(2,2)

そして

 │         ┌新日暮里──(1,1)
 └新宿二丁カズヤ
           ┗新宿二丁(3,4)

これを考慮して、ビリー新日暮里を選ぶ。(4と3では4の方が利得が高い。)

             新日暮里━━(4,3)
   ┏新日暮里━━カズヤ
            └新宿二丁─(2,2)
ビリー
   │         新日暮里──(1,1)
   └新宿二丁カズヤ
             新宿二丁─(3,4)

『さぶ』ゲイムパーフェクト均衡は[新日暮里新日暮里]であり、戦い新日暮里事行われる。歪みねぇな

ただし、これらの分析ではカズヤが決断を下す前にビリーの決断と結果が明らかになっていなければならない。たとえ意思決定の順番に前後関係があったとしても、相手が結果を知らなければ同時に意思決定しているのと同じである。もしカズヤビリーの決定を知らなかったらどうなるか。

             新日暮里──(4,3)
   ┌新日暮里──カズヤ
   │       ┊  └新宿二丁─(2,2)
ビリー┤       ┊
   │       ┊  ┌新日暮里──(1,1)
   └新宿二丁カズヤ
             新宿二丁─(3,4)

『さぶ』ゲイムカズヤビリーの決定を知ることができず、ビリーカズヤの行動を予想できない(二人のカズヤの見分けがつかないという意味で両者は点線で結んである)。このように、意思決定する段階において、自分がどこにいるのかわからないゲーム情報ゲームと呼ぶ。不情報ゲームは後ろ掘り帰納法だけでは解けない。この例ではビリーカズヤ新日暮里に行くべきか新宿二丁に行くべきか判断できず、だらしねぇ結果に終わることになる。

いくつかの前提を置くことによって解ける場合もあるが、やや高度なのでこの記事では割愛する。仕方ないね

より詳しく知りたい人は尻立新日暮里大学で勉強すること。

囚人のジレンマ再訪

最後に囚人のジレンマが交代手番になったらどうなるだろうか。

          ┌自─(2,2)
   ┌自─囚人B ┤
   │      └黙秘─(4,1)
囚人A ┤
   │      ┌自─(1,4)
   └黙秘─囚人B ┤
          └黙秘─(3,3)

サブゲーム・パーフェクト均衡は

          ┏自(2,2)
   ┏自━囚人B
         黙秘─(4,1)
囚人A
   │      ┌自─(1,4)
   └黙秘─囚人B
          └黙秘─(3,3)

[自,自]。同時手番の時と同様の結果が得られる。残念ながら囚人のジレンマは手番に順序をづけただけでは解決することができない。しかし、現実社会では必ずしも裏切りあいが続いているわけではない。人間は「非合理的な動物」なのだろうか?

現在では囚人のジレンマを複数回繰り返したり、3人以上のアクターで行ったりして、その理論予測を修正する試みも行われている。

ゲーム理論の展開と限界

以上ごく初等的なゲーム理論を紹介してきた。

さらに先へ

実際のゲーム理論で扱われているものは、本記事で扱っているものよりはるかに複雑である。たとえば相手の利得がわからない時も想定している(情報ゲーム。不情報ゲームと似ているので注意)。そのような事例では、相手の利得構造を明らかにしながらゲームを進めていかなければならない(ベイジアン均衡)。

また、アクターに繰り返しゲームをさせたり、多数のアクターを同時にゲームに参加させた場合の理論も整備されている。

このほかにもアクターの協行動を前提とする協ゲームも存在する。

より詳しくはウィキペディア関連商品の本を参照されたい。

批判を越えて

他方、ゲーム理論の前提とする戦略的・合理的意思決定が、人間の通常の行動を記述するのに強すぎる仮定ではないかという批判もある。人間は利得ばかりを追いめているのではなく、ルールの順守やモラルといったものを上位においている場合もある。また「何も考えずに」「適当に」行動する場合もある。そういった行動に対してもゲーム理論は説明を試みているが(規範をゲームの解として定式化し理解する)、現実を十分説明できていないという批判もある。

より現実に近い理論をめて、現在では心理学と共同で実験が行われており、人間行動をより正確に記述するゲーム理論行動学的ゲーム理論)も開発されつつある。

さまざまな批判を取り込みながらゲーム理論はますます精緻化、ハッテン発展している。ゲーム理論は今後も社会科学の基礎として人間行動を説明、記述する理論であり続けるだろう。

関連動画

関連コミュニティ

関連商品

  

関連項目

脚注

  1. *ここで「社会として望ましい」と書いたが、この「社会」とは2人の犯人だけで構成する社会である。より全体を見渡した場合、犯罪を犯した者が自をしないという意味では望ましくはない。ただしこの囚人のジレンマの状況は容疑者が犯罪を犯していなくても虚偽の自したほうが得ということを意味する。すなわち冤罪を誘発しやすいのである。この点から冤罪を誘発するとして法取引制度を批判する議論も強い。
  2. *中級以上のゲーム理論では「新日暮里か二丁か」ではなく「新日暮里をp確率で二丁を(1-p)確率で実行する」という選択を認める。そうした戦略を混合戦略と呼ぶ。「新日暮里を確実に選ぶ」という戦略を戦略と呼ぶ。
  3. *『さぶ』とは2002年まで続いた伝統ある雑誌。詳しくはこちらで。

【スポンサーリンク】

スマホ版URL:
https://dic.nicovideo.jp/t/a/%E3%82%B2%E3%83%BC%E3%83%A0%E7%90%86%E8%AB%96
ページ番号: 4178644 リビジョン番号: 2356343
読み:ゲームリロン
初版作成日: 09/10/10 17:03 ◆ 最終更新日: 16/05/01 04:42
編集内容についての説明/コメント: 自白→黙秘
記事編集 / 編集履歴を閲覧

この記事の掲示板に最近描かれたお絵カキコ

お絵カキコがありません

この記事の掲示板に最近投稿されたピコカキコ

ピコカキコがありません

ゲーム理論について語るスレ

47 : ななしのよっしん :2015/02/11(水) 13:19:12 ID: SjHmvaGk8x
経済学系のモデル化が現実とかけ離れてるのはいつものことだが

マヌケなアクターゲームからすみやかに退場させられる
というのが健全な市場のはずだ
48 : ななしのよっしん :2015/02/11(水) 14:22:34 ID: RQKhtVYQK3
これ考えてると頭がこんがらがってくるわ
49 : ななしのよっしん :2015/02/17(火) 16:31:06 ID: tWZMMIEU/Y
>>45
だから囚人のジレンマなんて言葉もあるんだろう。

ネットコメントを見ても分かるが、その中に合理的な判断を下せるが一体何居るのか
50 : ななしのよっしん :2015/02/17(火) 16:34:13 ID: HgTKmASfrb
>>47
も思った
51 : ななしのよっしん :2015/02/27(金) 16:37:22 ID: HJjBo/Cihl
慈悲だよ、慈悲
52 : ななしのよっしん :2015/12/03(木) 22:56:17 ID: Hbhq5VJ/VA
新日暮里をp確率で二丁を(1-p)確率で実行する」
だから(100-p)の間違いだね。文字を出さないで「新日暮里20確率で二丁80確率で実行する」と書いても説明は成立すると思う。

それにしても、よくまとまってる記事だ
53 : ななしのよっしん :2016/01/20(水) 10:39:46 ID: ZPvc22PTAV
理論は理論だが理論は大切で理論は楽しい・・・

つまり理論は現実ということか(錯乱
ちょっと人生ゲームやってくる
54 : ななしのよっしん :2017/01/15(日) 19:40:48 ID: A94gb/OthN
囚人のジレンマの話、期待値の計算でも同じ結果になったので期待値で回答する方法は別解として認められるのですか?
55 : ななしのよっしん :2017/04/11(火) 16:15:14 ID: UYlNrXQfyl
>>54
利得の代わりに期待値を使ってもめられるよ
囚人のジレンマなら自を誘発するのにどれくらいの減刑が必要か具体的に計算できるから
期待値を使う方が良い場合もある
56 : ななしのよっしん :2018/06/29(金) 11:12:28 ID: SdRMBofYNo
2018.06.29ロシアW杯グループHの状況がゲーム理論的にとても面
急上昇ワード
ニコニコニューストピックス