ニコニコ大百科モバイル

7/2(月)よりスマホまたはPCでアクセスした場合、各デバイス向けのサイトへ自動で転送致します


ゲーム理論


ヨミ: ゲームリロン
掲示板をミル!
78カキコ!

ゲーム理論とは、合理的・戦略的意思決定を記述する理論である。


概要


フォン・ノイマンとモルゲンシュテルンの二人によって提唱され、ナッシュ数学的基礎を精緻化した。現在経済学の基礎となっていると同時に、経営学、政治学、社会学、生物学、など様々な分野で応用されている。

最も単純な二人同時手番ゲームには囚人のジレンマチキンゲームゲームBattle of Sexes)など有名なゲームがあり、社会の一側面を切り出すことに成功している。


アクター・選択肢・利得


ゲーム理論は数学的に定式化された一つの公理系である。アクター選択肢、利得が定義される。

クター(またはプレーヤー
ゲームには通常二人以上のアクターが参加する。
選択肢戦略
各アクターはそれぞれ選択肢を持っている。それぞれが2つの選択肢を持つこともあるし、じゃんけんのように3つを持つ時もある。限個の連続した値のどれかを取ることも可である。
利得(効用)
クターがそれぞれの選択を行うと何らかの利得を得ることができる。初等的なゲーム理論ではどのような利得が得られるかあらかじめ明らかであり、さらに相手が得る利得も明らかになっていることが多い。利得には少なくとも大小の関係が与えられており、利得が大きいほどそのアクターにとって望ましい結果となる。ただしアクターAにとって望ましいものがアクターBにとって望ましいとは限らない。

便宜性を図るため、以下個々の選択を[アクターAの選択,アクターBの選択]、個々の利得を(アクターAの利得、アクターBの利得)と記述することにする。


二人同時手番ゲーム(ナッシュ均衡)


最も初等的なものとして二人が同時に2つの選択肢から選ぶという状況を考えてみる(同時手番ゲーム静学ゲームとも言われる)。

よく知られている「囚人のジレンマ」を取り上げてみよう(より簡潔な解説囚人のジレンマを参照)。

さて、この状況下ではAには{自,黙秘}、Bにも{自,黙秘}の2つの選択肢が与えられている。2×2で合計4通りの結果が与えられる。[自,自]、[自,黙秘]、[黙秘,自]、[黙秘,黙秘]の4つの結果が存在しうる。それぞれの結果について各アクターはどれが望ましいかを順序付けて考える(序数的効用)。もっとも望ましいものに4を、もっとも望ましくないものに1をつける。

効用は刑期が短ければ短いほど良いので、Aにとってみれば[自,黙秘]がもっとも望ましい。しかしこれはBにとってみれば4つの中で最悪である。この効用を(4,1)と記述する(4はAの効用,1はBの効用)。[黙秘,黙秘]は互いにとって2番に望ましい。よって(3,3)が与えられる。[自,自]は両者にとって3番に望ましい。よって(2,2)。最後に[黙秘,自]はAにとって最も避けるべき状況であるが、Bにとってはもっとも望ましい。よって(1,4)となる。

これを表にすると以下のようになる。

囚人B

黙秘

 

囚人A

(2,2)

(4,1)

黙秘

(1,4)

(3,3)

Aの選択

さて、囚人Aはどのような意思決定を行うだろうか。

まずAはBの取りうる選択をひとつづつ較する。たとえばBが自すると仮定しよう。Aが見るべきポイントは上の表のうちの以下の部分である。

 

囚人B

 

囚人A

,2)

黙秘

(1,4)

このとき、Aは自すればいいか、黙秘すればいいか。

べるべき数字はAにとってどちらが望ましいかであるから左側の数字、つまり2、1である。各アクターは効用が大きいものを選ぶので2、つまり自を選んだ方がいい。2に下線を付けておく。

次に囚人Bが黙秘すると仮定してみよう。

 

囚人B

黙秘

 

囚人A

,1)

黙秘

(3,3)

Aは4と3を較して4を選ぶ。

Bの選択

次にBの選択を考えてみる。BにとってみればAがどのような対応をするか仮定して、それぞれの結果について意思決定すればよい。

まずはAが自したと考えよう。

囚人B

黙秘

囚人A

(2,

(4,1)

今度はBにとっての利得を考えるので、右側の数字、2と1を較する。自の方が効用が高い。

次にAが黙秘したと考えよう。

囚人B

黙秘

囚人A

黙秘

(1,

(3,3)

右側の数字4,3を較して大きい効用を与えてくれる自を選ぶ。

ナッシュ均衡・支配戦略・パレート最適解

さて、以上をまとめると以下のようになる。

囚人B

黙秘

 

囚人A

,1)

黙秘

(1,

(3,3)

上の表で赤字下線を引いたところは、相手の選択ごとに自分が取るべき最適な選択を示したものである。この例では両者が互いに最適な選択をしている結果が一つだけ存在しており、[自,自]である。このように相手の対応を仮定して最適な対応をした場合に安定的な結果が得られることがある。この状態をナッシュ均衡と呼ぶ。ナッシュ均衡は個々人が冷に合理的に判断した時の結果である。

なお、囚人のジレンマではAにとってみれば、Bが自しようが黙秘しようが自を選んだ方が得である。Bにとってみても、Aが自しようが黙秘しようが自したほうが得である。このように相手がどのような選択肢を選んでも自分の取るべき選択(これを戦略とよぶ)が決まっているときに、その選択を支配戦略とよぶ。囚人のジレンマでは両者に支配戦略が存在する。互いに支配戦略を取り合った結果も[自,自]である。

支配戦略解はナッシュ均衡であるが、逆は必ずしもではない。

さて、ナッシュ均衡はA、Bにとって望ましいのだろうか。[黙秘,黙秘]を考えてみよう。この場合[自,自]と較してA、Bの効用がより高い。全体で見たときに、たがいに黙秘すればより望ましい結果が得られる。しかも相手に迷惑をかけることはない。このように相手に迷惑をかけずに自分の利得を高めることをパレート的と呼ぶ。パレート的善が不可能な場合をパレート最適解と呼ぶ。囚人のジレンマでは[自,黙秘]、[黙秘,黙秘]、[黙秘,自]がパレート最適解である(ここ注意。[自,黙秘]もパレート最適解である。もしかりにそうなった場合、他の結果への移動は必ずBの効用(4)を下げることになる。つまりパレート的善が得られない。よって[自、黙秘]もパレート最適解である)。パレート最適解は社会として望ましいものここで「社会として望ましい」と書いたが、この「社会」とは2人の犯人だけで構成する社会である。より全体を見渡した場合、犯罪を犯した者が自をしないという意味では望ましくはない。ただしこの囚人のジレンマの状況は容疑者が犯罪を犯していなくても虚偽の自したほうが得ということを意味する。すなわち冤罪を誘発しやすいのである。この点から冤罪を誘発するとして司法取引制度を批判する議論も強い。であるが、ナッシュ均衡ではない場合現実として実現が難しい。

チキンゲーム

これを先のような利得表に表すと以下のようになる。

B

譲る

譲らない

 

A

譲る

3,3

(2,4)

譲らない

(4,

(1,1)

先と同様の方法で考えてみた結果は以下のとおりである。

B

譲る

譲らない

 

A

譲る

3,3

譲らない

(1,1)

このゲームには支配戦略は存在しない。つまり相手の行動によって自分の行動を決めなければならない。

そして[譲らない,譲る]と[譲る,譲らない]の2つの結果がナッシュ均衡である。「相手が譲るなら自分は譲らない」「相手が譲らないなら自分は譲るしかない」という状況である。際的危機の状況で相手に譲歩を促すことを「瀬戸際政策」と呼ぶが、この状況はこのチキンゲームで近似される。

Aにとっては[譲らない,譲る]の結果の方が望ましいのだが、どうしたらいいだろうか?

答えはBに「Aはハンドルを切らないだろう」と確信させればよい。たとえばハンドルを取り外してBに見える形で投げ捨てればよい。Bはそれを見て、「ああ、Aはを譲ることはないのだ」とあきらめる。

または、Bに「Aは狂っているので何をするのかわからない」と不安にさせればよい。脅しが通じない相手ならこちらが譲歩するしかない。

要は自分が「話の通じる相手」ではないことを知らせればよいのである。

恋人ゲーム(ゲイ夢理論♂)

カズヤ

新日暮里

新宿二丁

 

ビリー

新日暮里

2,2

新宿二丁

(1,1

チキンゲームと同様のナッシュ均衡が得られた。しかし、それぞれがパレート最適解であり、チキンゲームより満足度は高い。これは新日暮里、二丁のどちらに行っても二人一緒であれば歪みねぇということである。

ただし、これを繰り返した場合、相手に対する不満が高まる。こうした摩擦を防ぐためには新日暮里新宿二丁を交互に利用することが望ましいとされる。中級以上のゲーム理論では「新日暮里か二丁か」ではなく「新日暮里をp確率で二丁を(1-p)確率で実行する」という選択を認める。そうした戦略混合戦略と呼ぶ。「新日暮里を確実に選ぶ」という戦略戦略と呼ぶ。


二人交代ゲーム(サブゲーム・パーフェクト均衡)


これまではアクターが同時に意思決定する場合を考えてきた。だが、意思決定には順番が存在する場合もある。どちらかが先手で、どちらかが後手であるといった場合である。意思決定に時系列を取り入れた分析を動学ゲームと呼ぶ。

動学ゲームはこれまで見てきたような表(これを標準戦略と呼ぶ)では分析が難しい。代わりに形図(ツリー。ゲームの木)を書いて分析していく(これを展開と呼ぶ)。

通常順序のいものを左に、遅いものを右に書くが、必ずしもすべてに当てはまるわけではない。

チキンゲーム再訪

さて、もしチキンゲームに順番があったらどうだろうか。まずAがを譲るか譲らないかを決定し、実行する。次にBがを譲るか譲らないかを決定し、実行する。こんな状況下でA、Bはそれぞれどのような決定を行ったらいいのだろうか。

ゲームの木は以下のように書ける。

        ┌譲る───(3,3)
 ┌譲る─── B┤
 │      └譲らない─(2,4)
A ┤
 │      ┌譲る───(4,2)
 └譲らない─ B┤
        └譲らない─(1,1)

以前と同様、()内は(Aの利得とBの利得)を表している。

さて、意思決定に順番がある場合には、最後から逆算していく。上の図はAがを譲った場合にBが行うゲーム(上の図の上方に描かれている)と、Aがを譲らなかった場合にBが行うゲーム(上の図の下方に描かれている)の2つが存在する。まずは「上のゲーム」を取り出してみよう。

        ┌譲る───(3,3)
 ┌譲る─── B┤
 │      └譲らない─(2,4)

最終的な意思決定を行うのはBである。Bの気持ちになってを{譲る,譲らない}を決定してみよう。

Bの利得は右側に書かれている。Bとしては3より4が大きいので「譲らない」が望ましい。よってここまで来た時にBが「譲る」とは考えられない。以上から以下のように示すことができる。

        ┌譲る───(3,3)
 ┌譲る─── B┫
 │      譲らない(2,4)

同様にAがを譲らなかった場合のゲームも見てみよう。

 │      ┌譲る───(4,2)
 └譲らない─ B┤
        └譲らない─(1,1)

Bとしては2と1を較することになる。どちらも望ましくはないのだが、少しでもましな2(譲る)を選ぶことになる。

 │      譲る━(4,2)
 └譲らない─ B
        └譲らない─(1,1)

このようにゲームの木の中に小さなゲームが存在すると考えることができる。小さなゲームのことをサブゲームと呼ぶ。

さて元のツリーに戻ってみよう。


次へ»
最終更新日: 16/05/01 04:42
タグ検索 パソコン版を見る


[0]TOP
ニコニコ動画モバイル
運営元:ドワンゴ