シュウジンノジレンマ
囚人のジレンマとは、ゲーム理論で起きる事象のひとつ。
個々の最適な選択が、全体として最適な選択とはならない状況の例としてよく挙げられる問題である。
協力して犯罪をした二人が、警察に捕まりました
↓
しかし証拠がつかめないので、自白を引き出すために警官は捕まえた二人にこう言いました
↓
「もし相方の罪を証言すれば相方は懲役5年の罪にするが、お前は懲役1年にしてやる。逆も同じだ。」
「だが、二人とも証言したらお前達二人とも懲役3年だ。」
「もし、二人とも黙秘したら二人とも懲役2年だ。わかったな?」
↓
捕まった二人は別々に収容されているため、相談が出来ません。
この時、二人の犯人はどのような行動にでるのでしょう?
犯人を犯人A・犯人Bと置いて考えると、刑の長さは以下の表のようにまとめられる。
(1, 5)はAの刑が1年、Bの刑が5年ということを表す。
B | |||
黙秘 | 証言 | ||
A | 黙秘 | (2, 2) | (5, 1) |
証言 | (1, 5) | (3, 3) |
このとき、Aは以下のように考える。
そんなわけで、どちらにしても自分が証言したほうが得なので、Aは「証言する」という結論を導き出す。
Bのほうでも同じ思考経路をたどった結果、「証言する」という結論になる。
結果として、どちらも3年の刑を受ける「二人とも証言」が選ばれる。
しかし、「二人とも黙秘」を選べば二人とも2年で済むのだから、A・Bどちらもこの選択のほうが得するはずである。
(こういう、完全な上位互換になる選択が他に存在する選択のことを、経済学では「パレート最適」でないと言う)
かくして、AとBはわざわざ二人とも損になる選択肢を選んでしまったことになる。
囚人のジレンマとは、このように各々は自分にとって最適な答えを選んだのに、全体を見たとき明らかに最適でない結果が出てしまうというものである。
はたして二人は「二人にとって最適な答え」を導くことが出来るのか?
ようこそ、ジレンマの世界へ・・・
現実世界でも囚人のジレンマのような状況がが多く存在する。
例えば世界各国の軍事競争や環境問題
受験戦争、恋愛関係にも例えることが可能なのである。
上述のように、囚人のジレンマの状況では合理的に行動すればするほど当事者の協力が困難になる。しかし、現実社会では必ずしも非協力が決定されているわけではない。現実と理論の乖離を理解するためには囚人のジレンマの仮定を理解しなければならない。
囚人のジレンマの仮定として、
の2点が挙げられる。しかし、この両者は必ずしも一般的ではない。
たとえば1に関しては、軍拡競争に陥った場合に当事者同士が話し合いをすることで軍拡が抑制されることがある(軍縮会議)。
2に関しては「囚人たち」が犯罪組織に所属する者と仮定してみればよい。彼らは自白して3年後に出所しても、同様に収監されるかもしれない。「相方の信用を失っては犯罪組織が維持できない」と考えると、最初の収監でも容易に自白できなくなる。囚人のジレンマが繰り返された場合、一定条件下で協力が達成される(アクセルロッド『つきあい方の科学』参照)。
このように、現実社会では厳密な意味での囚人のジレンマの状況は限定されており、たとえ当事者が合理的に行動したとしても協力を達成することは可能である。
掲示板
79ななしのよっしん
2021/01/22(金) 00:49:36 ID: CinGONiTVb
当事者間のコミュニケーションが制限されていると、例えば値下げ競争の共倒れとか、生物同士の利用し合いとかではよく説明できる
これが人間の話になると違和感が出るのは、囚人のジレンマにおける環境では、そもそも元のゲーム条件を変更する利点が大きいため
自分が証言する事で得られる利得<相手が黙秘する事で得られる利得
なので、あの手この手でゲーム理論の前提条件を破って相手の行動選択に干渉する方法を探す
ジレンマが破られる例は、何らかの方法で相手の行動選択の可能性分布を変化可能な場合と言っていいと思う
相手を協調させるコストと利得の差が、自分が裏切って得られる利得を越えると、互いに協調を強制しあう形になる。記憶情報量の多い人間だと特にコストがお安くなる
80ななしのよっしん
2021/01/22(金) 01:21:41 ID: CinGONiTVb
例えばアクセルロッドの協議会で有名なしっぺ返し戦略の場合、
相手がしっぺ返し戦略だと、自身の協調行動は相手の協調行動を引き出すので、十分な利得になる
相手がランダムや決め打ち戦略だと相手の協調を引き出せない
また自己増幅の要素(利得が多いと個体数が増え、少ないと減少する)があると、自身の協調行動は相手個体数の増加(=環境全体で相手と同じ戦略に当たる確率の増加)、裏切りは逆に相手個体数の減少(=環境全体での相手戦略の減少)に繋がるので、これも"自分と当たる相手"の協調確率を操作する要素となる
囚人なら例えば、報復や信頼でゲーム外での利得回収を図ったり、事前に情に訴えて合理的行動を脳化学的に阻害したりできる。大概元から複雑な社会体系を利用して生きてるので追加のコストも安かったり実質ゼロ以下の場合もあるだろう
…これは良い事ばかりでなく、互いに協調強制が裏切りより有利となると、監視と献身強要で最終的に誰も得しない(ダメな企業とか悪い村社会とか)、新たな囚人のジレンマが発生する可能性も含む
(協調強制行
(省略しています。全て読むにはこのリンクをクリック!)
81ななしのよっしん
2021/01/22(金) 02:43:05 ID: CinGONiTVb
もうひとつ忘れてた
自分が裏切る事で得られる利得<相手が協調する事で得られる利得、の構造の場合、
「自分が裏切らない」事で相手が受けとる利得は、相手自身が裏切りを選択して得られる利得より大きいので、相手の行動に合わせて自分の行動を変える事ができるなら実質的な相手の利得テーブルを協調有利に変える事ができる
何らかの方法でコミュニケーションが取れれば、相手の行動選択自体に直接干渉できなくてもいいし、既存の利得テーブルを変更する必要もない。これもプレイヤーがゲーム条件を破ろうとする強い誘因要素になる
互いに協調した方が全体の利得が増えるという構造であるため、自分の協調行動は相手に対し誘導のエサ・交渉材料になる可能性を常に持ってしまうとも言える
急上昇ワード改
最終更新:2021/02/27(土) 20:00
最終更新:2021/02/27(土) 20:00
ウォッチリストに追加しました!
すでにウォッチリストに
入っています。
追加に失敗しました。
ほめた!
ほめるを取消しました。
ほめるに失敗しました。
ほめるの取消しに失敗しました。