囚人のジレンマ単語

シュウジンノジレンマ

  • 7
  • 0
掲示板をみる(81)
  • twitter
  • facebook
  • はてな
  • LINE
  • ほめる(7)
  •  
  •  
  •  
  •  
  • その他

囚人のジレンマとは、ゲーム理論で起きる事のひとつ。
個々の最適な選択が、全体として最適な選択とはならない状況の例としてよく挙げられる問題である。

概要

問題

して犯罪をした二人が、警察に捕まりました
        ↓
しかし拠がつかめないので、自を引き出すために警官は捕まえた二人にこう言いました
        ↓
「もし相方の罪を言すれば相方は懲役5年の罪にするが、お前は懲役1年にしてやる。逆も同じだ。」
「だが、二人とも言したらお前達二人とも懲役3年だ。」
「もし、二人とも黙秘したら二人とも懲役2年だ。わかったな?」
        ↓
捕まった二人は別々に収容されているため、相談が出来ません。
この時、二人の犯人はどのような行動にでるのでしょう?

解説

犯人犯人A・犯人Bと置いて考えると、刑の長さは以下の表のようにまとめられる。
(1, 5)はAの刑が1年、Bの刑が5年ということを表す。

B
黙秘
A 黙秘 (2, 2) (5, 1)
(1, 5) (3, 3)

このとき、Aは以下のように考える。

  1. 相方Bが言したとすると、自分は黙秘したら5年の刑を受け、自分も言すれば3年の刑で済む。だから、言したほうがよさそう。
  2. 相方Bが黙秘したとすると、自分も黙秘したら2年の刑を受け、自分が言すれば1年の刑で済む。だから、言したほうがよさそう。

そんなわけで、どちらにしても自分が言したほうが得なので、Aは「言する」という結論を導き出す。
Bのほうでも同じ思考経路をたどった結果、「言する」という結論になる。

結果として、どちらも3年の刑を受ける「二人とも言」が選ばれる。
しかし、「二人とも黙秘」を選べば二人とも2年で済むのだから、A・Bどちらもこの選択のほうが得するはずである。
(こういう、全な上位互換になる選択が他に存在する選択のことを、経済学では「パレート最適」でないと言う)
かくして、AとBはわざわざ二人とも損になる選択肢を選んでしまったことになる。
囚人のジレンマとは、このように各々は自分にとって最適な答えを選んだのに、全体を見たとき明らかに最適でない結果が出てしまうというものである。

はたして二人は「二人にとって最適な答え」を導くことが出来るのか?
ようこそ、ジレンマ世界へ・・・

現実世界の囚人のジレンマ

現実世界でも囚人のジレンマのような状況がが多く存在する。
例えば世界軍事競争や環境問題
受験戦争恋愛関係にも例えることが可なのである。

囚人のジレンマの仮定と現実社会での協力

上述のように、囚人のジレンマの状況では合理的に行動すればするほど当事者の協が困難になる。しかし、現実社会では必ずしも非協が決定されているわけではない。現実理論の乖離を理解するためには囚人のジレンマの仮定を理解しなければならない。

囚人のジレンマの仮定として、

  1. 当事者間のコミュニケーションが制限されていること
  2. 意思決定が一回限りであること

の2点が挙げられる。しかし、この両者は必ずしも一般的ではない。

たとえば1に関しては、軍拡競争に陥った場合に当事者同士が話し合いをすることで軍拡が抑制されることがある(軍縮会議)。

2に関しては「囚人たち」が犯罪組織に所属する者と仮定してみればよい。彼らは自して3年後に出所しても、同様に収監されるかもしれない。「相方の信用を失っては犯罪組織が維持できない」と考えると、最初の収監でも容易に自できなくなる。囚人のジレンマが繰り返された場合、一定条件下で協が達成される(アクセルロッド『つきあい方の科学』参照)。

このように、現実社会では厳密な意味での囚人のジレンマの状況は限定されており、たとえ当事者が合理的に行動したとしても協を達成することは可である。

関連動画

関連商品

 

関連項目

この記事を編集する

掲示板

  • 79ななしのよっしん

    2021/01/22(金) 00:49:36 ID: CinGONiTVb

    当事者間のコミュニケーションが制限されていると、例えば値下げ競争の共倒れとか、生物同士の利用し合いとかではよく説明できる
    これが人間の話になると違和感が出るのは、囚人のジレンマにおける環境では、そもそも元のゲーム条件を変更する利点が大きいため

    自分が言する事で得られる利得<相手が黙秘する事で得られる利得
    なので、あの手この手でゲーム理論の前提条件を破って相手の行動選択に干渉する方法を探す
    ジレンマが破られる例は、何らかの方法で相手の行動選択の可性分布を変化可な場合と言っていいと思う
    相手を協調させるコストと利得の差が、自分が裏切って得られる利得を越えると、互いに協調を強制しあう形になる。記憶情報量の多い人間だと特にコストがお安くなる

  • 80ななしのよっしん

    2021/01/22(金) 01:21:41 ID: CinGONiTVb

    例えばアクセルロッドの協議会で有名なしっぺ返し戦略の場合、
    相手がしっぺ返し戦略だと、自身の協調行動は相手の協調行動を引き出すので、十分な利得になる
    相手がランダムや決め打ち戦略だと相手の協調を引き出せない
    また自己増幅の要素(利得が多いと個体数が増え、少ないと減少する)があると、自身の協調行動は相手個体数の増加(=環境全体で相手と同じ戦略に当たる確率の増加)、裏切りは逆に相手個体数の減少(=環境全体での相手戦略の減少)に繋がるので、これも"自分と当たる相手"の協調確率を操作する要素となる

    囚人なら例えば、報復や信頼でゲーム外での利得回収を図ったり、事前に情に訴えて合理的行動を化学的に阻したりできる。大概元から複雑な社会体系を利用して生きてるので追加のコストも安かったり実質ゼロ以下の場合もあるだろう
    …これは良い事ばかりでなく、互いに協調強制が裏切りより有利となると、監視と献身強要で最終的にも得しない(ダメな企業とか悪い村社会とか)、新たな囚人のジレンマが発生する可性も含む
    (協調強制行
    (省略しています。全て読むにはこのリンクをクリック!)

  • 81ななしのよっしん

    2021/01/22(金) 02:43:05 ID: CinGONiTVb

    もうひとつ忘れてた

    自分が裏切る事で得られる利得<相手が協調する事で得られる利得、の構造の場合、
    「自分が裏切らない」事で相手が受けとる利得は、相手自身が裏切りを選択して得られる利得より大きいので、相手の行動に合わせて自分の行動を変える事ができるなら実質的な相手の利得テーブルを協調有利に変える事ができる
    何らかの方法でコミュニケーションが取れれば、相手の行動選択自体に直接干渉できなくてもいいし、既存の利得テーブルを変更する必要もない。これもプレイヤーゲーム条件を破ろうとする強い誘因要素になる
    互いに協調した方が全体の利得が増えるという構造であるため、自分の協調行動は相手に対し誘導のエサ・交渉材料になる可性を常に持ってしまうとも言える

おすすめトレンド

急上昇ワード改

最終更新:2021/02/27(土) 20:00

ほめられた記事

最終更新:2021/02/27(土) 20:00

ウォッチリストに追加しました!

すでにウォッチリストに
入っています。

OK

追加に失敗しました。

OK

追加にはログインが必要です。

           

ほめた!

すでにほめています。

すでにほめています。

ほめるを取消しました。

OK

ほめるに失敗しました。

OK

ほめるの取消しに失敗しました。

OK

ほめるにはログインが必要です。

タグ編集にはログインが必要です。

タグ編集には利用規約の同意が必要です。

TOP