「囚人のジレンマ」と協力の戦略

ゲーム理論の基礎

日付:2025年3月12日

囚人のジレンマ(Prisoner’s Dilemma)は、ゲーム理論の中でも特に有名な例で、個人の合理的な選択が必ずしも全体の最適な結果を生まないことを示します。

目 次

1. 囚人のジレンマとは?

囚人のジレンマ(Prisoner’s Dilemma)は、ゲーム理論の中でも特に有名な例で、個人の合理的な選択が必ずしも全体の最適な結果を生まないことを示します。

状況設定:

  • 2 人の囚人 A と B が犯罪の容疑で捕まり、それぞれ別々に尋問される。
  • 2 人には 「自白する(裏切る)」「黙秘する(協力する)」 という 2 つの選択肢がある。
  • 罰則は以下のように決まる:
    • 両者が黙秘 → 軽い刑(-1 年)
    • 片方が自白し、もう片方が黙秘 → 自白した方は釈放、黙秘した方は重い刑(-5 年)
    • 両者が自白 → 中程度の刑(-3 年)
B が黙秘B が自白
A が黙秘(-1, -1)(-5, 0)
A が自白(0, -5)(-3, -3)

2. ナッシュ均衡と最適戦略

このゲームでは、プレイヤー A も B も相手の選択を考えたときに、自白するのが「支配戦略」になります。

理由:

  • B が黙秘する場合、A は自白すると 0 年 になり、黙秘すると -1 年 なので、自白した方が得。
  • B が自白する場合、A は自白すると -3 年、黙秘すると -5 年 なので、自白した方がまだマシ。
  • よって、A と B の両方が自白する(-3, -3)が ナッシュ均衡 となる。

しかし、この結果は 全体最適ではない(両者が黙秘すれば、-1, -1 で済む)。

3. 繰り返しゲームと協力戦略

囚人のジレンマが一度きりのゲーム(単発ゲーム)であれば、プレイヤーは合理的に考えた結果「自白」を選びます。
しかし、現実世界では、同じような状況が 何度も繰り返される 場合が多く、そのときは協力する戦略が有利になることがあります。

繰り返しゲームでの戦略例:

  • しっぺ返し戦略(Tit-for-Tat):
    最初は協力し、相手が裏切ったら次回は裏切る。
  • 寛容なしっぺ返し:
    一度の裏切りを許容することで長期的な協力関係を築く。
  • ランダム戦略:
    一定の確率で裏切ることで相手の行動を予測しにくくする。

これらの戦略は 長期的な関係の中で信頼を構築 し、結果的に 協力が有利になる 可能性を示します。

4. 実際の応用例

囚人のジレンマの概念は、さまざまな分野で応用されています。

  • 企業の価格競争:
    両社が価格を下げると利益が減るが、競争のために値下げせざるを得ない。
  • 国際政治:
    軍縮協定の交渉では、相手国が軍縮すれば有利だが、相手が軍備を拡大すれば不利になるため、裏切るインセンティブが生じる。
  • 環境問題:
    企業が環境保護にコストをかけると、競争相手より不利になるため、協力が難しい。

5. まとめ

囚人のジレンマは、個々の合理的な選択が全体として最適にならない状況を示す代表的なゲームです。
しかし、繰り返しゲームや協力戦略を用いることで、より良い結果を得ることが可能になります。