「囚人のジレンマ」と協力の戦略

ゲーム理論の基礎

No.525

ファイナンス

日付：2025年3月12日

囚人のジレンマ（Prisoner’s Dilemma）は、ゲーム理論の中でも特に有名な例で、個人の合理的な選択が必ずしも全体の最適な結果を生まないことを示します。

1. 囚人のジレンマとは？

状況設定:

2 人の囚人 A と B が犯罪の容疑で捕まり、それぞれ別々に尋問される。
2 人には 「自白する（裏切る）」 か 「黙秘する（協力する）」 という 2 つの選択肢がある。
罰則は以下のように決まる:
- 両者が黙秘 → 軽い刑（-1 年）
- 片方が自白し、もう片方が黙秘 → 自白した方は釈放、黙秘した方は重い刑（-5 年）
- 両者が自白 → 中程度の刑（-3 年）

	B が黙秘	B が自白
A が黙秘	(-1, -1)	(-5, 0)
A が自白	(0, -5)	(-3, -3)

2. ナッシュ均衡と最適戦略

このゲームでは、プレイヤー A も B も相手の選択を考えたときに、自白するのが「支配戦略」になります。

理由:

B が黙秘する場合、A は自白すると 0 年 になり、黙秘すると -1 年 なので、自白した方が得。
B が自白する場合、A は自白すると -3 年、黙秘すると -5 年 なので、自白した方がまだマシ。
よって、A と B の両方が自白する（-3, -3）が ナッシュ均衡 となる。

しかし、この結果は 全体最適ではない（両者が黙秘すれば、-1, -1 で済む）。

3. 繰り返しゲームと協力戦略

囚人のジレンマが一度きりのゲーム（単発ゲーム）であれば、プレイヤーは合理的に考えた結果「自白」を選びます。
しかし、現実世界では、同じような状況が 何度も繰り返される 場合が多く、そのときは協力する戦略が有利になることがあります。

繰り返しゲームでの戦略例:

しっぺ返し戦略（Tit-for-Tat）:
最初は協力し、相手が裏切ったら次回は裏切る。
寛容なしっぺ返し:
一度の裏切りを許容することで長期的な協力関係を築く。
ランダム戦略:
一定の確率で裏切ることで相手の行動を予測しにくくする。

これらの戦略は 長期的な関係の中で信頼を構築 し、結果的に 協力が有利になる 可能性を示します。

4. 実際の応用例

囚人のジレンマの概念は、さまざまな分野で応用されています。

企業の価格競争:
両社が価格を下げると利益が減るが、競争のために値下げせざるを得ない。
国際政治:
軍縮協定の交渉では、相手国が軍縮すれば有利だが、相手が軍備を拡大すれば不利になるため、裏切るインセンティブが生じる。
環境問題:
企業が環境保護にコストをかけると、競争相手より不利になるため、協力が難しい。

5. まとめ

囚人のジレンマは、個々の合理的な選択が全体として最適にならない状況を示す代表的なゲームです。
しかし、繰り返しゲームや協力戦略を用いることで、より良い結果を得ることが可能になります。

シリーズ一覧ゲーム理論の基礎
全 8 回

ファイナンス

回	タイトル	リンク
第 1 回	「ゲーム理論」とは何か？	詳細
第 2 回	「ナッシュ均衡」について	詳細
第 3 回	「囚人のジレンマ」と協力の戦略	この記事
第 4 回	価格競争のゲーム	詳細
第 5 回	ミニマックス戦略とゼロサムゲーム	詳細
第 6 回	オークション理論と戦略的入札	詳細
第 7 回	メカニズムデザインと現実の経済システム	詳細
第 8 回	ゲーム理論を活用した戦略的意思決定	詳細

似た記事 [一覧]

ラグランジュ未定乗数法と制約付き最適化

怒りを「我慢」してはいけない理由

オプション価格決定の数学的アプローチ

違う記事 [一覧]

Text-to-Speech API の使い方

進撃の巨人×日田駅を訪ねて

免責事項 & 著作権について

当サイトの情報は、一般的な参考情報として提供しております。
正確な情報の掲載に努めておりますが、その内容の正確性・完全性・最新性を保証するものではありません。
記事の内容をご利用の際は、ご自身の責任において判断し、必要に応じて専門家にご相談ください。
当サイトの情報の利用により生じたいかなる損害についても、一切の責任を負いかねますのでご了承ください。

※ 本ページでは、著作権法に基づき、適正な引用の範囲内でコンテンツを紹介しています。
オリジナルの情報は発信元をご確認ください。
もし問題がありましたら、こちらからお問い合わせください。