2011年2月5日土曜日

【善と悪】タカ-ハトゲーム(1) 囚人のジレンマ

倫理を考えるための深い示唆を与えるゲームが「タカ-ハトゲーム(Hawk-Dove Game)」だ。このゲームは、人間行動ではなく動物行動の分析のために考案されたもので、次のような利得構造を持つ(本当はいろんなバージョンがあるが、ここではこれだけ紹介する)。


ハト
タカ
ハト
22
04
タカ
40
(1,1)
【表3】タカ-ハトゲームの利得表
(左の数字が’行’のプレイヤーの利得、右の数字が’列’のプレイヤーの利得と読む)

この利得行列の意味は次の通りである。

まず、このゲームが想定している状況は、縄張り争いや獲物を巡る争いだと想像してもらいたい。そし、「ハト戦略」の個体は縄張り争いの際、威嚇はするが実際に争うことはせず、戦いが始まりそうになると逃げ、ハト戦略の個体同士ならば(互いに威嚇だけしつづければ)資源を分け合う。「タカ戦略」の個体は、縄張りを巡って実際に争い、勝った方が資源の全てを独占する。

そして、利得表で表されている「利得」は「適応度」とする。すなわち、残せる子孫の数である。

以上の想定の下で利得表を吟味するとこうなる。まず、「ハト戦略」の個体(というのは面倒なので、以下「ハト」という)同士が出会った場合、資源を分け合うので、それぞれ2の利得を得る。次に、ハトとタカが出会った場合、互いに威嚇はするものの、タカだけが実際に攻撃してハトは逃げるため、資源をタカが独占する。ハト同士が分け合った時の利得がそれぞれ2なので、それを独占するタカは合計の利得4を得る。一方、戦いに負けたハトはより劣悪な環境のもとに追いやられるので、利得は0なる。最後に、タカ同士が出会った場合、勝った方は資源を独占できるので4、負けた方は劣悪な環境に追いやられるだけでなく、戦いに負けて利得2分のダメージを受けるとして、0−2=−2の利得を得る。双方は等確率で勝ったり負けたりすると仮定すれば、タカ同士の戦いにおける期待利得は、4×1/2 + (-2)×1/2 = 1 となる。

ところで、タカ同士の戦いで負ける方が受けるダメージが−2であると想定するのは、理に適っているだろうか? 例えば、互いに死ぬまで戦うような激しい戦いにはならないのだろうか?

もちろん、そういう行動を取る方が合理的な場合もあると思うが、とりあえず今は、利得4を50%の確率でとれるということにしているので、(ダメージを考えない)期待利得は2。よって、期待利得以上にダメージを受ける戦いをするのは損だ、という想定をすれば、ダメージを−2に止めて逃げるのは、ある程度合理的な引き際だと考えられる。

さて、このようなゲームにおいて、どのように行動するのが合理的だろうか?

まず、相手がタカ戦略をとると仮定しよう、もし自分がハトを取ると利得は0で、タカを取れば利得は1なので、自分もタカ戦略をとることが合理的だ。次に、相手がハト戦略をとると仮定すれば、自分もハト戦略なら利得は2だが、タカ戦略をとれば利得は4になるので、タカ戦略をとることが合理的だ。よって、対戦相手の戦略が何であれ、タカ戦略をとることが合理的であるとなる。

利得の構造は対称(相手も同じ)なので、双方がタカ戦略を採用することとなり、結果的にはタカ対タカの争いなので、双方の期待利得は(1,1)になる。

しかし、この結果は一見不合理だ。なぜなら、双方がハト戦略を採用すれば(2,2)の利得を得ることができるのに、双方が「合理的」に行動した結果、それよりも悪い状態である(1,1)を選択してしまうからだ。

このように、プレイヤーが合理的に行動することで、非効率的な(利得が低い)状態に陥る問題のことを「囚人のジレンマ(Prisoner's Dilemma)」という。

事実、(タカ, タカ)という戦略の組はナッシュ均衡になっているが、(ハト, ハト)という戦略の組はナッシュ均衡ではない。より利得が高いはずの戦略の組がナッシュ均衡にならないということは、ゲーム理論(正確にはナッシュの理論)に欠陥があるのではないだろうか?

と、直観的には思うものの、その批判は的外れである。そもそも、ナッシュ均衡は利得を最大化する戦略の組を求めるための概念ではない。ナッシュ均衡は、互いに最適戦略になる戦略の組(つまり、相手が戦略を変えない限り、自分も戦略を変える必要がないという状態)を表す概念だ。ナッシュ均衡で利得が最大化される、とは誰も言っていないのだ。

そして、もう一つの勘違いは、「双方のプレイヤーが合理的に行動すれば、互いの利得が最大化されるはずだ」という思い込みだ。合理性は必ずしも我々を最適な状態に導くとは限らない。我々は、「合理的」という言葉の響きに騙されて、それがあたかも個体の状態をよくするツールであるかのように考えてしまうが、合理的に行動することで最適の状態を達成できる保証はないのだ。

古くからの迷信のような道徳は、一見すると不合理だ。しかし、そういった伝統的な道徳の下でうまくいく社会もあるのであり、そういった道徳を「程度の低い」ものとして退けるのは素朴すぎる考え方だ。我々は時に、全員が不合理な行動をすることによって最善の状態を達成することもあるのだ。

0 件のコメント:

コメントを投稿