2011年2月16日水曜日

【善と悪】タカ-ハトゲーム(2)長期的関係と道徳

前節では、タカ-ハトゲームにおいては、互いにタカ戦略を採ることが合理的であり、結果として、合理的なプレイヤーは利得(1, 1)しか得られない非効率的な均衡に陥ってしまうということを述べた。


ハト
タカ
ハト
22
04
タカ
40
(1,1)
【表3】タカ-ハトゲームの利得表(再掲)
(左の数字が’行’のプレイヤーの利得、右の数字が’列’のプレイヤーの利得と読む)

では、タカ-ハトゲームを(同一のプレイヤーが)繰り返し行う場合、どのような戦略が合理的だろうか? やはりタカ戦略が合理的なのだろうか?

結論を先に述べると、このゲームを繰り返し行う場合は、利得(1, 1)以上を実現する、混合戦略まで含めたあらゆる戦略がナッシュ均衡になる。すなわち、互いにハト戦略を採り、利得(2, 2)を得る戦略の組もナッシュ均衡(=合理的プレイヤーが採用する戦略の組)になる。

もう少し正確に述べよう。まず「繰り返し」行うという意味は、「無限回の繰り返し」を意味することとする。有限回の繰り返しを行う場合は、依然として互いにタカ戦略を採ることがナッシュ均衡である。

なぜなら、有限回の繰り返しなので、最後のゲームがあるわけだが、最後のゲームは1回限りのゲームと同じなので、互いにタカ戦略を採ることがナッシュ均衡だ。つまり、最終回は双方がタカを採ることを合理的プレイヤーは予想する。

次に、最後から2番目のゲームだが、最後のゲームは互いにタカ戦略を採ることが予想されている(結果が分かっている)ので、これも1回限りのゲームと同じく、互いにタカ戦略を採ることが合理的だ。

同様に、全ての回において以上のことが成り立ち、最後の回から遡る形で(タカ, タカ)戦略が全ての回のゲームにおける合理的な戦略になるのである。

逆に、無限回ゲームを続ける場合は、「最後の回」というのがないので、以上の論理は成り立たない。そして、合理的プレイヤーが将来得られる利益を最大化しようとするならば、例えば、「相手がハト戦略を採り続ける限り、自分もハト戦略を採る」というような双方の戦略がナッシュ均衡になることは容易に想像できる(先述の通り、ナッシュ均衡を実現する戦略の組は混合戦略を含めれば無限にあることに注意。双方がタカ戦略を採る組もナッシュ均衡になる)。

このことから示唆されるのは、多少飛躍するように見えるだろうが、「道徳とは長期的関係を前提にしなければ成立しえない」ということだろう。

どういうことかというと、タカ-ハトゲームが表しているのは、一種の道徳的葛藤の状況であるとも考えられる。互いにハト戦略で「協力」すれば、それなりに大きな利得を得ることが出来るが、相手がハトであればタカ戦略で「裏切り」をするとより大きな利得を得ることができる。一方で、互いがタカで争い合うと小さな利得しか得られない。これは、我々がよく経験する状況である。

例えば、約束を破ることで大きな利益を得られる場合も、互いが約束を破りあえば小さな利益しか得られない、と言うように。

つまり、互いが「そこそこの利益」で満足すればその利得が確保できるのに、より大きな利益を目指してしまうと、互いがひどい状況に陥ってしまうというジレンマなのだ。そして、これが1回限りの場合は、奇妙なことに「ひどい状況」に陥ることが合理的なのだが、無限回ゲームが繰り返される場合は「協力」することも合理的になるのだ。

これは、互いが「そこそこの利益」で満足するためには、プレイヤー間に長期的な(正確には「無限回ゲームが続く」)関係がなければ実現できないということを意味する。

しかし、現実世界において「無限回の」ゲームが行われるということはないのではないか? という疑問があるだろう。実は、繰り返し型タカ-ハトゲームで(ハト, ハト)戦略がナッシュ均衡になるためには、無限回のゲームが行われる必要はない。

必要なのは、「終わりのないゲーム」なのだ。つまり、実際は無限回でなくても、プレイヤー自身にも、いつが最終回のゲームなのかわからないという条件を満たせば十分なのだ。「今回が最終回だ」ということが認識できないとすれば、ハト戦略からタカ戦略に転換するポイントもなく、「協力」が持続できる。

すなわち、人々が道徳的関係を築くための条件は、いつが関係の終わりなのか分からない、という意味での長期的関係が必要になるのである。

これは、当たり前のようだけれども、大変重要なことである。なぜなら、過去の日本のように人間関係が固定されている場合には道徳的関係が構築される可能性は高いのだが、現代社会のように、多くの関係が一回限りである場合には、自然発生的には道徳的関係が構築されえないということを示唆するからだ。

事実、近代以降の資本主義社会において重要なのは、公正な取引を行うという「信用」でああったが、法制度が完備されていなかった近代社会において、「信用」の源泉としてのキリスト教への「信仰」は極めて重要だったと見られている。

すなわち、一回限りの取引を行う場合は、その取引で不正をすることが合理的になってしまうため自然状態だと取引ができないが、信仰心によって公正な取引が担保されることで市場経済が発展するのだ。

取引の場合は、不正を行った際のペナルティを高めることで公正な取引を実現することができるが、この世界は法で規制できるような関係ばかりではない。資本主義社会がより拡大し、1回限りの関係が増えていった時、世界全体が道徳的な関係でつながることができるのかは疑わしい。しかし、緩やかであっても道徳的な関係が構築されないかぎり、世界から紛争がなくなることはないだろう。

2011年2月5日土曜日

【善と悪】タカ-ハトゲーム(1) 囚人のジレンマ

倫理を考えるための深い示唆を与えるゲームが「タカ-ハトゲーム(Hawk-Dove Game)」だ。このゲームは、人間行動ではなく動物行動の分析のために考案されたもので、次のような利得構造を持つ(本当はいろんなバージョンがあるが、ここではこれだけ紹介する)。


ハト
タカ
ハト
22
04
タカ
40
(1,1)
【表3】タカ-ハトゲームの利得表
(左の数字が’行’のプレイヤーの利得、右の数字が’列’のプレイヤーの利得と読む)

この利得行列の意味は次の通りである。

まず、このゲームが想定している状況は、縄張り争いや獲物を巡る争いだと想像してもらいたい。そし、「ハト戦略」の個体は縄張り争いの際、威嚇はするが実際に争うことはせず、戦いが始まりそうになると逃げ、ハト戦略の個体同士ならば(互いに威嚇だけしつづければ)資源を分け合う。「タカ戦略」の個体は、縄張りを巡って実際に争い、勝った方が資源の全てを独占する。

そして、利得表で表されている「利得」は「適応度」とする。すなわち、残せる子孫の数である。

以上の想定の下で利得表を吟味するとこうなる。まず、「ハト戦略」の個体(というのは面倒なので、以下「ハト」という)同士が出会った場合、資源を分け合うので、それぞれ2の利得を得る。次に、ハトとタカが出会った場合、互いに威嚇はするものの、タカだけが実際に攻撃してハトは逃げるため、資源をタカが独占する。ハト同士が分け合った時の利得がそれぞれ2なので、それを独占するタカは合計の利得4を得る。一方、戦いに負けたハトはより劣悪な環境のもとに追いやられるので、利得は0なる。最後に、タカ同士が出会った場合、勝った方は資源を独占できるので4、負けた方は劣悪な環境に追いやられるだけでなく、戦いに負けて利得2分のダメージを受けるとして、0−2=−2の利得を得る。双方は等確率で勝ったり負けたりすると仮定すれば、タカ同士の戦いにおける期待利得は、4×1/2 + (-2)×1/2 = 1 となる。

ところで、タカ同士の戦いで負ける方が受けるダメージが−2であると想定するのは、理に適っているだろうか? 例えば、互いに死ぬまで戦うような激しい戦いにはならないのだろうか?

もちろん、そういう行動を取る方が合理的な場合もあると思うが、とりあえず今は、利得4を50%の確率でとれるということにしているので、(ダメージを考えない)期待利得は2。よって、期待利得以上にダメージを受ける戦いをするのは損だ、という想定をすれば、ダメージを−2に止めて逃げるのは、ある程度合理的な引き際だと考えられる。

さて、このようなゲームにおいて、どのように行動するのが合理的だろうか?

まず、相手がタカ戦略をとると仮定しよう、もし自分がハトを取ると利得は0で、タカを取れば利得は1なので、自分もタカ戦略をとることが合理的だ。次に、相手がハト戦略をとると仮定すれば、自分もハト戦略なら利得は2だが、タカ戦略をとれば利得は4になるので、タカ戦略をとることが合理的だ。よって、対戦相手の戦略が何であれ、タカ戦略をとることが合理的であるとなる。

利得の構造は対称(相手も同じ)なので、双方がタカ戦略を採用することとなり、結果的にはタカ対タカの争いなので、双方の期待利得は(1,1)になる。

しかし、この結果は一見不合理だ。なぜなら、双方がハト戦略を採用すれば(2,2)の利得を得ることができるのに、双方が「合理的」に行動した結果、それよりも悪い状態である(1,1)を選択してしまうからだ。

このように、プレイヤーが合理的に行動することで、非効率的な(利得が低い)状態に陥る問題のことを「囚人のジレンマ(Prisoner's Dilemma)」という。

事実、(タカ, タカ)という戦略の組はナッシュ均衡になっているが、(ハト, ハト)という戦略の組はナッシュ均衡ではない。より利得が高いはずの戦略の組がナッシュ均衡にならないということは、ゲーム理論(正確にはナッシュの理論)に欠陥があるのではないだろうか?

と、直観的には思うものの、その批判は的外れである。そもそも、ナッシュ均衡は利得を最大化する戦略の組を求めるための概念ではない。ナッシュ均衡は、互いに最適戦略になる戦略の組(つまり、相手が戦略を変えない限り、自分も戦略を変える必要がないという状態)を表す概念だ。ナッシュ均衡で利得が最大化される、とは誰も言っていないのだ。

そして、もう一つの勘違いは、「双方のプレイヤーが合理的に行動すれば、互いの利得が最大化されるはずだ」という思い込みだ。合理性は必ずしも我々を最適な状態に導くとは限らない。我々は、「合理的」という言葉の響きに騙されて、それがあたかも個体の状態をよくするツールであるかのように考えてしまうが、合理的に行動することで最適の状態を達成できる保証はないのだ。

古くからの迷信のような道徳は、一見すると不合理だ。しかし、そういった伝統的な道徳の下でうまくいく社会もあるのであり、そういった道徳を「程度の低い」ものとして退けるのは素朴すぎる考え方だ。我々は時に、全員が不合理な行動をすることによって最善の状態を達成することもあるのだ。