2011年4月2日土曜日

【善と悪】タカ-ハトゲーム(3) 進化ゲーム

前節までで、タカ−ハトゲームについては1回限りの場合と無限回の繰り返しが行われる場合を説明した。結論としては、合理的なプレイヤーは、1回限りのゲームではタカ戦略を、無限回繰り返しゲームでは利得(1 ,1)以上を実現するあらゆる(ハト・タカ両方の)戦略を採りうるということだった。

しかし、実際に人類が進化してきた途上において、人類は最初から合理的な存在ではなかったし、もしかすると今でも合理的な存在ではないかもしれない。だから、ゲーム理論は実際の人類の行動をうまく説明するものではないかもしれない。また、人類以外の生物の行動原理も説明したいという欲求もある。

そこで、登場するのが「進化ゲーム理論(Evolutionary Game Theory)」である。

進化ゲーム理論は、基本的にはゲーム理論の考え方を援用しながら、生物においてどのような生き残り戦略が進化しうるかを説明する理論である。ゲーム理論との重要な相違点は3つ。第1に、当然のことだがプレイヤーは世代交代していくということ。そして、次世代の個体数は、前世代の得た利得に比例する(すなわち、利得は相対的な適応度を表す)。第2に、プレイヤーは合理的存在ではなく、前世代から遺伝した戦略を自動的に採る存在だということ。ただし、次世代への遺伝は完全ではなく、小さな割合で前世代と異なる戦略を採る突然変異体が生まれるものとする。第3に、ゲーム理論ではプレイヤーの数は普通少数であったのだが、進化ゲーム理論ではプレイヤーの数は十分に多いとする。

さて、ゲーム理論においては「合理的なプレイヤーならどう行動するか?」ということを記述する「ナッシュ均衡」を求めることが一つの目的だった訳だが、進化ゲーム理論においては、プレイヤーは合理的ではないので、「どのような戦略の個体が繁栄するか」ということを求めることが目的になる。つまり、世代交代ごとにある戦略を採る個体は減り、ある戦略を採る個体は増える、というようなダイナミズムが起こっていくわけだが、その中で、どのような戦略が群れの中で繁栄するかということを調べるわけだ。

このように、群れの中で繁栄する戦略のことを「進化的安定戦略(Evolutionary Stable Strategy)」略してESSという。もっと正確には、少数の突然変異体が侵入しても個体の割合が変わらない安定的な戦略のことをいう。

さて、進化ゲーム理論の枠組みで、タカ−ハトゲームを考えてみよう。


ハト
タカ
ハト
22
04
タカ
40
(1,1)
【表3】タカ-ハトゲームの利得表
(左の数字が’行’のプレイヤーの利得、右の数字が’列’のプレイヤーの利得と読む)

利得はこれまでと同じであるとする。また、利得は相対的な適応度とし、個体は一定割合で自然死するため、全体の個体数は一定であるとする。さて、タカ、ハトどちらの個体が繁栄するだろうか。

以下、進化ゲーム理論の雰囲気を感じてもらうために、簡単な計算をしてタカ、ハトのどちらが繁栄するか調べる。ただし、結論だけ知れば十分という方は読み飛ばすことが可能である。

さて、この集団において、タカ個体の割合がpであるとする(0 < p < 1、すなわちハト個体の割合は1-p)。とすると、タカ個体は確率pでタカに出会い、確率1-pでハトに出会うので、タカの適応度の期待値Whは、それぞれに出会った際の利得を確率に掛けて

Wh = p + 4(1 - p) = 4 - 3p

である。同様にハト個体は、確率pでタカに出会い、確率1-pでハトに出会うので、その適応度の期待値Wdは、

Wd = 0 + 2(1 - p) = 2 - 2p

である。ここで、WhとWdの大小関係を調べるためにWh - Wdの正負を評価してみると、

Wh - Wd = 4 -3p - (2 - 2p) = 2 - p < 0 (なぜなら、0 < p < 1なので)

であるので、Wh < Wdである。すなわち、常にタカ個体の適応度の方が大きいので、この集団の初期状態(タカとハトの割合)がどんなものであっても、最終的にはタカ個体だらけの集団への収斂することが分かる。つまり、タカ戦略が進化的安定戦略(ESS)なのである。逆に言うと、このゲームではハト戦略は繁栄することはできないのだ。

しかしながら、この結果は【表3】の利得表を持つゲームの吟味でしかないのではないだろうか? 【表3】の利得表がちょっと違っていたらどうなるだろう。例えば、ハト同士の対戦で双方が得られる利得が2ではなく3だったらどうなるだろう。あるいは、タカ同士の対戦での双方の利得が1ではなく1/2だったら?

実は、囚人のジレンマ型ゲームにおいては、タカ型戦略が常にESSになってしまう。もっと正確に言えば、【表4】の利得構造を持つゲームにおいては、常にタカ戦略がESS、しかも唯一のESSになる。
ハト
タカ
ハト
aa
bc
タカ
cb
(d,d)
【表4】一般的なタカ-ハトゲームの利得表
ただし、b < d < a < c

まとめると、進化ゲームを考えた時、タカ-ハトゲームにおいては常にタカ戦略の個体が繁栄するということだ。

さて、合理的なプレイヤーによる無限回繰り返しタカ-ハトゲームでは期待利得(1, 1)以上を実現するあらゆる戦略を採りうるのであった。すなわち、(ハト, ハト)という最も効率的な戦略の組を実現することができたのだ。しかし、進化的に変化していく集団においては、このような効率的な戦略は繁栄することはできない。(タカ, タカ)という、最も非効率的な戦略の組が進化的安定戦略になってしまうのだ。

この結果の違いは、一見するとプレイヤーが合理的かどうかによっているように見えるが、実はそうではない。二つのゲームの本質的な違いは、特定のプレイヤーとの継続的な関係が存在しているかということなのである。

すなわち、無限回繰り返しタカ-ハトゲームにおいては、同じプレイヤーがゲームを繰り返すのに比べ、進化ゲームにおいては、大量のプレイヤーがランダムに出会うことによってゲームを行うということが最も重要な差異である。

たとえば、様々な戦略を採る大量の合理的なプレイヤーがランダムに出会いながら(つまり、特定のプレイヤーとだけゲームを繰り返すことは出来ない状況で)ゲームを繰り返す場合、その集団はやはり最後にはタカ戦略だらけの集団になってしまうのである。

なぜなら、タカ戦略を採るプレイヤーの期待利得Whとハト戦略を採るプレイヤーの期待利得Wdを比べれば、先ほどと同様に常にWh > Wdであるので、合理的プレイヤーならばタカ戦略を採用することとなり、結局全てのプレイヤーがタカ戦略を採用してしまうからだ。

さて、この事実は倫理学にどのような示唆を与えるだろうか?

前節で述べたように、近代社会以前の村のような固定的人間関係が続く場合、無限回繰り返しタカ-ハトゲームは道徳的関係構築のモデルとして機能する。しかし、人間社会はムラ的な社会構造だけで成立しているわけではない。だから、進化ゲーム型のモデルも道徳を考える上では勘案する必要があると思う。

私見を述べれば、ゲーム理論と倫理を考える際、この点がいままであまり顧みられていなかった感がある。進化ゲーム型タカ-ハトゲーム(より一般的には、多くの個体がランダムに出会うタカ-ハトゲーム)を行う集団内において、どういう道徳、行動規範が進化しうるだろうか? 次節にてその点を考察しよう。