シミュレーションの基本的な考え方

まず模擬的な世界を作って、シミュレーションをする手法で個人的な行為の選択と社会的な協調量の増減の関係を観察することにした。模擬的な世界の大きな要素は、プレイヤーとしてどんな人間を想定するのか、ということと、行為の及ぼす場所の二つの設定である。

1)私たちが想定するプレイヤーは、どのようなプレイヤーなのか

プレイヤーは、自分自身の利益を合理的に追求するが、それ以外の価値をも考慮する。その他の価値、例えば礼儀正しさ、規範やルールに従う、真理の追究など、もっと幅広い価値を認識して、自分自身が重要だと思えるなら、その時の自身の利得が多少減ずることになる恐れがあると思っても、そちらに舵をきるというようなモデルである。これは、従来の、常に自分の利得を抜け目なく最大化しようとする狭い意味の合理的選択ではなく、その価値が自分にとって選択するべき価値であるとみなせば、その価値を優先させて行為選択をするという広い意味での合理的な行為選択をする人を表す。

広い意味の価値、その中でもここでは「協調的関係を志向すること」に限定した。私たちの人間モデルは、出会った相手に対してまずは、協調的態度で接する。それは、相手と自分の関係がお互い協調的態度であることを望むからである。そしてお互いの協調関係が、成り立てばそれを維持、持続していくことを願う。関係は継続を基本とするので、一回限りのゲームは想定しない。出会う時点では、相手がどんな人でその先がどうなるのか予測が難しいのだが、相手との関係の開始とみなす。そしてお互いに協調的であるなら何も問題なく互恵関係が続き、双方が恩恵を得ることになる。
では、相手が協調的でない場合は、どうするのか?私たちのモデルは、相手の非協調に対してすぐに報復をしない。
Tit-for-tatは、相手が裏切りで返して来たら自分は裏切り返す。相手の手をそのまましっぺ返しをすることが、自分の利得を守ることになると考えるからである。毎回のゲームで少しの失点もなくする良い方法だが、トータルで見れば協調的な関係は減少する。一回ごとのゲームのわずかな自分の損失にこだわってトータルな意味で、つまり長期的には相手との協調関係を損なうことになる。協調関係が継続することの意味は、少し大げさに言えば平和が持続することであり、そのことによってもたらされる利益は双方にもたらされる。しかも協調が構築されないことの結果、戦争など紛争などが生まれることを考えれば、利益は大きいのである。では長い目で見て協調的な関係を保つことにこだわるあまり、一方的に協調の手ばかり取っていると、相手によっては、ずっと相手から損害を受けることになってしまう。それは論外である。
私たちのモデルは、すぐに報復をしないと書いたが、不十分なので書き直す。相手の手が協調であれ裏切りであれ、即座に直前の相手の手をそっくりそのまま返さないということだ。つまり裏切りには裏切り、協調には協調で返すのではなく、いわば「機械的に一拍置く」のである。

「一拍置く」ことと協調を志向すること

「一拍置く」とは、自己の利得追求という単一基準で行為選択をするのではなく、複数の価値基準を搭載したプレイヤーを創造する目的で考察をした結果である。人の行動は、多分に習慣的であり、そこには過去の経験やそれから得た教訓を含んでいるが、記憶の保持は、曖昧だったり事柄により濃淡があったり、行為の単純ミスや思い違い、失念など人間特有の問題も抱えている。相手の手が、即、相手の意思とは限らない場合もある。
さらに、複数の価値の考慮が必要な場合は、簡単にすぐ答えが出せない。熟考するのに時間を要する。
思惑と行為の間には、多くの段階がある、つまり意思があったとしても、その意思を表すのに適切な行動が選択できるとは限らないのである。思いを行動に移すとき、思い浮かぶ行為の選択肢の中から選ぶことになる。ジレンマゲームのように、行為の選択(取る手)が協調するか裏切るか、の二つしかない場合、協調したいが単に相手を利するだけであるとわかれば意に反して裏切りの手を取ることになる。裏切りの手は、やむを得ず取るのである。例えば、ここに日の目を見なかった協調への可能性を見ることができるのでは、と考えた。

私たちのプレイヤーもとれる手は二つしかないのだが、そしてそれは、C(cooperation)とD(defect)であることに変わりはない。だが自分がその内のどちらをとるかを決める際に複数の(ここでは3個の)内的状態(stand point)を想定した。
その結果が
CCC、CCD、CDD、DDDの4種類のプレイヤーである。(上記には書かれてないが、現在の内的状態を表すポインタがあり、このポインタが指している手、CまたはD、を取る。ポインタがどのように動くかは後で述べる。)この3つの内的状態は左の方へ行けばより協調的な状態であり、右の方へ行けばより裏切り的な状態である。
CCC、または、DDDは内的な状態によらず、何時も、C、または、Dを取る。つまり相手が協調・裏切りのいずれの手を取ってきても、自分は、常に協調だけを取るモデルと、常に裏切りしかとらないモデルである。

次に、現時点でどの位置に自分がいるかを指し示すポインタの移動に関して述べる。
相手がCを取れば、現在のポインタの位置から左の方へ1つだけ移動しようとする。例えば、CDDで左のDの所を現在のポインタが指していれば、すぐ左のCが新しいポインタの位置になる(次回はCを取る)。もし、右のDの所を現在のポインタが指していれば、すぐ左のDが新しいポインタの位置になる(次回もDを取る)。もし、一番左のCの所を現在のポインタが指していれば、左へ移動できないので、現在のポインタの位置が新しいポインタの位置になる(次回もCを取る)。同様に相手がDを取れば、現在のポインタの位置から右の方へ1つだけ移動しようとする。

このように、取れる行為がCとDの2つしかないが、内的状態を設け、例えば、CCDのプレイヤーは、自分がCを取る内的状態を、自分の意思で、Cを2つの濃淡に分けて行為に臨んでいると解釈できる。
つまり、いつも協調的な人、より協調的な傾向が強い人、より非協調的傾向が強い人、そしてつねに非協調的な人が、ある割合で存在すると想定した。以上のように内的状態を持つモデルを私たちは、論文では“reluctant”と呼ぶことにしたが、しかしこれは「優柔不断」、「ぐずぐずしている」などといった否定的な意味は含まず、「思慮深い」「熟考する」など肯定的な意味を付与したつもりである。一つのモデルの名前とみていただきたい。

2)場所 ― 存在してゲームを行う盤上(Lattice)について -

プレイヤーが動きかつゲームをする場所に関して述べる。同時に1人以下(1か0)のプレイヤーが存在できるセルからなる、例えば、30×30(横に30個、縦に30個、並べた合計900個からなる)のセルの格子を想定する。
この30×30の格子状のセル上に、初期に、例えば、100人のプレイヤーがランダムな位置に配置される。ゲームは500期行われる。各期に、プレイヤーは動き、その後ゲームを行う。
ここで、一般的に、人が協調あるいは非協調な行為を取ることと相手がどんな人であるか、即ち、身近な人か見知らぬ人かに影響される場合がある。家族、親類、友達、近所の親しい人、などは今までの付き合いがあり今後も関係が保たれると予想され、裏切る行為は抑制されがちだが、一方、通りすがりの人、遠く離れた見知らぬ誰かだと、今までもこれからも関係はなくこの一回で終わると思われ、裏切り行為への誘因は大きくなる、という見方がある。
仲間内では協調的で、知らない他者とは非協調的であるのは、推奨されることではないが、人間の現実とみなさないわけにいかない。人は一般に、どこへでも行き、だれとでも関係を持つことができるが、中でも特に自分の近いところを動き、周辺の身近な人とのみ付き合うことを区別してlocal moveとlocal playとした。それは、小さな地域、グループなどが仲間内で協調関係を作り上げて、それを核にして次第に大きな集団になっていくイメージが元になっているからである。それに対して動きも対戦相手も自由に選ぶ場合をglobalと呼ぶ。

つまりまとめると

  1. 動きに関して:local move global move
    local moveとは自分の居るセルの上下左右の4個のセルからランダムに1個選び、そのセルが空いていれば(他のプレイヤーがいない)そこに移動する。空いていなければ元のセルに留まる。global moveとは自分のいるセル以外の空いているすべてのセルからランダムに1個のセルを選び、そこへ移動する。空いているセルがなければ、元のセルに留まる。
  2. ゲームを行うことに関して:local play global play
    local playとは自分のいるセルに隣接する上下左右の4個のセルにプレイヤーがいれば、その中からランダムに1人を選び、そのプレイヤーとゲームを1回行う。隣にプレイヤーがいなければ、ゲームを行わない。global playとは、他のすべてのプレイヤーからランダムに1人を選び、そのプレイヤーとゲームを1回行う。自分以外のプレイヤーがどこにもいなければ、ゲームを行わない。
以上を、例えば、6回行う(各期に6回以下ゲームを行うことになる)。

プレイヤーの設定:貧富と生死

6回のゲーム終了後、プレイヤーの富が負になれば、その期に死亡する。また、寿命を超えれば死亡する。富がある値を超え、隣に空いているセルがあれば、自分と同じ性質を持つ子を産み、その子に初期の富を与える。
次の期が始まる。
これを、例えば、500期間繰り返し、最後の期に、例えば、100人を超えてプレイヤーが残っており、平均協調率が、例えば、20%を超えれば、このrunで「協調が出現した」と判断する。

以上のような装置を使って、個人の選択と社会の協調の集積の関係をいくつかのテーマ別にシミュレーションした。どういう行為選択を個人がすれば、社会的に協調が増えるか、についてその結果を次から述べていこうと思う。

備考:各セルは、その位置によって状況が異なる場合がある。例えば、格子の四隅のセルは隣接するセルが二つしかなく、真ん中のセルは隣接するセルを四つ持つ。この差を埋め、同じものとするために、格子の左端と右端は繋がっており、上端と下端も繋がっていて、あたかも境界がないように扱う。すなわち、左(右)端の境界にいるプレイヤーが左(右)に移動すると、右(左)端から入り、上(下)端にいるプレイヤーが上(下)に移動すると、下(上)端から入るというように。