Thesis or Dissertation Evolutionary Game Theoretic Analysis of Two Period Mutual Punishment Strategy in Repeated Prisoner`s Dilemma with Noisy Observations

Perera, Mallawaarachchige, Don, Arosh, Tharinda  ,  マッラワラッチゲ, ドン, アローシュ, タリンダ, ペレーラ

pp.3 - 42 , 2015-03-25 , The University of Electro-Communications
Description
本論文では、ノイズ付き繰り返し囚人のジレンマにて、二期相互処罰(2MP)戦略の進化ゲーム理論的解析を行う。2MPにおけるプレイヤーは、初めに協力し相手の裏切りを観測するとそれ以降自分も裏切るが、続けて2回裏切りを観測すると元に戻り協力する。ゲーム理論では良く知られている、代表的な戦略であるTFTは、ノイズ付き繰り返し囚人のジレンマにて均衡を構成することができない。ノイズが存在しない場合でもTFTが均衡にならない。しかし、2MPはノイズ付き繰り返し囚人のジレンマにて均衡を構成することができる。また、TFTにおけるプレイヤーはノイズ付きシグナルを観測し、協力行動を取るのが困難である。ゆえに、繰り返しゲーム理論の観点では、2MPがTFTより大幅に優れている。しかしながら、進化ゲーム理論の観点では、研究されてないのが事実である。したがって、本論文では、ノイズ付き繰り返し囚人のジレンマにおけるレプリケータ方程式を利用し、既存の他戦略と2MPのレプリケータダイナミクスを検討する。2MPとTFTが存在する母集団にALLDを導入した場合に、初期集団から2MPとTFTへの推移がほぼ同じである。ノイズが大きくなると初期集団が完全にALLDへ移動する。ALLDに入れ替わってALLCを導入するとレプリケータダイナミクスが急激に変化する。具体的には、TFTが2MPよりも少ない平均利得を得る。その理由は、ノイズ付きの場合、TFTとALLC間の協力が難しくなるからである。他方、2MPは効率的にALLCを利用し、より高い利得を得る。したがって、ノイズが大きくなると母集団は初期集団から2MPへ移動する傾向がある。最後に、四つの戦略におけるレプリケータダイナミクスを調べ、2MP及びTFTの優位性について検討する。

Number of accesses :  

Other information