2014年6月28日土曜日

Sanctions as honest signals - The evolution of pool punishment by public sanctioning institutions

「すぐ読む論文」フォルダの古いファイルがずいぶん前の日付だ。
シグナリングとプールパニッシュとな。面白そうなので読む。

Schoenmakers, S., Hilbe, C., Blasius, B., & Traulsen, A. (2014). Sanctions as honest signals - The evolution of pool punishment by public sanctioning institutions. Journal of Theoretical Biology, 356C, 36–46. doi:10.1016/j.jtbi.2014.04.019

プールパニッシュありのPGG。Lonerもあり。

[戦略]
L:参加しない
D:taxもPGも貢献しない
C:PGのみ貢献(taxは払わない)
P:両方払う
O:tax払わない。もし誰かがtaxを払ってたらPGには払う

[モデル]
1.ゲームへの参加(Lかそれ以外にわかれる)
2.tax(懲罰のための原資)を払うかどうか
3.公共財に投資するかどうか(O戦略はこの段階でtaxがゼロなら投資しない)

各戦略の期待利得をガッと数式で記述してESSを求めてる。
純粋戦略にESSは存在しなくて、サイクルするよ。

そのあとシミュレーションをやってる。進化モデルはGAじゃない。
ランダムに選択されたiとjでi→jに戦略が移る確率をP_ij=1/(1+exp[-s(πj-πi)] であらわす。
s=0でPij=1/2, s->∞で利得が高いほうに確実に変化。
そっか、こういうやり方もあるのか。

結果:S=0.01ではサイクリック、S=100ではO戦略が支配。

Sを10^(-4) -> 10^2 まで動かして人口比率を見ると、S=1のあたりでO=0.7,P=0.2,D=0.1くらいの共存状態に収斂する。

モデルを拡張する。

1.taxを払うコストをいじる。ここまでのモデルはボランティアジレンマの構造(誰かひとりがtax払えばよい)だけど、これをtax払った人の頭割りにしよう。
2.2次の懲罰をいれよう
3.taxで作られた懲罰システムの存在が全員に確実にわかる前提をくずして不完全情報にしよう。

[結論]
taxをシグナルする仕組みがなければ、2次懲罰&L戦略じゃないとPool Punishは機能しない。
でもシグナルがあれば、Pool Punishはうまくいく(パラメータ次第だけど)。

「ESS→シミュレーション→拡張」の流れがなるほどJTB論文。
あと、進化のやり方はうまいね。取り入れてみようか。結果にどの程度影響するんだろう。

0 件のコメント:

コメントを投稿