2017年12月20日水曜日

間接互恵性のモデルを複雑ネットワークでやる祭り

もう2017年が終わるとかなんかの間違いだ。3月に論文が出て以降の研究の進まなさっぷりもなんかの間違いだ。痩せないのも。

間接互恵のネットワークモデルがどんなものなのかをボチボチ探してたらReseachGateかなんかで推薦されたので。

Peleteiro, A., Burguillo, J. C. & Chong, S. Y. Exploring Indirect Reciprocity in Complex Networks using Coalitions and Rewiring. in Proceedings of the 2014 International Conference on Autonomous Agents and Multi-agent Systems 669-676 (2014).

2014年のAAMAS論文とな。

複雑ネットワーク上で間接互恵をやるぞよ。世の中複雑ネットワークだ。Webの世界ならだれとでも取引可能だが(つまり全員とゲームする)やり方をまねできるのは知ってる相手だ(つまり隣接ノード)。またいくつかのコミュニティに属して情報を共有するよね(この論文でいうcoalition)。ということで学習対象がネットワークで縛られる構造を導入します。評判が観察できるのは隣接ノードかcoalitionメンバーに限る。当然ネットワークとcaolitionは可変でしょう。rewiringありです。

ゲームの基本アイデアはNowak&Sigmund(Nature, 1998)のイメージスコアリングのやつ。イメージスコア(評判)と協力の閾値を持ったエージェントがドネーションゲームをする。協力したら評判が+1、裏切ると-1となる。

ゲームはPopulationからランダムに選ばれる。エージェントはネットワーク上に配置され、またcoalitionにも属している。ドナーになったエージェントはレシピエントの評判を調べるんだけど、隣接ノードもしくはcoalitionのメンバーならスコアを見れる。それ以外だったら見れないのでスコアは0と判断する。

学習対象は隣接ノードから。rewiringは評判の悪いやつを確率的に切ってcoalitionの中から評判の高いやつにつなぐ。

いやー、なんでこんな七面倒臭いことするんだ。結果はまあrewiringとcoalitionで協力が進化するとか、SFとSmall-Worldでcoalitionの影響が違うとか。うーん、アブストラクトモデルにしては入れ込みすぎだし、ミドルレンジのモデルとしては何ができたのかよくわからん。はい次。

Liu, A., Wang, L., Zhang, Y. & Sun, C. in (eds. Liu, D., Xie, S., Li, Y., Zhao, D. & El-Alfy, E.-S. M.) 10638, 919-926 (Springer International Publishing, 2017).

続いてはこの論文を受けての論文。

ゲームの設定や学習ルールは同じ。coalitionは廃止してる。うんそれがいいと思う。でrewiringのときにつなぐのに成功するかどうかを自分の評判が高ければつなげて低ければ失敗するというアイデアを一発いれます。SFネットワークでrewiringありだと協力が進化するけど、rewiringなしだと進化しないと。

うーむ、うーむ。



2017年8月10日木曜日

We Can’t Return Evil for Good: The Comparison between Direct and Indirect Reciprocity

あれ、今年は7月は省略されたんだっけ。勝手に1年を11か月にしないでほしいものだ。

直接互恵と間接互恵を混在させてみると結局のところ直接互恵が強いよっていう論文。

Shiraki, Y. & Igarashi, T. We Can’t Return Evil for Good: The Comparison between Direct and Indirect Reciprocity. Lett. Evol. Behav. Sci. 8, 4–7 (2017).

直接互恵と間接互恵は良く知られてそして研究されている。集団内の観察が完全であれば、評判の矛盾は起きないけれど不完全観察ならば当然矛盾はおこる。評判の悪い人から協力された後に協力を求められたら、直接互恵的に協力を返すのか、評判を活用して拒否するのか。シナリオを用いてやります。

会社の同僚に最近部署が一緒になったBさんがいます。部署の人たちとランチを食べてたらBさんがやってきて夜勤を代わってくれと言ってきました。あなたは代わってあげますか。シナリオは2×2。互恵条件は「以前にBさんに助けてもらったことがある/ない」、評判条件は「Bさんは協力的で人気/非協力的で不人気」。

実験はほとんど同じ条件で3つ。学生を対象にするのと、日本のクラウドソーシング、世界45か国のクラウドソーシング(CrowdFlower)。最後だけ病院の夜勤に変更(一般的にするため)。

3実験とも美しく同じ結果を得ています。まず、それぞれの主効果は有意になる。評判Good>評判Badだし、互恵あり>互恵なしとなる。しかし面白いことに互恵条件では評判Goodと評判Badの間に差はなくなる。つまり評判の良否に関わらず高い協力意図を示す。しかも互恵なしの評判Goodよりも互恵あり評判Badのほうが協力意図は高い。当然、互恵なしなら評判Good>評判Bad。間接互恵的な評判によって協力するかどうかを判断するけれど、直接互恵的な関係は評判より優先される。

ちなみに今回は、Bの非協力が正当化されうるかどうかはコントロールしていない。つまりはBが非協力した相手がどうだったかは明示してない(2次情報は明確じゃない)。これは今後の課題とな。

言われてみれば当然だけど(自分自身への協力を観察した時点で評判をGoodに更新したといえるので)、結果がきれいに出ていて素晴らしい。

2017年6月27日火曜日

Do sincere apologies need to be costly? Test of a costly signaling model of apology.

先日の学会で雑談中に出てきた謝罪研究の話題。適当な記憶でしゃべってしまったので確認のために読む。案の定若干記憶と異なる実験設定だった。あぶねえ。

Ohtsubo, Y. & Watanabe, E. Do sincere apologies need to be costly? Test of a costly signaling model of apology. Evol. Hum. Behav. 30, 114-123 (2009).

謝罪のコストリーシグナルについて分析する。謝罪を受ける側は謝罪することのコストについて敏感に観察しているはず。実験1,2でコスト有り謝罪と無し謝罪をシナリオ実験で検討する。実験3は修正版独裁者ゲーム。架空のパートナーが不公平分配をしたのちに謝罪する。その時にメッセージを送ることにコストがかかることでコスト有り謝罪を再現する。

ザハビ先生のシグナリングセオリーはいけてるよ。人間の行動も結構説明がつく。特に謝罪というのはシグナルの信頼性が重要になるケースだ。騙そうとする表面的な謝罪を受け入れてしまうと搾取されるから。

Sender(S)とReciever(R)を考える。また協力的なScと搾取するSeも考えましょう。1ラウンドで協力的なやり取りをすればSもRもb_cを得る。しかし、Sの意図にかかわらずb_e(>b_c)をSは得ることができる。また確率wで繰り返しゲームをおこなう。またコストa(>=b_e)を払って謝罪をすることを考える。Scにとって、b_e <= a <= b_c・w/(1-w)ならScは謝罪コストを払っても関係を続けたいと思うはず。

ちょっと飛ばして実験へ。

実験1では謝罪における贈り物(補填)の効果をvignette experimentで検証。
実験2では謝罪において謝罪者の利得は減るけど、被謝罪者の利得は増えないというシナリオをvignette experimentで検証。
実験3では変形独裁者ゲーム。1000円のうち200円しかもらえなかったときに、Dictatorからメッセージを受け取る。その時のメッセージにかかるコスト(ただし参加者の利得は増えない)。

実験1:シナリオ実験です。友人に電子辞書を貸したんだけど返ってこないて宿題で不便だった。そのあと「謝罪」「謝罪+ランチおごり」を比較。
実験2:シナリオ実験。友達が金曜のバイトのシフトを勝手に参加者に代えていた。なぜなら友人は急遽実家に帰らなくてはいけないから。そのおかげで土曜の試験の準備ができなかった。友人は試験のことは忘れていた。コスト条件では友人はフライトの予定を変更して謝るために早く帰ってきた。コスト無条件では通常のスケジュールで戻った。
実験3:Dictatorゲームで参加者は200/1000という不公平分配をされる(ただしコンピュータによるランダムな選択)。その後Dictator側が自らの利得を500減らすというコストを払って謝罪メッセージを送るか(参加者の利得は増えず)、もしくはコスト無謝罪を受け取る。

1,2,3ともコスト有りが謝罪の誠実さを高く評価している。

この後にいくつかの検証実験もやっている(自分にだけコスト有り謝罪した場合とか)。結論としてはコストリーシグナルはとても有効だと。

(コスト,ベネフィット)について(0,0)<->(0,1)の比較と(0,0)<->(1,0)の比較をしているけど本当は(1,0)<->(0,1)を比較したいところだ。更には平面全体に拡張できたら面白そう。ただ比較可能な軸に乗せるのは大変そうか。

2017年6月10日土曜日

間接互恵で2次情報を扱った実験研究レビュー

来週出発の学会のポスター。著者欄しか埋めてない。5分間トークが当たってほしかったのによりによってポスター。最近学会発表が億劫でしょうがない。現実から逃げられるなら何でもいいので別件でやらなくちゃと思っていたレビューをざっと。

間接互恵では2次情報の扱いが重要だけど実験でどんなのがやられているのか。なんとなく「2次情報まで人は使うのか?」「2次情報がある前提ならどう使うのか?」「2次情報は協力を促進するのか?」というアプローチがありそう。

2次情報まで人は使うのか?

Milinski, M., Semmann, D., Bakker, T. C. M. & Krambeck, H.-J. Cooperation through indirect reciprocity: image scoring or standing strategy? Proc. R. Soc. B Biol. Sci. 268, 2495-2501 (2001).

匿名で繰り返しのギビングゲームをやって、提供・拒否をカウントしていく。拒否された率を測るのだが、周りがIS的と(つまり提供者へは提供、拒否には拒否)と振舞っていると想定したときの推定値とほぼ同等の拒否され率。ただしST(シンプルスタンディング)的と想定した拒否率とは大きく乖離している。よって2次情報はほとんど使われずIS的に振舞っている。

真島理恵. 間接互恵性状況での人間行動, in 「社会の決まり」はどのように決まるのか (ed. 亀田達也) 117-147 (勁草書房, 2015).

ランダムマッチでは、CtoG,CtoBに差はないが、相手選択が可能なときにはCtoG>CtoBとなる。つまりランダムマッチングではIS的に振舞い、2次情報を使って寄付する相手を選ぶ。相手選択可能な実験状況ではDtoBが外されているので、SH(GBBB)、SJ(GBBG)のいずれかは分別できない。(少なくともST(GGBG)ではないということになるのかな)

Swakman, V., Molleman, L., Ule, A. & Egas, M. Reputation-based cooperation: Empirical evidence for behavioral strategies. Evol. Hum. Behav. 37, 230?235 (2016).

実験で1次情報・2次情報も見れる状況を作る。2次情報にコストがある場合、無い場合を用意。主要な結果は、a) 1次の協力(C/D)が主要な効果を持つ(Cには提供するしDには提供しない) b) 人は2次情報をよく使う(人によってはコストがかかっても) c) とくにDの時の2次情報(DtoB/DtoG)をよく使い、DtoBは報われる(正当化される裏切りはOK)d) 個人差でかいよね。


2次情報がある前提ならどう使うのか?

真島理恵 & 高橋伸幸. 敵の味方は敵? 間接互恵性における二次情報の効果に対する理論的・実証的検討. 理論と方法 20, 177-195 (2005).

CtoG,CtoB,DtoC,DtoBまでの4状況を評価させる。評価指標としては「お人よし」「社会的適切さ」「関係重視」「他者からの評価予測」「提供行動の意図」。CtoBはお人よしと評価されるが、社会的適切さは低い。提供意図については CtoG>CtoB, DtoB>DtoCとなる。(つまり2次情報は使っているしどちらかというとSJ的ということか)

鈴木貴久 & 小林哲郎. 評判生成規範の類型がパーソナル・ネットワークのサイズに及ぼす効果. 社会心理学研究 30, 99-107 (2014).

CtoB、DtoBの2シナリオを評価させて平均より高いか低いかでG/Bとわけることで人をSH,SJ,IS,STに割り振ってサポートネットワークのサイズを従属変数にする。CtoBの主効果が有意。つまりCtoBをBadと判断する人はサポートネットワークのサイズが小さい。SH,SJ的な人は世間が狭いよ、と。

2次情報は協力を促進するのか?

Bolton, G. E., Katok, E. & Ockenfels, A. Cooperation among strangers with limited information about reputation. J. Public Econ. 89, 1457-1468 (2005).

0次、1次、2次と情報を増やすことで協力率は増加する。ただし協力コストが高いときにだけこの効果は確認できる

Ule, A., Schram, A., Riedl, A. & Cason, T. N. Indirect Punishment and Generosity Toward Strangers. Science. 326, 1701-1704 (2009).

2次情報じゃないけど、ギビングゲームに「提供」「拒否」に加えて「懲罰」を導入する。懲罰を選ぶとコストを払って相手の利益を減らせる。さて、懲罰はコストがかかるのだが実際に相手の利得を減らせる「実懲罰」と実際は合いの手利益が減らない「象徴罰」で比較すると象徴罰では裏切りが最も利得を上げるけど、実懲罰ではImage rewarderが一番利益をあげる。(ちょっと二次情報ダイレクトの研究ではないかも)

2017年6月6日火曜日

アップストリーム互恵シミュレーション編

ペイイットフォワード祭りその4。シミュレーションでPIFが進化するかを検討するもののうち匿名TFT的な戦略を扱っているもの2つ。ざっくりと。

Pfeiffer, T., Rutte, C., Killingback, T., Taborsky, M. & Bonhoeffer, S. Evolution of cooperation by generalized reciprocity. Proc. R. Soc. B Biol. Sci. 272, 1115-1120 (2005).

モデルとしては繰り返しPDを使う。少数のグループ内での繰り返しを想定するけど、今回の特徴は毎回グループ内で相手が変わり、相手についての情報は記憶しない。戦略は、前回の利得がR,S,T,Pのいずれだったかに対して次回の協力率p1,p2,p3,p4を持つ。つまり協力するかどうかは今回の相手とは関係ない。でシミュレーションすると(1,0,0,1)というA-PAVLOVが最終的に安定な戦略になる。

Barta, Z., McNamara, J. M., Huszar, D. B. & Taborsky, M. Cooperation among non-relatives evolves by state-dependent generalized reciprocity. Proc. R. Soc. B Biol. Sci. 278, 843-848 (2011).

今度はギビングゲーム。N人集団をM人集団に分割してランダムにギビングゲームをおこなう。モデルの特徴はほぼ同じで、戦略としては協力するかどうかを確率Pでもって、前回のゲームでもらえたらプラス、そうじゃなきゃマイナス。でそのインクリメント/デクリメント幅もそれぞれ戦略として持つ。結果、グループが小さければ協力が進化してほぼTFTのような戦略が支配的になる。

両方ともグループサイズを小さくすることで評判が無くても協力が進化するから、これは従来の間接互恵というよりgeneralized reciprocityだよね、と。そうなんだけど、そうなんだけど、グループが小さければ結局のところ直接互恵と同じ効果が出てくるのでは。なんか読み間違えてるのかな。

2017年6月2日金曜日

制御焦点と集団内における社会的交換 ‐寄付シナリオ実験による検討‐

二匹目のドジョウと言うか落穂拾いと言うかちょい足しレシピと言うか、そういう論文のイントロをうまく書ける能力がほしい。最後の段落しか変えるところないよ。

それはそれとして、ペイイットフォワード祭りその3。

佐藤有紀 & 五十嵐祐. 制御焦点と集団内における社会的交換 ‐寄付シナリオ実験による検討‐. 名古屋大学大学院教育発達科学研究科紀要 61, 37-45 (2014).

制御焦点理論(要するに人の思考の方向をプライムしてその方向によって行動が変わる)を使って寄付シナリオ実験の結果が違うよ。つまりは、制御焦点のコントロールによって自身の寄付額も異なるし、他者の寄付額に対する期待値も変わる。

さて制御焦点理論。2つあって、利得の存在に接近して利得の不在を回避しようとするのが「促進焦点」。もう一つは、損失の不在に接近して損失を回避しようとする「予防焦点」。

促進焦点は利益へのポジティブ認知、リスクテイキング、抽象的情報処理、変化への選好を駆動する。予防焦点はコストへのネガティブ認知、リスク回避、具体的局所的情報処理、安定選好を駆動する。

ということで制御焦点によって社会的交換状況におけるコスト認知や利益への認識等を変化させるから協力行動にも変化を与えるであろう。

社会的交換状況で考えるのは3つ。直接互恵(DR)、ダウンストリーム的間接互恵(ここではSocialized Indirect Reciprocity:SIR)、アップストリーム的間接互恵(ここではGeneralized IR:GIR)。

制御焦点と社会的交換の関連をいろいろ見つつ立てる仮説は3つ

  1. 促進焦点のほうが予防焦点より寄付額が大きい
  2. 促進焦点ではDR,SIR,GIRどの状況でも自身への返報期待額を大きく見積もる
  3. 促進焦点ではDR,SIR,GIRの返報期待額は同程度だが、予防焦点においてはDRの時だけ高くなる

実験いきます。(そうそうどんなシナリオでアップストリーム/ダウンストリームを実現するかが知りたかったのですよ)。

まずは制御焦点を操作。促進焦点では「こうありたいという理想形を自由記述、予防焦点では「こうあるべきという義務について自由記述」。更には迷路課題でゴールに報酬イラストがあるもの(促進)と、スタートに脅威イラストがあるもの(予防)を準備。(こんな簡単に制御できるのかいな)。

さて問題の寄付シナリオ。まずは「知り合いではないが同じ大学の学生が自然災害で被災して金銭的に困窮する」というシナリオで「自分が自由になるお金(10万円)のうちいくらを寄付するか」を回答。続いて、その行為が評判として公開(学内の広報誌にとりあげられる)としてDR:将来自分が被災したら今回の被災学生は自分にいくら寄付してくれるか、SIR:将来自分が被災したら大学内の第三者の学生はいくら寄付してくれるか、GIR:将来、大学内の第三者の学生が被災したら今回の被災学生はいくら彼に寄付するか、という3つの互恵性場面の期待額を回答。

結果どーん。

まずは個人要因(一般的信頼)とかは寄付額とかに影響与えてなかった(え、そうなの?)。

  • 仮説1:促進焦点と予防焦点で自分の寄付額は、異なります。圧倒的に促進焦点のほうが多額を寄付すると答えている。めでたく仮説1はOK!
  • 仮説2:返報期待額もDR,SIR,GIR全てにおいて促進焦点が高い。仮説2もOK!
  • 仮説3:予防焦点においてDRだけが高くなることはなかった。また促進焦点内ではGIRの値が高くなった。仮説3は残念!

いやーきれいに出るもんだなぁ。うらまやしい。寄付シナリオでアップストリーム・ダウンストリームをコントロールするやり方としては面白い。

限界としては、焦点のコントロール群を用意しなかった。操作チェックも行ってない。被験者内部分(DR,SIR,GIR)でカウンターバランスとってない。普通の投資ゲームでも成立するかは、まあ今後の課題でしょう、と。

PIFでは総じて感謝(Bartlett and DeSteno,2006)とか、共感(Watanabe, et al.,2014)とかの感情生起が要因だと言っているのが多い感じなのかな。今回の促進焦点もまあプラスの感情のプライミングではあるし。さて。どうしたものでしょうか。

2017年5月30日火曜日

被援助者による第三者への向社会的行動の生起過程に関する検討


ちょっと早めに近所のバーに行くかなと思って来たら、先客1名の年配男性が微妙にすすり泣きながら飲んでる。店内にはバーテンダー含め3人。し、仕事のふりをしよう。アップストリーム祭りその2。実験結果だけ見ていた論文をもう一度読む。

Upstream互恵を、ジレンマのフレームではなくて援助行動研究の知見を使って分析するよという論文。

相川充, & 吉野優香. (2016). 被援助者による第三者への向社会的行動の生起過程に関する検討. 筑波大学心理学研究, 51, 9-22.

恩送りって間接互恵の一種だけど不思議だよね。間接互恵のDownstream型は今までわんさか研究がある。行動が評判として共有されることが協力を促進するというメカニズムも明確だ。実験もたんまりあるし理論もたっぷりだ。他方Upstream互恵は評判みたいなメカニズムも提示されてないので一体それは何なのかよくわかってない。Upstream互恵が存在することは(Barlett & DeSteno,2006)で示されてたりする。また直接互恵が働く環境で観察されるだけだという主張もある(Nowak & Roch, 2007)。(ついでに最近のHorita et.al., Sci.Rep., 2016ではALLCが隣合わさっただけじゃんという主張をしている)。

つーことでUpstream互恵がどうして生じるのかは良くわかっていない。Upstream互恵は要するに「過去に受けた協力を認知してそれを誰かに対する行動として発現する」ということなんだから、ここを詳しく見ます。フレームとしてはこれまで多くやられていた援助行動研究の知見を応用するよ。ということで、被援助経験がどのように認知されて、向社会行動に結びつくのかを構造方程式モデリングでやります。

んー、援助行動てそのまま互恵性にぴったり当てはめられるのかいな。まあ利得構造自体はそのとおりなんだろうけど、以前読んだ行為者の視点(どういうゲームと認識しているか)も検討しないとずれそうな予感もある。まあいいや、続き。

被援助者は助けられることで2種類の感情を生起するだろう。感謝や誇りというポジティブ感情、負債感や自尊心の傷つきなどのネガティブ感情。いずれも結果として向社会的行動に向かうと考えられるが、前者から考えられるのは互恵的意識による行動、後者は返礼意識による行動である。つまり被援助経験のときに生起した感情によって向社会的行動をドライブする動機が異なるでしょう。ということで構造方程式を次のように立てます。

被援助経験→感情体験→動機(互恵的動機/返礼的動機)→向社会的行動

なお、動機に直接影響を与える要因として「援助規範意識」「共感性」という個人特性も加えます。

さて調査。質問紙&場面想定法で行きます。まじかー、いや自分もゼミでやるとなると場面想定くらいしか使えないんだけどこのテーマでそれは大丈夫なのかいな。いや今の無し無し。超特大ブーメランだ。

被援助体験:過去二週間で一番印象に残る被援助経験
感情生起:その時に生じた感情について8項目で
6種類の援助場面での向社会的行動の意図:分与、緊急事態の援助、努力を必要とする援助、迷子等への援助、社会的弱者への援助、小さな親切

結果行きます。率直に読むとパスモデルは成立していない。まずは被援助体験がネガティブ感情を生起していない、また感情生起がいずれの動機へも影響を与えていない、個人特性である規範意識が動機をドライブしてそれが向社会的行動につながる。あとは感情生起がそのまま行動につながる。考察では綺麗には出なかったねと言いつつも、「感謝」は向社会的行動につながるので、被援助体験→感謝→向社会的行動というパスは頑健に成立する。つまりは感謝がUpstream互恵の媒介要因だ、と。なるほど、いや、うん?要するにBartlett&DeSteno,2006が再現dということなんだよな。

Upstream互恵を心理的メカニズムで追い詰めようというのは面白かった。結果がいまいちだったのは場面想定の弱さもあるけど、Upstream互恵が単独では生じ得ないことの傍証にもなっているのではなかろうか。

2017年5月27日土曜日

Gratitude and Prosocial Behavior

Pay-it-forward祭りその1。2くらいで終わりそうだけど。実験ではPay-it-forwardが存在することが示されているという文脈で多くの論文に引用されているキー論文ぽい。Google Scholarで705件の引用。いいなぁ、そういう論文を書いてみたいものだ。

Bartlett, M. Y. & DeSteno, D. Gratitude and Prosocial Behavior. Psychol. Sci. 17, 319–325 (2006).

感謝が向社会行動を形作ると。これまでの研究でも感謝が向社会行動を増加させることは報告されているけど、媒介要因としての効果はちゃんとわかっていないからビシっと実験で示しましょう。

【実験1】
被験者は2人一組にされるけど実は一方はサクラです。いろんな作業をやった後(この作業もどうでもいい)に3つのコンディションを作る。

  • 感謝:被験者のモニタが突如映らなくなって困るけど、実際にはサクラがコードを引き抜いている。実験者が呼ばれて、最初からやり直しだねというんだけどサクラはエラーの原因を探す。するとサクラはコードが緩んでいることに気づいて問題を解決する。被験者はやり直さなくてもよくなる。
  • 娯楽:作業が終わった後に娯楽作品(Saturday Night Live)を見る。サクラは楽しかったねーと盛り上がる。実験者はビデオを見せたことを正当化するために作品内で出た単語とかを質問する。
  • 中立:作業が終わった後にサクラと被験者で、これなんの実験なんだろうねぇとか話す。

これらがおわったら感情評定を行う。もろもろが終わった後に、サクラがおもむろに被験者に近づいて手伝ってほしい(30-60分くらいのサーベイ)と申し出る。メインの従属変数はどの程度の時間手伝ったか。拒否ったら0分。

結果いきます。感謝を媒介変数にする媒介分析します。予想どおりに感謝を媒介して援助行動(手伝う時間の長さ)が増加している。

【実験2】
もし感謝が援助行動を決めるのであれば、感謝条件の人は、恩人も他人も区別なく助けるだろうし、互恵性規範が原因なら他人(何の助けもしてないひと)には中立条件と変わらない程度しか助けないでしょう。ということで実験1の2条件(感謝・中立)に加えて最後に助けを求める人をBenefactorとStrangerにして実験します。えーと中立のBenefactorて誰だ?サクラのことか?まあそう理解しよう。

結果。援助要請者の主効果ばっちり有意(条件によらずBenefactorに高い援助を与える)、条件の主効果もバッチリ有意(相手に寄らず感謝条件で高い援助)。交互作用はなし。つまりは互恵性じゃなくて感謝がやっぱり有効だ。

【実験3】
実験2の効果をさらに検証するために、Strangerであることを明確にする(実験者がこの人は実験のパートナーだったっけ?と聞く)条件を追加。結果。やっぱり感謝条件なら助けている。

これらの実験を通じて感謝が向社会行動の強い証拠になっていることをみつけたぞ。うんぬうかんぬん。

これ、Pay-It-Forwardの証拠にしていいのか・・・?感謝によって互恵的な相手以外にもコストをかけて助けているからPIF的とはいえるのかあ。確かに受けた恩に対する感謝が生起すれば、他者に対して助けているんだからPIFといえるけど。

例えば、恩を受けるけど恩人は別に報酬を受け取っていて感謝する必要がない状況でもPIFは生じるか、とか。あ、もしかして面白い?けどこの実験状況つくるの超大変だ。

2017年5月22日月曜日

貢献感と援助要請の関連に及ぼす互恵性規範の増幅効果

落ちた科研の評価はBだった。かすってもいない。ええ、ええ、どうせ新規性のない実行の能力もない社会にも貢献しない研究者です。

集団に対する貢献感と援助要請には正相関があり更には互恵性規範がその相関をブーストするという論文。

科学への貢献の低い私はお金の援助要請を抑制するのが道理だ、と。やさぐれながら読む。

橋本剛. (2015). 貢献感と援助要請の関連に及ぼす互恵性規範の増幅効果. 社会心理学研究, 31(1), 35–45.

利他行動の中でも援助行動に着目する。ヒトは援助要請がなくても他人を助けたりする利他行動をとることがある。それはおそらく他者の心理推測であろう(心の理論とか)。そのように援助者として被援助者の心理を推測できるなら逆もありうるでしょう。そして援助されることを望んでいるにも拘らず援助要請を抑制する「遠慮」はその表現形のひとつだ。ということで「人間はなぜ援助要請を抑制するのか」を分析するよ。(互恵性の研究だと思ったら援助行動のフレームだったか)

互恵的協力の理論から考えると相互援助が生じると考えられるし世の中にも普通に援助したりされたりは存在する。けれども援助要請の抑制(遠慮)が発生する理由にはいくつかの理由が考えられる。1.自尊心・問題の深刻さ・スティグマなどなど。2.要請コスト>被援助利益という大小関係。これには否定的回答による不利益や秘密漏洩などの様々な要因がありうる。しかしながら被援助者は援助者の利得も考慮するんじゃないか。つまり援助者にとって高コストな援助要請は心理的な負債をもたらすので援助要請が抑制される。

更には、そうした高コスト要請を繰り返してさらに相手に返報できなければ、間接互恵的に考えてもフリーライダーとみなされるリスクも高まる。逆に言えば返報可能であれば援助要請は促進されるはず。

ということで被援助者(援助要請者)の貢献感と援助要請傾向に正相関があることを検証しましょう。

当然互恵規範も考えなくてはいけないけど互恵規範を考えるときには注意が必要だ。つまり、互恵規範が高ければ常に援助するという正方向だけではなくて、互恵規範が高ければ返報のない援助はしない、援助されなければ援助しないという向きも考える必要がある。よって互恵規範が低ければ先の貢献間と援助要請傾向の相関は弱まるし互恵規範が高ければ正相関は強くなるだろう。

ということで仮説。

  1. 貢献間と援助要請傾向には正の相関がある
  2. この相関は互恵規範によって強化される

調査行きます。場面は職場の対人関係、調査会社のモニターを使ったweb調査。有効回答500。「貢献感」職場における自身の貢献度を主観で聞く。「互恵性規範」職場に存在する互恵性規範を聞く。自身のではなくて職場の雰囲気で聞いて集団の規範を推定させる。「援助要請意図」悩みを一人で解決できそうにないときにどの程度相談するか。

さて結果。まずは互恵性規範の因子構造が2つである。「職場では助けてもらったら返報が必要だ」という「返報必要」因子と「職場では貸し借りは気にしなくてよい」という「返報不要」因子が抽出された。複数の人で構成される組織なら相反する規範が併存するのは妥当であろう。(やっぱりこれだけシンプルな規範でも混在するのだから2次情報を使う間接互恵規範の共存は当然と考えられるか。よしよし。それにしてもこれだけ正反対の規範で2因子になるのか)

ではメインの結果行きましょう。仮説1の貢献間と援助要請意図の相関ですがバッチリでますr=.30(p<.001)。仮説2の互恵性規範によるブースト効果は、互恵性規範が2次元なので4つにわけて分析したら「返報必要が高く、返報不要が低い(つまり互恵性が超強い)」組で貢献間によるブーストが顕著にでていた。仮説2もオッケー。

将来的な展望としては文化差とか関係流動性とかを取り組みます。

んーとでも「返報必要低、返報不要高」という無礼講的組織で一番援助要請が高くなる気がするんだけど「必要高・不要高」で援助要請意図が一番上に来ている。これはなんでなんだろう。規範の混在についてはあまり深く突っ込んで議論してないからしょうがないか。

なるほど、互恵性規範の強い社会では貢献度が低いヒトは生きにくいと。いやあ確かにしみじみと身に沁みます。援助意図も併せて聞いて、貢献度の低いメンバーへの援助が互恵性で抑制されちゃったりするとなかなかのディストピアだ。それにしてもアップストリーム互恵を調べてるとどうしても援助行動・被援助行動のフレームのほうが見つかるなあ。あとやっぱり規範の混在は面白そうだ。どっから取り掛かるといいんだ。

2017年5月18日木曜日

直観と熟考を協力の進化に取り込む論文2つ

直観と熟考の認知モデルを進化ゲームに取り入れるというアプローチ。連続でPNASとProc. R. Soc. Bに載せるというすんごい人たち。溜息しかでない。共著者グループ内で当然知ってるという前提で議論が進んでるけど、まったく読んでなかったのでこっそり読む。こそこそ。

Bear, A., & Rand, D. G. (2016). Intuition, deliberation, and the evolution of cooperation. Proceedings of the National Academy of Sciences, 113(4), 936-941.

「直観」と「熟考」の効果をジレンマに理論的に取り入れる。システム1、システム2の働きは近年とても注目されているし、協力の進化に与える影響も議論を呼んでいるところだ。伝統的な進化ゲーム理論では行動には着目してきたが認知のことはまだまだうまく取り入れられていない。ということで認知のデュアルシステム(直観と熟考)を取り入れたモデルを作ります。

ゲームはPDで確率pで繰り返しゲーム、1-pでワンショットゲームとなる。エージェントは自身の戦略としてT(直観モードか熟考モードかの閾値)を持つ。ランダムに与えられるコストdがTより小さければコストdを払って熟考モードとしてプレイするが、逆の場合はコストを払わず直観モードでプレイする。また、直観モードの時はどちらのゲームでもs_iの確率で協力する。熟考モードではワンショットゲームだったらs_1、繰り返しだったらs_rで協力する。

さて均衡戦略は何かというとIntuitive Defector(T=0:常にに直観モード、s_i=0:確実にD)は均衡となる。しかし何ということでしょうDual-process Cooperator(T=c(1-p)、s_i=1,s_1=0,s_r=1:直観モードで協力、熟考では繰り返しのときだけ協力)も均衡なんです。

Bear, A., Kagan, A., & Rand, D. G. (2017). Co-evolution of cooperation and cognition: the impact of imperfect deliberation and context-sensitive intuition. Proceedings of the Royal Society B: Biological Sciences, 284(1851), 20162326.

そして立て続けに第二弾。さらには状況に不完全さを導入。ゲームも2タイプ(ジレンマ、コーディネーション)に拡張、それぞれのゲームでの協力率を戦略として持つ。

エージェントは直観モード閾値Tと、各状況での協力率4つを戦略として持つ。直観・ジレンマの時の協力率S_iD、直観・コーデS_iC、熟考・ジレンマS_dD、熟考・コーデS_dC。

まずは認知プロセスで前の論文と同じようにTで直観モードか熟考モードに分岐。続いて確率pでゲームの種類がわかれる。今度は繰り返しかどうかではなくて、ジレンマゲームかコーディネーションゲームに分かれる(pでコーディネーションゲーム)。続いて、直観モードの時にはy_iでゲームを正確に理解し、ジレンマならS_iD,コーデならS_iCの確率で協力する。一方1-y_iで使う確率が逆転してしまう。熟考モードでも同様(y_d)。y_i,y_dは環境パラメータ。

そうすると均衡戦略は4つになる。ID(T=0,S_i*=0), IC(T=0,S_i*=1), Dual-Cooperator(T>>0, S_i*=1, SdD=0, SdC=1), Dual-Attender(T>>0, S_iD=0,S_iC=1, SdD=0, SdC=1)。

まずはpを動かして均衡戦略を見てみる。y_i,y_dの組み合わせで均衡戦略の相が変わる。例えばy_d=1, y_i=0.5ではp<0.3でID、それ以外ではDCが均衡。一方ID,IC,ICの場合とか、ID,DA,DCの場合とかがある。でパラメータをいろいろ動かして相図を見てみます。

最後にまとめとして、deliberationの効果をみるとジレンマに対してはDCもDAも協力を減らす効果、一方コーディネーションについてはDAが協力を増やす効果。

詳細は読み飛ばしたけど認知の二つの仕組みをモデルに取り込むやり方としてはシンプルで格好いい。さすがだなぁ。直接バッティングはしないけど認知プロセスをモデルに取り込まなくちゃだめだよねという良い先行事例になりそう。

2017年5月15日月曜日

評判予測と規範遵守行動の関係:関係流動性に着目して

科研費の報告書作成があまりに面倒なので現実逃避気味に読む。今年落ちたから来年は報告書を書かなくていいという幸せ。幸せ?

最近めっきり間接互恵のシミュレーション&数理にはまっているので実験アプローチにもちゃんと目を通さなければ。

岩谷舟真, 村本由紀子, & 笠原伊織. (2016). 評判予測と規範遵守行動の関係:関係流動性に着目して. 社会心理学研究, 32(2), 104-114.

規範を「集団や社会でメンバーに対して期待されている行動についての規則」と定義しよう。また、自身のある行動が評判としてGoodと評価されるかBadと評価されるかを予測することを評判予測とする。Good/Badの2側面に分けて、かつ集団の関係流動性によって規範へのコミットを分析するよ。

関係流動性が高ければ新しいパートナーと関係を結ぶ機会が多いからポジティブな評判へのインセンティブが高く、逆に関係流動性が低ければ関係から排斥されるダメージが大きいためにネガティブ評判を避けるインセンティブが高いだろう。ということで、関係流動性が高い環境ではポジティブ評判の効果(利得)を高く予測するものほど規範にコミットするだろう。他方低流動な環境ではネガティブ評判の効果(損失)を高く評価するものほど規範にコミットするだろう。

題材としては地域活動(美化、防災、お祭り)への参加要因で検討する。もちろん自発的(個人特性)によっても規定されるだろうけど規範の影響もあるよね、というのをコミュニティへの参加要因の論文などから引きつつ若干エクスキューズ気味に展開。ここまで丁寧にやらんとダメなのかぁ。まあ地域コミュニティは社会的ジレンマ、イエスオッケーというのはごく一部のジレンマオタクだけか。

さて、今回は評判「予測」に着目するのだが予測は実際の評判の獲得を正しく推測しているのだろうか。そんなことはなかろう。つまり例えば低流動性社会で実際に評判が低下すると大きな損失になるので、評判の低下を過剰に見積もるだろう。逆に高流動性社会で評判の獲得ができないと大きな機会損失となるので、評判の向上を過剰に見積もるだろう。(や、やばい自分のネタが古びるまえに出さなくては)

つーことで仮説まとめます。

  1. 高流動性社会ではポジティブ評判の効果を高く見積もるなら規範遵守(自身がDonorの時の評判予測)
  2. 低流動ではネガティブを高く見積もると規範遵守(自身がDonorの時の評判予測)
  3. 高流動では規範遵守者を高く評価、低流動では規範逸脱を低く評価(Observerとしての評価戦略)
  4. Observerとしての評価の上昇・下降より、Donorとしての評判予測のほうが過剰

実験行きます。対象は墨田区。なぜなら今でも地域活動が盛んだから。まじか!でも確かに地域活動は盛んみたいだ。町会の活動が超しんどいという噂を聞いた。下町人情の闇・・・。選挙人名簿を使った二段階確率比例抽出で郵送でやります。有効回答は163で27.3%。ちなみに関係流動については主観的な評価を用いる(「地域の人たちは、人々と知り合いにな る機会がたくさんある)。個人特性は賞賛獲得欲求・否定的評価回避欲求を使う。あとは自身の行動による評判予測と、他者の行動への評価、そのたいくつかの統制変数。

メインの結果。地域活動への参加頻度を従属とする重回帰をやった結果、仮説1,2の評判の上昇(低下)予測×関係流動性の交互作用では、低下のほうだけ交互作用あり。低下予測と流動性の交互作用では、高流動群で低下予測と参加頻度に関係はないが、低流動群では低下予測が大きいほど参加頻度が高い。つまりは仮説2はOK!ただし仮説1(上昇予測と流動性)の交互作用はダメ。続いて、自身の評価戦略が評判予測と関係しているかを見ます。まずポジティブに評価するかどうかは、流動性やその他の変数とは関係なかった。逆に、ネガティブに評価するかどうかは低流動であるほど、居住期間が長いほど逸脱者への評価を下げる。仮説3は一部OK。更に続いて過剰評価について。(ドキドキするなあ)自身の逸脱で評価が下がる程度(評判予測)は他者の逸脱で評価を下げる程度(自身の評価戦略)より大きい。つまり過剰予測。逆に、自身の遵守で上がる評判予測は、自身の評価戦略より小さい。つまり過小予測。(おお一致する)

まとめると低流動におけるネガティブ評判は大きく評価されるが、高流動におけるポジティブ評判はそうでもなかった。


いやあなるほど。これは1次情報をどう扱うかを自身の評価に対する予測と他者への評価で分析しているけど、2次情報まで使う規範の実験アプローチはまだまだいけそうだ。そもそも2次情報の扱い方をちゃんと分析した実験アプローチはどの程度あるんだろう。