2018年3月15日木曜日

日常生活における第三者を介した資源の衡平性回復行動

祭りじゃ祭りじゃ現実逃避祭りじゃ。沖縄にいるあいだに絶対完成させなくちゃいけないのに。。。

Upstream祭り2018その2。中島・吉田(2009)と同じ著者の1年前の論文。2009年は経済実験でやってるけどこちらは日常生活のシナリオ実験。

中島誠 & 吉田俊和. 日常生活における第三者を介した資源の衡平性回復行動. 社会心理学研究 24, 98-107 (2008).

イントロはざっくりと。衡平理論(人が関係の中で利得の帳尻を合わせて自分の資源を一定に保とうとする)は負の方向(搾取されたら第三者からの搾取をおこないやすい)を強く予測するが、正の方向には起こりにくいと予想する(自己利益最大化になるので効果が弱い)。

でも実際には正の提供行動の連鎖は起こっている。多くは間接互恵などの枠組みで説明されているが衡平理論で説明したのは少ない(そりゃそうだ)。本研究ではこれにチャレンジする。さらにこれまでは金銭的な交換における衡平理論の検証が多かったけどここでは日常における非金銭的な交換について着目する。

仮説行きます。

1.不衡平(過小/過大)な分配をうけると怒り/罪悪感を感じ、続いての第三者への分配で過小/過大な分配をして衡平を回復する
2.過大な分配を受けた後では、金銭的な分配よりも援助的な分配のほうがおおくおこわなれる
3.第三者への衡平性回復は、直接返報の時よりも弱い

シナリオは場面想定で「店を出ようとしたら傘を誰かが持って行ってしまった。おっとそこに傘がある。持っていくか?(過小)」「店を出ようとしたら雨が降ってきて傘がない。すると誰かが傘二本あるからどうぞと貸してくれた。その後、誰かが雨宿りしてた。自分は二本持ってる。差し出すか?(過大)」(こ、これちゃんと目的に合致した操作になってるのか?特に自分が傘を持ってくの衡平性の回復になるのだろうか)。

金銭のほうは「同じ労働をして相手に分配権がある。そして相手が2000/3000で分配した(過小)、もしくは3000/2000で分配した(過大)。次にあなたに分配権がある。どのように分配するか?」(これは次の論文の実験で綺麗に経済実験に拡張されている)。

金額場面では仮説は基本的に支持されているが、傘場面では微妙。やっぱり傘場面は無理があるのではなかろうか。仮説2の二つの場面の比較もちょっと厳しそう。これは金銭と援助の差とは言えないような。

あと傘場面で、搾取されたほう(過小)が援助を受けた時(過大)より第三者への提供意図が高くなっている。なんで?と思ったけど搾取場面では、第三者へ提供するかどうかではなくて第三者の傘を搾取するかどうかを逆転して提供意図得点にしてるのか。だから搾取場面での提供意図が高いと(つまり搾取されても盗まないよということ)。いやー、うー。やっぱり無理がないかな。

金銭場面は次の実験とも綺麗につながってるけど日常生活場面の設定は無理があるような気がする。

そして、この時点では正当世界信念は使ってないのか。むしろ使ったら傘場面面白いかもしれないのに。

2018年3月13日火曜日

第三者を通して行われる衡平性回復行動

Upstream祭り2018。季節に一度の祭りでどうするよ、おれ。いま考えてるUpstream実験とほぼおんなじ設定のようないやな予感。約10年前。ひー。

目の前の仕事から逃げるために読む。

中島誠, & 吉田俊和. (2009). 第三者を通して行われる衡平性回復行動:報酬分配場面における実験研究. 実験社会心理学研究, 48(2), 111–121.

衡平理論というのがあるそうな。人が関係の中で利得の帳尻を合わせて自分の資源を一定に保とうとするということ。たとえばMoschetti & Kues(1978)では他者Aから不当に低い報酬を得た参加者は、続いての状況で他者B(第三者)に対する分配者になったときに自分に過大な報酬を分配するという結果をだしてる。逆に援助や向社会行動も衡平理論の一側面だろう(ん?そうなのか?)。

報酬の分配のレビュー(古川,1988: 田中,1991)では分配行動に与える要因は(1)個人内(2)対人(3)状況(4)文化の4要因で整理している。一方で、Major&Deaux(1982)は分配の個人差を(1)規範(2)対人関係の指向性(3)情報処理過程で説明してる。ここでは規範と公正感に着目する。それぞれ援助規範意識と正当世界信念(Lener,1980)を用いる。正当世界信念(以下BJW)は「正の投入には正の結果が、負の投入には負の結果が得られる」と考える信念。BJWが高い人は不合理に対する怒りを感じにくいという指摘もあるのでこれに倣ってBJWの高い人は不公正な被分配をうけても、第三者には衡平に振舞うだろう。

ということで仮説は三つ。

  1. 人は不衡平には怒り、過大な分配には罪悪感を抱く。また衡平に分配された被分配者は衡平に第三者へ分配し、不衡平な被分配を受けたものはそれを回復するだろう
  2. 規範意識が高いと不衡平分配に対する怒りが強く、過大分配に罪悪感を抱く。また過去に不衡平分配をうけても第三者には衡平に振舞う
  3. BJWが高い人は過小への怒りが少なく過大への罪悪感が小さい(結果を正当と判断する)。また過去に不衡平分配をうけても第三者には衡平に振舞う

実験はペアで簡単な作業をさせた後に報酬を分配する。参加者は必ず被分配側になる。分配者は実験者が用意するサクラで、過小、衡平、過大な分配を受ける人たちにわけられる。この時点で情動を計測。続いて相手を変えて第二回を行うが今度はかならず分配者になる。配分額と情動を計測。ついでにさっきの相手と同一人物だったらいくらにするかを聞く。

情動については、過小で怒り、過大で罪悪感はまあうまくいってる。BJWについては高い人が過大な被分配で罪悪感が小さくなる(正当化している)。

分配額について。規範意識が高い群では過小利得を受けた後の分配額がより衡平であった。過大利得の時には差がない。BJWではこの傾向が見られず(BJWによって行動はかわってない)。

全体として過小利得・過大利得でそれぞれどう振舞うかを分析すると、過大利得に対しては高い第三者への分配を、過小利得に対しては第三者へ低い分配をしている。特にもし同一人物だったらというときにはそれが顕著になる(論文の図、たんぶん逆だな)。

要するに行動レベルでは規範意識は効いているけど、正当世界信念は効いてなかったと。一方で実験やって情動をとってるので、情動レベルではちゃんと反応しているようだ。あと過大利得を受けた後に過大に分配するというUpstreamはみられなかった、と。あれ、これはどうやって測ってるんだ。ちょっとわからなかった。

いやぁ。やっぱり似たことをすでに思いついている人はいるもんだ。勉強になった。

2017年12月20日水曜日

間接互恵性のモデルを複雑ネットワークでやる祭り

もう2017年が終わるとかなんかの間違いだ。3月に論文が出て以降の研究の進まなさっぷりもなんかの間違いだ。痩せないのも。

間接互恵のネットワークモデルがどんなものなのかをボチボチ探してたらReseachGateかなんかで推薦されたので。

Peleteiro, A., Burguillo, J. C. & Chong, S. Y. Exploring Indirect Reciprocity in Complex Networks using Coalitions and Rewiring. in Proceedings of the 2014 International Conference on Autonomous Agents and Multi-agent Systems 669-676 (2014).

2014年のAAMAS論文とな。

複雑ネットワーク上で間接互恵をやるぞよ。世の中複雑ネットワークだ。Webの世界ならだれとでも取引可能だが(つまり全員とゲームする)やり方をまねできるのは知ってる相手だ(つまり隣接ノード)。またいくつかのコミュニティに属して情報を共有するよね(この論文でいうcoalition)。ということで学習対象がネットワークで縛られる構造を導入します。評判が観察できるのは隣接ノードかcoalitionメンバーに限る。当然ネットワークとcaolitionは可変でしょう。rewiringありです。

ゲームの基本アイデアはNowak&Sigmund(Nature, 1998)のイメージスコアリングのやつ。イメージスコア(評判)と協力の閾値を持ったエージェントがドネーションゲームをする。協力したら評判が+1、裏切ると-1となる。

ゲームはPopulationからランダムに選ばれる。エージェントはネットワーク上に配置され、またcoalitionにも属している。ドナーになったエージェントはレシピエントの評判を調べるんだけど、隣接ノードもしくはcoalitionのメンバーならスコアを見れる。それ以外だったら見れないのでスコアは0と判断する。

学習対象は隣接ノードから。rewiringは評判の悪いやつを確率的に切ってcoalitionの中から評判の高いやつにつなぐ。

いやー、なんでこんな七面倒臭いことするんだ。結果はまあrewiringとcoalitionで協力が進化するとか、SFとSmall-Worldでcoalitionの影響が違うとか。うーん、アブストラクトモデルにしては入れ込みすぎだし、ミドルレンジのモデルとしては何ができたのかよくわからん。はい次。

Liu, A., Wang, L., Zhang, Y. & Sun, C. in (eds. Liu, D., Xie, S., Li, Y., Zhao, D. & El-Alfy, E.-S. M.) 10638, 919-926 (Springer International Publishing, 2017).

続いてはこの論文を受けての論文。

ゲームの設定や学習ルールは同じ。coalitionは廃止してる。うんそれがいいと思う。でrewiringのときにつなぐのに成功するかどうかを自分の評判が高ければつなげて低ければ失敗するというアイデアを一発いれます。SFネットワークでrewiringありだと協力が進化するけど、rewiringなしだと進化しないと。

うーむ、うーむ。



2017年8月10日木曜日

We Can’t Return Evil for Good: The Comparison between Direct and Indirect Reciprocity

あれ、今年は7月は省略されたんだっけ。勝手に1年を11か月にしないでほしいものだ。

直接互恵と間接互恵を混在させてみると結局のところ直接互恵が強いよっていう論文。

Shiraki, Y. & Igarashi, T. We Can’t Return Evil for Good: The Comparison between Direct and Indirect Reciprocity. Lett. Evol. Behav. Sci. 8, 4–7 (2017).

直接互恵と間接互恵は良く知られてそして研究されている。集団内の観察が完全であれば、評判の矛盾は起きないけれど不完全観察ならば当然矛盾はおこる。評判の悪い人から協力された後に協力を求められたら、直接互恵的に協力を返すのか、評判を活用して拒否するのか。シナリオを用いてやります。

会社の同僚に最近部署が一緒になったBさんがいます。部署の人たちとランチを食べてたらBさんがやってきて夜勤を代わってくれと言ってきました。あなたは代わってあげますか。シナリオは2×2。互恵条件は「以前にBさんに助けてもらったことがある/ない」、評判条件は「Bさんは協力的で人気/非協力的で不人気」。

実験はほとんど同じ条件で3つ。学生を対象にするのと、日本のクラウドソーシング、世界45か国のクラウドソーシング(CrowdFlower)。最後だけ病院の夜勤に変更(一般的にするため)。

3実験とも美しく同じ結果を得ています。まず、それぞれの主効果は有意になる。評判Good>評判Badだし、互恵あり>互恵なしとなる。しかし面白いことに互恵条件では評判Goodと評判Badの間に差はなくなる。つまり評判の良否に関わらず高い協力意図を示す。しかも互恵なしの評判Goodよりも互恵あり評判Badのほうが協力意図は高い。当然、互恵なしなら評判Good>評判Bad。間接互恵的な評判によって協力するかどうかを判断するけれど、直接互恵的な関係は評判より優先される。

ちなみに今回は、Bの非協力が正当化されうるかどうかはコントロールしていない。つまりはBが非協力した相手がどうだったかは明示してない(2次情報は明確じゃない)。これは今後の課題とな。

言われてみれば当然だけど(自分自身への協力を観察した時点で評判をGoodに更新したといえるので)、結果がきれいに出ていて素晴らしい。

2017年6月27日火曜日

Do sincere apologies need to be costly? Test of a costly signaling model of apology.

先日の学会で雑談中に出てきた謝罪研究の話題。適当な記憶でしゃべってしまったので確認のために読む。案の定若干記憶と異なる実験設定だった。あぶねえ。

Ohtsubo, Y. & Watanabe, E. Do sincere apologies need to be costly? Test of a costly signaling model of apology. Evol. Hum. Behav. 30, 114-123 (2009).

謝罪のコストリーシグナルについて分析する。謝罪を受ける側は謝罪することのコストについて敏感に観察しているはず。実験1,2でコスト有り謝罪と無し謝罪をシナリオ実験で検討する。実験3は修正版独裁者ゲーム。架空のパートナーが不公平分配をしたのちに謝罪する。その時にメッセージを送ることにコストがかかることでコスト有り謝罪を再現する。

ザハビ先生のシグナリングセオリーはいけてるよ。人間の行動も結構説明がつく。特に謝罪というのはシグナルの信頼性が重要になるケースだ。騙そうとする表面的な謝罪を受け入れてしまうと搾取されるから。

Sender(S)とReciever(R)を考える。また協力的なScと搾取するSeも考えましょう。1ラウンドで協力的なやり取りをすればSもRもb_cを得る。しかし、Sの意図にかかわらずb_e(>b_c)をSは得ることができる。また確率wで繰り返しゲームをおこなう。またコストa(>=b_e)を払って謝罪をすることを考える。Scにとって、b_e <= a <= b_c・w/(1-w)ならScは謝罪コストを払っても関係を続けたいと思うはず。

ちょっと飛ばして実験へ。

実験1では謝罪における贈り物(補填)の効果をvignette experimentで検証。
実験2では謝罪において謝罪者の利得は減るけど、被謝罪者の利得は増えないというシナリオをvignette experimentで検証。
実験3では変形独裁者ゲーム。1000円のうち200円しかもらえなかったときに、Dictatorからメッセージを受け取る。その時のメッセージにかかるコスト(ただし参加者の利得は増えない)。

実験1:シナリオ実験です。友人に電子辞書を貸したんだけど返ってこないて宿題で不便だった。そのあと「謝罪」「謝罪+ランチおごり」を比較。
実験2:シナリオ実験。友達が金曜のバイトのシフトを勝手に参加者に代えていた。なぜなら友人は急遽実家に帰らなくてはいけないから。そのおかげで土曜の試験の準備ができなかった。友人は試験のことは忘れていた。コスト条件では友人はフライトの予定を変更して謝るために早く帰ってきた。コスト無条件では通常のスケジュールで戻った。
実験3:Dictatorゲームで参加者は200/1000という不公平分配をされる(ただしコンピュータによるランダムな選択)。その後Dictator側が自らの利得を500減らすというコストを払って謝罪メッセージを送るか(参加者の利得は増えず)、もしくはコスト無謝罪を受け取る。

1,2,3ともコスト有りが謝罪の誠実さを高く評価している。

この後にいくつかの検証実験もやっている(自分にだけコスト有り謝罪した場合とか)。結論としてはコストリーシグナルはとても有効だと。

(コスト,ベネフィット)について(0,0)<->(0,1)の比較と(0,0)<->(1,0)の比較をしているけど本当は(1,0)<->(0,1)を比較したいところだ。更には平面全体に拡張できたら面白そう。ただ比較可能な軸に乗せるのは大変そうか。

2017年6月10日土曜日

間接互恵で2次情報を扱った実験研究レビュー

来週出発の学会のポスター。著者欄しか埋めてない。5分間トークが当たってほしかったのによりによってポスター。最近学会発表が億劫でしょうがない。現実から逃げられるなら何でもいいので別件でやらなくちゃと思っていたレビューをざっと。

間接互恵では2次情報の扱いが重要だけど実験でどんなのがやられているのか。なんとなく「2次情報まで人は使うのか?」「2次情報がある前提ならどう使うのか?」「2次情報は協力を促進するのか?」というアプローチがありそう。

2次情報まで人は使うのか?

Milinski, M., Semmann, D., Bakker, T. C. M. & Krambeck, H.-J. Cooperation through indirect reciprocity: image scoring or standing strategy? Proc. R. Soc. B Biol. Sci. 268, 2495-2501 (2001).

匿名で繰り返しのギビングゲームをやって、提供・拒否をカウントしていく。拒否された率を測るのだが、周りがIS的と(つまり提供者へは提供、拒否には拒否)と振舞っていると想定したときの推定値とほぼ同等の拒否され率。ただしST(シンプルスタンディング)的と想定した拒否率とは大きく乖離している。よって2次情報はほとんど使われずIS的に振舞っている。

真島理恵. 間接互恵性状況での人間行動, in 「社会の決まり」はどのように決まるのか (ed. 亀田達也) 117-147 (勁草書房, 2015).

ランダムマッチでは、CtoG,CtoBに差はないが、相手選択が可能なときにはCtoG>CtoBとなる。つまりランダムマッチングではIS的に振舞い、2次情報を使って寄付する相手を選ぶ。相手選択可能な実験状況ではDtoBが外されているので、SH(GBBB)、SJ(GBBG)のいずれかは分別できない。(少なくともST(GGBG)ではないということになるのかな)

Swakman, V., Molleman, L., Ule, A. & Egas, M. Reputation-based cooperation: Empirical evidence for behavioral strategies. Evol. Hum. Behav. 37, 230?235 (2016).

実験で1次情報・2次情報も見れる状況を作る。2次情報にコストがある場合、無い場合を用意。主要な結果は、a) 1次の協力(C/D)が主要な効果を持つ(Cには提供するしDには提供しない) b) 人は2次情報をよく使う(人によってはコストがかかっても) c) とくにDの時の2次情報(DtoB/DtoG)をよく使い、DtoBは報われる(正当化される裏切りはOK)d) 個人差でかいよね。


2次情報がある前提ならどう使うのか?

真島理恵 & 高橋伸幸. 敵の味方は敵? 間接互恵性における二次情報の効果に対する理論的・実証的検討. 理論と方法 20, 177-195 (2005).

CtoG,CtoB,DtoC,DtoBまでの4状況を評価させる。評価指標としては「お人よし」「社会的適切さ」「関係重視」「他者からの評価予測」「提供行動の意図」。CtoBはお人よしと評価されるが、社会的適切さは低い。提供意図については CtoG>CtoB, DtoB>DtoCとなる。(つまり2次情報は使っているしどちらかというとSJ的ということか)

鈴木貴久 & 小林哲郎. 評判生成規範の類型がパーソナル・ネットワークのサイズに及ぼす効果. 社会心理学研究 30, 99-107 (2014).

CtoB、DtoBの2シナリオを評価させて平均より高いか低いかでG/Bとわけることで人をSH,SJ,IS,STに割り振ってサポートネットワークのサイズを従属変数にする。CtoBの主効果が有意。つまりCtoBをBadと判断する人はサポートネットワークのサイズが小さい。SH,SJ的な人は世間が狭いよ、と。

2次情報は協力を促進するのか?

Bolton, G. E., Katok, E. & Ockenfels, A. Cooperation among strangers with limited information about reputation. J. Public Econ. 89, 1457-1468 (2005).

0次、1次、2次と情報を増やすことで協力率は増加する。ただし協力コストが高いときにだけこの効果は確認できる

Ule, A., Schram, A., Riedl, A. & Cason, T. N. Indirect Punishment and Generosity Toward Strangers. Science. 326, 1701-1704 (2009).

2次情報じゃないけど、ギビングゲームに「提供」「拒否」に加えて「懲罰」を導入する。懲罰を選ぶとコストを払って相手の利益を減らせる。さて、懲罰はコストがかかるのだが実際に相手の利得を減らせる「実懲罰」と実際は合いの手利益が減らない「象徴罰」で比較すると象徴罰では裏切りが最も利得を上げるけど、実懲罰ではImage rewarderが一番利益をあげる。(ちょっと二次情報ダイレクトの研究ではないかも)

2017年6月6日火曜日

アップストリーム互恵シミュレーション編

ペイイットフォワード祭りその4。シミュレーションでPIFが進化するかを検討するもののうち匿名TFT的な戦略を扱っているもの2つ。ざっくりと。

Pfeiffer, T., Rutte, C., Killingback, T., Taborsky, M. & Bonhoeffer, S. Evolution of cooperation by generalized reciprocity. Proc. R. Soc. B Biol. Sci. 272, 1115-1120 (2005).

モデルとしては繰り返しPDを使う。少数のグループ内での繰り返しを想定するけど、今回の特徴は毎回グループ内で相手が変わり、相手についての情報は記憶しない。戦略は、前回の利得がR,S,T,Pのいずれだったかに対して次回の協力率p1,p2,p3,p4を持つ。つまり協力するかどうかは今回の相手とは関係ない。でシミュレーションすると(1,0,0,1)というA-PAVLOVが最終的に安定な戦略になる。

Barta, Z., McNamara, J. M., Huszar, D. B. & Taborsky, M. Cooperation among non-relatives evolves by state-dependent generalized reciprocity. Proc. R. Soc. B Biol. Sci. 278, 843-848 (2011).

今度はギビングゲーム。N人集団をM人集団に分割してランダムにギビングゲームをおこなう。モデルの特徴はほぼ同じで、戦略としては協力するかどうかを確率Pでもって、前回のゲームでもらえたらプラス、そうじゃなきゃマイナス。でそのインクリメント/デクリメント幅もそれぞれ戦略として持つ。結果、グループが小さければ協力が進化してほぼTFTのような戦略が支配的になる。

両方ともグループサイズを小さくすることで評判が無くても協力が進化するから、これは従来の間接互恵というよりgeneralized reciprocityだよね、と。そうなんだけど、そうなんだけど、グループが小さければ結局のところ直接互恵と同じ効果が出てくるのでは。なんか読み間違えてるのかな。