9. < タイプとシグナル >
タイプの数は有限とし、タイプを t = 1, . . . , T と表す。
t の事前確率は共通に知られているとし、p(t)(> 0) と表す。
評定者の集合を I と表す。|I| ≥ 3 とする。I は可算無限でもよい。
評定者 i が受け取るシグナルを Si
と表す。シグナルは私秘的であるとす
る。可能なシグナルの集合を S = {s1, . . . , sM} と表す。
製品タイプの下でシグナルは独立に同分布に従うとする。
f(sm|t) = Pr(Si
= sm|t) と表す。すべての sm と t について f(sm|t) > 0 とす
る。
f(sm|t) は共通知識であるとする。
t が異なればシグナルの条件付き分布も異なるものとする。
Si
の実現値を si
と表す。Si
= sm であることを si
m と表す。
Shigeru ONO / Insight Factory Miller et al.(2005) 集合知研究会: 2022/04 9 / 44
10. < 報告 >
評定者 i のシグナルについて行う報告を ai
(∈ S) と表す。全評定者の報告
のベクトルを a と表す。
評定者 i がシグナル sm を受け取ったときの報告を ai
m(∈ S) と表す。
評定者 i の報告戦略を a?i
= (ai
1, . . . , ai
m) と表す。
全評定者の報告戦略のベクトルを a? と表す。
評定者 i 以外の評定者の報告戦略のベクトルを a??i
と表す。
< 給付 >
報告が a であるときの評定者 i への給付を τi(a) と表す。
全評定者への給付のベクトルを τ(a) と表す。
Shigeru ONO / Insight Factory Miller et al.(2005) 集合知研究会: 2022/04 10 / 44
11. < 最良の報告戦略 >
a??i
に対する報告戦略 a?i
は、他のすべての評定者のシグナルの分布を通じた
給付の期待値を最大化するときに最良となる。
すなわち、それぞれの m について、すべての a?i
∈ S について
ES?i [τi(a?i
m, a??i
)|si
m] ≥ ES?i [τi(a?i
, a??i
)|si
m]
が成り立つときに最良となる。
Shigeru ONO / Insight Factory Miller et al.(2005) 集合知研究会: 2022/04 11 / 44
12. < ナッシュ均衡となる報告戦略 >
全員の報告戦略 a? がすべての評定者について上式を満たすとき、a? はナッシ
ュ均衡である (たとえば給付がない場合にはいかなる報告戦略ベクトルもナ
ッシュ均衡になりうる)。
すべての評定者において上式の不等号が strict であるなら、a? は狭義ナッシュ
均衡である 1
。
< 真実報告がナッシュ均衡になるとき >
全ての i, m において ai
m = sm であるときすべての評定者について上式が満た
されるなら、真実報告はナッシュ均衡である。
上式の不等号が strict だったら真実報告は狭義ナッシュ均衡である。
1原文には一貫して「ナッシュ均衡」とあります。研究会では、むしろ「ベイジアンナッシュ
均衡」と表現すべきではないかという議論となりました。調べてみたところ、Zeng, Yu & Chen
(2021, arXiv) も本論文を紹介しているくだりでこの均衡を「ベイジアンナッシュ均衡」と表現し
ていました。
Shigeru ONO / Insight Factory Miller et al.(2005) 集合知研究会: 2022/04 12 / 44
13. 2.1 ベース?ケース
本項では、真実報告が狭義ナッシュ均衡となる給付スキームを定義する。
< 確率的関連性 >
確率変数 Si
と Sj
について、Si
の下での Sj
の条件付き分布が Si
の実現値によ
って異なることを、確率的関連性があると呼ぶ。本論文ではすべての Si
, Sj
に
ついて確率的関連性があると仮定する。
Shigeru ONO / Insight Factory Miller et al.(2005) 集合知研究会: 2022/04 13 / 44
29. 3.2.2 報告が離散的である場合
< 問題 >
たとえば 5 件法で報告するような場合、自分の真の情報に「一番近い」値を
報告してもらうことになる。このとき、以下の難題が生じる。
シグナルの「近さ」はタイプの事後分布の近さに対応するのか
タイプ空間における信念の近さは参照評定者の報告の分布についての信
念の近さに対応するのか
シグナル空間を有限の「ビン」に分割した場合について考えよう。
評定者 i にとって、自分のシグナルがどのビンに落ちたかを報告することが、
他の評定者もそうしているという信念の下で最良の報告になるようなスコア
リング?ルールを構築したい。
Shigeru ONO / Insight Factory Miller et al.(2005) 集合知研究会: 2022/04 29 / 44
30. 3.2.2 報告が離散的である場合
< スコアリング?ルールの効率性 >
評定者が持っている真の分布と評定者が報告した分布との間の距離が減るほ
ど報告後のスコアの期待値が増えるとき、そのスコアリング?ルールは効率
的であるという 6
。
L2 メトリックで距離を測る場合、二次ルールは効率的である。
renormalized した L2 メトリック7
で距離を測れば、球面ルールは効率的で
ある。
対数ルールは効率的でない。
6原文: A scoring rule is effective with respect to a metric if the expected score from
announcing a distribution increases as the announced distribution’s distance from the rater’s true
distribution decrease. 研究会では、本論文の提案メカニズムでは評定者が報告するのは分布では
ないのでは、というご指摘を頂きました。ここでは提案メカニズムを離れて一般的な説明をして
いるのだと思います。
7すみません、理解できていません
Shigeru ONO / Insight Factory Miller et al.(2005) 集合知研究会: 2022/04 30 / 44
31. < タイプが 2 つの場合 >
タイプが Good, Bad の 2 つで、区間 (0, 1) からシグナルがドローされるとし
よう。シグナルの密度を f(s|G), f(s|B) とする。タイプが Good である共通の事
前確率を p(∈ (0, 1)) とする。密度は単調尤度比特性 (MLRP; f(s|G)/f(s|B) が s
について狭義単調であること) を満たすとする。
評定者 i からみた事後確率は p(G|si
) = pf(si
|G)
pf(si|G)+(1?p)f(si|B) となる。
こうした場合に、以下が成り立つ。
命題 3. タイプが 2 つであり、シグナルの密度が MLRP を満たすとする。任意
の整数 L について、シグナルを L 個の区間に分割するとき、エージェントが
自分のシグナルが落ちた区間を報告することだけがナッシュ均衡となるよう
な、分割と給付が存在する。
証明は Appendix A に示したが、簡単に言うと..[メモ省略]
Shigeru ONO / Insight Factory Miller et al.(2005) 集合知研究会: 2022/04 31 / 44
32. < まとめ >
... というわけで、タイプがたった 2 つであったとしても、評定者が誠実な報
告をすることを示すのはちょっと大変である。
もっと複雑な場合にも誠実な報告が引き出せることを示せるかどうかは今後
の課題である。
Shigeru ONO / Insight Factory Miller et al.(2005) 集合知研究会: 2022/04 32 / 44