狠狠撸

狠狠撸Share a Scribd company logo
8
Most read
10
Most read
15
Most read
尝尝惭を使った社会科学の展开
Ryo Adachi
2/15/2024
去年のこと
● 4/7/2023: StanfordのPark et. al.のsocial simulacra論文がarxivにのる
● 4/2023~: Xでバズり、さまざまなメディアで取り上げられる
● 8/2023: レポジトリが公開される
● 10/2023: UISTのbest paperに選ばれる
???
● LLMエージェントの社会科学への活用を調査
Park et. al., 2023
2
アジェンダ
● Social Simulacra論文のrecap
● 筆者らの考えるsimulacraの活用例
● 引用している論文の紹介
3
アジェンダ
● Social Simulacra論文のrecap
● 筆者らの考えるsimulacraの活用例
● 引用している論文の紹介
4
Social Simulacra論文のrecap
● 生成エージェント (generative agent)
○ 生成AIを利用した“believable”な人間行動をシミュレートするエージェント
● 活用先
○ コミュニティデザイン
■ コミュニティに“荒らし”ユーザーが現れたら
○ 仮想トレーニングへ活用
■ 精神疾患の治療
○ 仮想世界の構築
■ “what if”シナリオの検証
5
社会シミュレーション
● 25人のエージェントをsmallvilleで生活させる
○ 各エージェントのペルソナはプロンプトで規定
○ モデル: chatGPT (GPT3.5-turbo)
● エージェントは人間らしい行動をする
● その他みられる現象
○ 情報拡散
■ 選挙への立候補の情報
○ 協力
■ バレンタインパーティーの準備
Park et. al., 2023
6
人間らしさを実現する工夫
● Retrieve
○ プロンプトにいれる記憶を選定する
○ recency, importance, relevanceで重み付け
● Reflect
○ 記憶をより抽象的な概念に昇華させる
● Plan
○ 再帰的に生成
■ 1日の予定→1時間ごとの予定→各予定の詳細
○ 環境の変化に適応する
■ “トースターから煙がでています、どうしますか?”
全レコード
Park et. al., 2023
7
人間らしいか?
● 問題点
○ Fail to retrieve : 聞いたことを思い出せない
○ Hallucination : ないことをでっちあげる
● 評価方法
■ 各モデルのエージェントにインタビュー
● 自己紹介をしてください
● Aさんはどんな人ですか?
● 朝食が燃えています、どうしますか?
■ 被験者が回答の人間らしさをランク付け
Park et. al., 2023
8
アジェンダ
● Social Simulacra論文のrecap
● 筆者らの考えるsimulacraの活用例
● 引用している論文の紹介
9
活用例(Park et. al., UIST, 2022)
● ソーシャル空間の設計
○ SNS, コミュニティ, オフラインのイベント , etc
○ 大人数の被験者で事前に実験することがむずかしい
● social simulacraでできること
○ インタラクションの生成
■ 予期せぬポジティブ、ネガティブな発言の発見
○ What if
■ 荒らしユーザーが発言したら
■ モデレーターが介入したら
■ コミュニティのルールを変更したら
○ マルチバース
■ いくつもの可能性をシミュレートできる
● reactive → proactiveにコミュニティ設計ができる
Park et. al., 2022
10
アジェンダ
● Social Simulacra論文のrecap
● 筆者らの考えるsimulacraの活用例
● 引用している論文の紹介
11
意見のダイナミクス (Chuang et. al., 2023)
● 10人のLLMエージェント (gpt3.5-turbo)
● 5つのトピック
○ 例:“地球は平らだ”
● 各ステップにおいて任意のペアで意見交換
● 条件を変えて実験
○ トピックのフレーミング
○ 意見の初期分布
○ 確証バイアス
● 結果
○ バイアスの影響
■ 正しい情報に収束しがち
○ 確証バイアスが意見の分断をうむ
Chuang et. al., 2023
12
SNSのシミュレーション (Gao et. al., 2023)
● 実際のSNSネットワーク上のエージェント
○ 約10000ノード
● “男女差別”, “原子力発電”の2つのトピックについて
以下の3つをLLMでシミュレーション
○ 感情:calm, moderate, intense
○ 態度:賛成、反対
○ 反応:拡散、新規投稿、何もしない
● 結果
○ 個人レベルの行動を再現
○ 情報、感情、態度の伝播を再現
Gao et. al., 2023
13
SNSのシミュレーション (T?rnberg et. al., 2023)
● 500人のLLMエージェント
○ サーベイデータを活用してペルソナを作成
○ 各エージェントは政治思想の近い30人をフォロー
○ 投稿に基づき反応をする(コメント、いいね)
● 3つのタイムラインロジックを考える
○ 1. フォロワーの中で反応が多い投稿
○ 2. 全体で反応が多い投稿
○ 3. 反対派閥の中で反応が多い投稿
● 結果
○ 3.においてもっとも発言の毒性が低く、
派閥間の交流が促進された
○ バイアスの影響
T?rnberg et. al., 2023
14
マクロ経済シミュレーション (Li et. al., 2023)
● 100人のLLMエージェント
○ 意思決定:労働、消費
○ ペルソナ:名前、年齢、仕事、職業...
● 環境:労働、消費、銀行、政府
○ 相互に影響を及ぼす
■ 銀行は利率を変更
■ 政府は税率を変更
■ 労働 (時給) と消費 (価格) の需給関係
● 結果
○ 現実的な行動がみられる
e.g. “インフレの際は消費を抑える”
○ マクロ経済で知られる関係を再現
■ フィリップス曲線
■ オークンの法則
Li et. al., 2023
15
参考
● Social Simulacra: Creating Populated Prototypes for Social Computing Systems. Park et. al., UIST, 2022
● Generative Agents: Interactive Simulacra of Human Behavior. Park et. al., UIST, 2023
● Simulating Opinion Dynamics with Networks of LLM-based Agents. Chuang et. al., arXiv:2311.09618v1, 2023
● S3: Social-network Simulation System with Large Language Model-Empowered Agents. Gao et. al.,
arXiv:2307.14984v2, 2023
● Simulating Social Media Using Large Language Models to Evaluate Alternative News Feed Algorithms T?rnberg et
al., arXiv:2310.05984v1, 2023
● Large Language Model-Empowered Agents for Simulating Macroeconomic Activities. Li et. al.,
arXiv:2310.10436v1, 2023
● 役に立ったサーベイ
○ マルチエージェント(日本語) : https://speakerdeck.com/masatoto/llmmarutiezientowofu-kan-suru
○ LLM Multi-Agent Systems: Challenges and Open Problems. Han et. al., 2024
16
Ad

Recommended

協力ゲーム理論でXAI (説明可能なAI) を目指すSHAP (Shapley Additive exPlanation)
協力ゲーム理論でXAI (説明可能なAI) を目指すSHAP (Shapley Additive exPlanation)
西岡 賢一郎
?
自治体骋颈蝉の勘违い(1)
自治体骋颈蝉の勘违い(1)
和仁 浅野
?
笔濒补测驳谤补尘开発秘话冲2022年1月プログラミングシンポジウム招待讲演冲西泽勇辉、冈本雄太
笔濒补测驳谤补尘开発秘话冲2022年1月プログラミングシンポジウム招待讲演冲西泽勇辉、冈本雄太
Preferred Networks
?
第10章后半「ブースティングと加法的木」
第10章后半「ブースティングと加法的木」
T T
?
闯耻产补迟耻蝉のリアルタイム分散レコメンデーション蔼罢辞办测辞狈尝笔#9
闯耻产补迟耻蝉のリアルタイム分散レコメンデーション蔼罢辞办测辞狈尝笔#9
Yuya Unno
?
多人数不完全情報ゲームにおけるAI ~ポーカーと麻雀を例として~
多人数不完全情報ゲームにおけるAI ~ポーカーと麻雀を例として~
Kenshi Abe
?
差分プライバシーとは何か? (定義 & 解釈編)
差分プライバシーとは何か? (定義 & 解釈編)
Kentaro Minami
?
【DL輪読会】マルチエージェント強化学習における近年の 協調的方策学習アルゴリズムの発展
【DL輪読会】マルチエージェント強化学習における近年の 協調的方策学習アルゴリズムの発展
Deep Learning JP
?
深层学习を用いたコンピュータビジョン技术とスマートショップの実现
深层学习を用いたコンピュータビジョン技术とスマートショップの実现
DeNA
?
机械学习システムのアーキテクチャアラカルト
机械学习システムのアーキテクチャアラカルト
BrainPad Inc.
?
2015年度骋笔骋笔鲍実践基础工学 第13回 骋笔鲍のメモリ阶层
2015年度骋笔骋笔鲍実践基础工学 第13回 骋笔鲍のメモリ阶层
智啓 出川
?
これが颁补蝉蝉补苍诲谤补
これが颁补蝉蝉补苍诲谤补
Takehiro Torigaki
?
Pythonではじめる OpenAI Gymトレーニング
Pythonではじめる OpenAI Gymトレーニング
Takahiro Kubo
?
LightGBM: a highly efficient gradient boosting decision tree
LightGBM: a highly efficient gradient boosting decision tree
Yusuke Kaneko
?
大规模言语モデルと颁丑补迟骋笔罢
大规模言语モデルと颁丑补迟骋笔罢
nlab_utokyo
?
ゼロから始める深層強化学習(NLP2018講演資料)/ Introduction of Deep Reinforcement Learning
ゼロから始める深層強化学習(NLP2018講演資料)/ Introduction of Deep Reinforcement Learning
Preferred Networks
?
RAPIDS 概要
RAPIDS 概要
NVIDIA Japan
?
Firebase A/B Testingを使ってサーバ側までA/Bテストした話(Android)
Firebase A/B Testingを使ってサーバ側までA/Bテストした話(Android)
gree_tech
?
マルチレイヤコンパイラ基盘による、エッジ向けディープラーニングの実装と最适化について
マルチレイヤコンパイラ基盘による、エッジ向けディープラーニングの実装と最适化について
Fixstars Corporation
?
畳み込み尝蝉迟尘
畳み込み尝蝉迟尘
tak9029
?
摆顿尝轮読会闭础濒辫丑补厂迟补谤とその関连技术
摆顿尝轮読会闭础濒辫丑补厂迟补谤とその関连技术
Deep Learning JP
?
深层学习の将棋础颈への浸透について
深层学习の将棋础颈への浸透について
bleu48
?
金融情报における时系列分析
金融情报における时系列分析
Fujio Toriumi
?
データベース设计彻底指南
データベース设计彻底指南
Mikiya Okuno
?
学习时に使ってはいないデータの混入「リーケージを避ける」
学习时に使ってはいないデータの混入「リーケージを避ける」
西岡 賢一郎
?
2015年度骋笔骋笔鲍実践プログラミング 第5回 骋笔鲍のメモリ阶层
2015年度骋笔骋笔鲍実践プログラミング 第5回 骋笔鲍のメモリ阶层
智啓 出川
?
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
Shota Imai
?
[DL輪読会] マルチエージェント強化学習と心の理論
[DL輪読会] マルチエージェント強化学習と心の理論
Deep Learning JP
?
ソーシャルビッグデータ?オープンデータによる社会构造変化の発见
ソーシャルビッグデータ?オープンデータによる社会构造変化の発见
Masanori Takano
?
The Web Conference 2020 国際会議報告(ACM SIGMOD 日本支部第73回支部大会?依頼講演)
The Web Conference 2020 国際会議報告(ACM SIGMOD 日本支部第73回支部大会?依頼講演)
Kosetsu Tsukuda
?

More Related Content

What's hot (20)

深层学习を用いたコンピュータビジョン技术とスマートショップの実现
深层学习を用いたコンピュータビジョン技术とスマートショップの実现
DeNA
?
机械学习システムのアーキテクチャアラカルト
机械学习システムのアーキテクチャアラカルト
BrainPad Inc.
?
2015年度骋笔骋笔鲍実践基础工学 第13回 骋笔鲍のメモリ阶层
2015年度骋笔骋笔鲍実践基础工学 第13回 骋笔鲍のメモリ阶层
智啓 出川
?
これが颁补蝉蝉补苍诲谤补
これが颁补蝉蝉补苍诲谤补
Takehiro Torigaki
?
Pythonではじめる OpenAI Gymトレーニング
Pythonではじめる OpenAI Gymトレーニング
Takahiro Kubo
?
LightGBM: a highly efficient gradient boosting decision tree
LightGBM: a highly efficient gradient boosting decision tree
Yusuke Kaneko
?
大规模言语モデルと颁丑补迟骋笔罢
大规模言语モデルと颁丑补迟骋笔罢
nlab_utokyo
?
ゼロから始める深層強化学習(NLP2018講演資料)/ Introduction of Deep Reinforcement Learning
ゼロから始める深層強化学習(NLP2018講演資料)/ Introduction of Deep Reinforcement Learning
Preferred Networks
?
RAPIDS 概要
RAPIDS 概要
NVIDIA Japan
?
Firebase A/B Testingを使ってサーバ側までA/Bテストした話(Android)
Firebase A/B Testingを使ってサーバ側までA/Bテストした話(Android)
gree_tech
?
マルチレイヤコンパイラ基盘による、エッジ向けディープラーニングの実装と最适化について
マルチレイヤコンパイラ基盘による、エッジ向けディープラーニングの実装と最适化について
Fixstars Corporation
?
畳み込み尝蝉迟尘
畳み込み尝蝉迟尘
tak9029
?
摆顿尝轮読会闭础濒辫丑补厂迟补谤とその関连技术
摆顿尝轮読会闭础濒辫丑补厂迟补谤とその関连技术
Deep Learning JP
?
深层学习の将棋础颈への浸透について
深层学习の将棋础颈への浸透について
bleu48
?
金融情报における时系列分析
金融情报における时系列分析
Fujio Toriumi
?
データベース设计彻底指南
データベース设计彻底指南
Mikiya Okuno
?
学习时に使ってはいないデータの混入「リーケージを避ける」
学习时に使ってはいないデータの混入「リーケージを避ける」
西岡 賢一郎
?
2015年度骋笔骋笔鲍実践プログラミング 第5回 骋笔鲍のメモリ阶层
2015年度骋笔骋笔鲍実践プログラミング 第5回 骋笔鲍のメモリ阶层
智啓 出川
?
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
Shota Imai
?
[DL輪読会] マルチエージェント強化学習と心の理論
[DL輪読会] マルチエージェント強化学習と心の理論
Deep Learning JP
?
深层学习を用いたコンピュータビジョン技术とスマートショップの実现
深层学习を用いたコンピュータビジョン技术とスマートショップの実现
DeNA
?
机械学习システムのアーキテクチャアラカルト
机械学习システムのアーキテクチャアラカルト
BrainPad Inc.
?
2015年度骋笔骋笔鲍実践基础工学 第13回 骋笔鲍のメモリ阶层
2015年度骋笔骋笔鲍実践基础工学 第13回 骋笔鲍のメモリ阶层
智啓 出川
?
これが颁补蝉蝉补苍诲谤补
これが颁补蝉蝉补苍诲谤补
Takehiro Torigaki
?
Pythonではじめる OpenAI Gymトレーニング
Pythonではじめる OpenAI Gymトレーニング
Takahiro Kubo
?
LightGBM: a highly efficient gradient boosting decision tree
LightGBM: a highly efficient gradient boosting decision tree
Yusuke Kaneko
?
大规模言语モデルと颁丑补迟骋笔罢
大规模言语モデルと颁丑补迟骋笔罢
nlab_utokyo
?
ゼロから始める深層強化学習(NLP2018講演資料)/ Introduction of Deep Reinforcement Learning
ゼロから始める深層強化学習(NLP2018講演資料)/ Introduction of Deep Reinforcement Learning
Preferred Networks
?
Firebase A/B Testingを使ってサーバ側までA/Bテストした話(Android)
Firebase A/B Testingを使ってサーバ側までA/Bテストした話(Android)
gree_tech
?
マルチレイヤコンパイラ基盘による、エッジ向けディープラーニングの実装と最适化について
マルチレイヤコンパイラ基盘による、エッジ向けディープラーニングの実装と最适化について
Fixstars Corporation
?
畳み込み尝蝉迟尘
畳み込み尝蝉迟尘
tak9029
?
摆顿尝轮読会闭础濒辫丑补厂迟补谤とその関连技术
摆顿尝轮読会闭础濒辫丑补厂迟补谤とその関连技术
Deep Learning JP
?
深层学习の将棋础颈への浸透について
深层学习の将棋础颈への浸透について
bleu48
?
金融情报における时系列分析
金融情报における时系列分析
Fujio Toriumi
?
データベース设计彻底指南
データベース设计彻底指南
Mikiya Okuno
?
学习时に使ってはいないデータの混入「リーケージを避ける」
学习时に使ってはいないデータの混入「リーケージを避ける」
西岡 賢一郎
?
2015年度骋笔骋笔鲍実践プログラミング 第5回 骋笔鲍のメモリ阶层
2015年度骋笔骋笔鲍実践プログラミング 第5回 骋笔鲍のメモリ阶层
智啓 出川
?
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
Shota Imai
?
[DL輪読会] マルチエージェント強化学習と心の理論
[DL輪読会] マルチエージェント強化学習と心の理論
Deep Learning JP
?

Similar to 尝尝惭を使った社会科学の展开 (20)

ソーシャルビッグデータ?オープンデータによる社会构造変化の発见
ソーシャルビッグデータ?オープンデータによる社会构造変化の発见
Masanori Takano
?
The Web Conference 2020 国際会議報告(ACM SIGMOD 日本支部第73回支部大会?依頼講演)
The Web Conference 2020 国際会議報告(ACM SIGMOD 日本支部第73回支部大会?依頼講演)
Kosetsu Tsukuda
?
論文紹介: What’s in a like- attitudes and behaviors around receiving likes on fac...
論文紹介: What’s in a like- attitudes and behaviors around receiving likes on fac...
Masanori Takano
?
最终报告会
最终报告会
Kazuhiro Ikeda
?
河野ゼミ绍介2013
河野ゼミ绍介2013
義広 河野
?
サイバーエージェントにおける计算社会科学
サイバーエージェントにおける计算社会科学
Masanori Takano
?
Thank you communication network in organization 感謝ネットワークからみる組織のコミュニケーションの形
Thank you communication network in organization 感謝ネットワークからみる組織のコミュニケーションの形
Hiroko Onari
?
河野ゼミ绍介2014
河野ゼミ绍介2014
義広 河野
?
教员免许状更新讲习20180821
教员免许状更新讲习20180821
義広 河野
?
教员免许状更新讲习20160803
教员免许状更新讲习20160803
義広 河野
?
Twitter User Recommendation
Twitter User Recommendation
Takuto Kimura
?
教育システム情報学会 2014年度第1回研究会20140510
教育システム情報学会 2014年度第1回研究会20140510
義広 河野
?
东京情报大学キャンパス体験会20130921
东京情报大学キャンパス体験会20130921
義広 河野
?
論文紹介: Tweetment effects on the tweeted experimentally reducing racist harass...
論文紹介: Tweetment effects on the tweeted experimentally reducing racist harass...
Masanori Takano
?
210428 Multi-site collaborations of local XR developer communities through "b...
210428 Multi-site collaborations of local XR developer communities through "b...
Junya Ishioka
?
埼玉工業大学 2011年秋学期 ボランティアの研究 第10回 情報システム?ソーシャルメディアとボランティア
埼玉工業大学 2011年秋学期 ボランティアの研究 第10回 情報システム?ソーシャルメディアとボランティア
Yoshihiko Suko (Ph.D) / BADO! Inc. of CEO
?
第1回富里市ソーシャルメデイア讲座201601
第1回富里市ソーシャルメデイア讲座201601
義広 河野
?
2014年6月5日众议院原子力问题调査特别委员会参考人意见陈述资料(松浦正浩)
2014年6月5日众议院原子力问题调査特别委员会参考人意见陈述资料(松浦正浩)
mmatsuura
?
コミュニティカレッジさくら20160521
コミュニティカレッジさくら20160521
義広 河野
?
ビジュアルプログラミング20161118
ビジュアルプログラミング20161118
義広 河野
?
ソーシャルビッグデータ?オープンデータによる社会构造変化の発见
ソーシャルビッグデータ?オープンデータによる社会构造変化の発见
Masanori Takano
?
The Web Conference 2020 国際会議報告(ACM SIGMOD 日本支部第73回支部大会?依頼講演)
The Web Conference 2020 国際会議報告(ACM SIGMOD 日本支部第73回支部大会?依頼講演)
Kosetsu Tsukuda
?
論文紹介: What’s in a like- attitudes and behaviors around receiving likes on fac...
論文紹介: What’s in a like- attitudes and behaviors around receiving likes on fac...
Masanori Takano
?
サイバーエージェントにおける计算社会科学
サイバーエージェントにおける计算社会科学
Masanori Takano
?
Thank you communication network in organization 感謝ネットワークからみる組織のコミュニケーションの形
Thank you communication network in organization 感謝ネットワークからみる組織のコミュニケーションの形
Hiroko Onari
?
教员免许状更新讲习20180821
教员免许状更新讲习20180821
義広 河野
?
教员免许状更新讲习20160803
教员免许状更新讲习20160803
義広 河野
?
Twitter User Recommendation
Twitter User Recommendation
Takuto Kimura
?
教育システム情報学会 2014年度第1回研究会20140510
教育システム情報学会 2014年度第1回研究会20140510
義広 河野
?
东京情报大学キャンパス体験会20130921
东京情报大学キャンパス体験会20130921
義広 河野
?
論文紹介: Tweetment effects on the tweeted experimentally reducing racist harass...
論文紹介: Tweetment effects on the tweeted experimentally reducing racist harass...
Masanori Takano
?
210428 Multi-site collaborations of local XR developer communities through "b...
210428 Multi-site collaborations of local XR developer communities through "b...
Junya Ishioka
?
埼玉工業大学 2011年秋学期 ボランティアの研究 第10回 情報システム?ソーシャルメディアとボランティア
埼玉工業大学 2011年秋学期 ボランティアの研究 第10回 情報システム?ソーシャルメディアとボランティア
Yoshihiko Suko (Ph.D) / BADO! Inc. of CEO
?
第1回富里市ソーシャルメデイア讲座201601
第1回富里市ソーシャルメデイア讲座201601
義広 河野
?
2014年6月5日众议院原子力问题调査特别委员会参考人意见陈述资料(松浦正浩)
2014年6月5日众议院原子力问题调査特别委员会参考人意见陈述资料(松浦正浩)
mmatsuura
?
コミュニティカレッジさくら20160521
コミュニティカレッジさくら20160521
義広 河野
?
ビジュアルプログラミング20161118
ビジュアルプログラミング20161118
義広 河野
?
Ad

尝尝惭を使った社会科学の展开

  • 2. 去年のこと ● 4/7/2023: StanfordのPark et. al.のsocial simulacra論文がarxivにのる ● 4/2023~: Xでバズり、さまざまなメディアで取り上げられる ● 8/2023: レポジトリが公開される ● 10/2023: UISTのbest paperに選ばれる ??? ● LLMエージェントの社会科学への活用を調査 Park et. al., 2023 2
  • 3. アジェンダ ● Social Simulacra論文のrecap ● 筆者らの考えるsimulacraの活用例 ● 引用している論文の紹介 3
  • 4. アジェンダ ● Social Simulacra論文のrecap ● 筆者らの考えるsimulacraの活用例 ● 引用している論文の紹介 4
  • 5. Social Simulacra論文のrecap ● 生成エージェント (generative agent) ○ 生成AIを利用した“believable”な人間行動をシミュレートするエージェント ● 活用先 ○ コミュニティデザイン ■ コミュニティに“荒らし”ユーザーが現れたら ○ 仮想トレーニングへ活用 ■ 精神疾患の治療 ○ 仮想世界の構築 ■ “what if”シナリオの検証 5
  • 6. 社会シミュレーション ● 25人のエージェントをsmallvilleで生活させる ○ 各エージェントのペルソナはプロンプトで規定 ○ モデル: chatGPT (GPT3.5-turbo) ● エージェントは人間らしい行動をする ● その他みられる現象 ○ 情報拡散 ■ 選挙への立候補の情報 ○ 協力 ■ バレンタインパーティーの準備 Park et. al., 2023 6
  • 7. 人間らしさを実現する工夫 ● Retrieve ○ プロンプトにいれる記憶を選定する ○ recency, importance, relevanceで重み付け ● Reflect ○ 記憶をより抽象的な概念に昇華させる ● Plan ○ 再帰的に生成 ■ 1日の予定→1時間ごとの予定→各予定の詳細 ○ 環境の変化に適応する ■ “トースターから煙がでています、どうしますか?” 全レコード Park et. al., 2023 7
  • 8. 人間らしいか? ● 問題点 ○ Fail to retrieve : 聞いたことを思い出せない ○ Hallucination : ないことをでっちあげる ● 評価方法 ■ 各モデルのエージェントにインタビュー ● 自己紹介をしてください ● Aさんはどんな人ですか? ● 朝食が燃えています、どうしますか? ■ 被験者が回答の人間らしさをランク付け Park et. al., 2023 8
  • 9. アジェンダ ● Social Simulacra論文のrecap ● 筆者らの考えるsimulacraの活用例 ● 引用している論文の紹介 9
  • 10. 活用例(Park et. al., UIST, 2022) ● ソーシャル空間の設計 ○ SNS, コミュニティ, オフラインのイベント , etc ○ 大人数の被験者で事前に実験することがむずかしい ● social simulacraでできること ○ インタラクションの生成 ■ 予期せぬポジティブ、ネガティブな発言の発見 ○ What if ■ 荒らしユーザーが発言したら ■ モデレーターが介入したら ■ コミュニティのルールを変更したら ○ マルチバース ■ いくつもの可能性をシミュレートできる ● reactive → proactiveにコミュニティ設計ができる Park et. al., 2022 10
  • 11. アジェンダ ● Social Simulacra論文のrecap ● 筆者らの考えるsimulacraの活用例 ● 引用している論文の紹介 11
  • 12. 意見のダイナミクス (Chuang et. al., 2023) ● 10人のLLMエージェント (gpt3.5-turbo) ● 5つのトピック ○ 例:“地球は平らだ” ● 各ステップにおいて任意のペアで意見交換 ● 条件を変えて実験 ○ トピックのフレーミング ○ 意見の初期分布 ○ 確証バイアス ● 結果 ○ バイアスの影響 ■ 正しい情報に収束しがち ○ 確証バイアスが意見の分断をうむ Chuang et. al., 2023 12
  • 13. SNSのシミュレーション (Gao et. al., 2023) ● 実際のSNSネットワーク上のエージェント ○ 約10000ノード ● “男女差別”, “原子力発電”の2つのトピックについて 以下の3つをLLMでシミュレーション ○ 感情:calm, moderate, intense ○ 態度:賛成、反対 ○ 反応:拡散、新規投稿、何もしない ● 結果 ○ 個人レベルの行動を再現 ○ 情報、感情、態度の伝播を再現 Gao et. al., 2023 13
  • 14. SNSのシミュレーション (T?rnberg et. al., 2023) ● 500人のLLMエージェント ○ サーベイデータを活用してペルソナを作成 ○ 各エージェントは政治思想の近い30人をフォロー ○ 投稿に基づき反応をする(コメント、いいね) ● 3つのタイムラインロジックを考える ○ 1. フォロワーの中で反応が多い投稿 ○ 2. 全体で反応が多い投稿 ○ 3. 反対派閥の中で反応が多い投稿 ● 結果 ○ 3.においてもっとも発言の毒性が低く、 派閥間の交流が促進された ○ バイアスの影響 T?rnberg et. al., 2023 14
  • 15. マクロ経済シミュレーション (Li et. al., 2023) ● 100人のLLMエージェント ○ 意思決定:労働、消費 ○ ペルソナ:名前、年齢、仕事、職業... ● 環境:労働、消費、銀行、政府 ○ 相互に影響を及ぼす ■ 銀行は利率を変更 ■ 政府は税率を変更 ■ 労働 (時給) と消費 (価格) の需給関係 ● 結果 ○ 現実的な行動がみられる e.g. “インフレの際は消費を抑える” ○ マクロ経済で知られる関係を再現 ■ フィリップス曲線 ■ オークンの法則 Li et. al., 2023 15
  • 16. 参考 ● Social Simulacra: Creating Populated Prototypes for Social Computing Systems. Park et. al., UIST, 2022 ● Generative Agents: Interactive Simulacra of Human Behavior. Park et. al., UIST, 2023 ● Simulating Opinion Dynamics with Networks of LLM-based Agents. Chuang et. al., arXiv:2311.09618v1, 2023 ● S3: Social-network Simulation System with Large Language Model-Empowered Agents. Gao et. al., arXiv:2307.14984v2, 2023 ● Simulating Social Media Using Large Language Models to Evaluate Alternative News Feed Algorithms T?rnberg et al., arXiv:2310.05984v1, 2023 ● Large Language Model-Empowered Agents for Simulating Macroeconomic Activities. Li et. al., arXiv:2310.10436v1, 2023 ● 役に立ったサーベイ ○ マルチエージェント(日本語) : https://speakerdeck.com/masatoto/llmmarutiezientowofu-kan-suru ○ LLM Multi-Agent Systems: Challenges and Open Problems. Han et. al., 2024 16