狠狠撸

狠狠撸Share a Scribd company logo
協調荷押し問題の複雑性に関する考察
  Complexity of Cooperative Package Pushing Problem




                 複合情報学専攻 複雑系工学講座
              調和系工学研究室 修士2年 高橋 春樹
背景
MASの設計技術を向上させるため,適切な難易度の問題設定が必要

 MAS
  設
  計
  技
  術               創発(GAなどによるMAS設計)

                 現状:「評価関数 = 問題の難易度」



                     適用問題の難易度

評価関数による難易度
       評価関数に現れない性質も多く,
       問題の難易度を正しく表しているとはいえない


       問題の難易度を正しく測る指標が必要
目的
既存の問題群の複雑性や難易度の順序関係を求め
    複雑さの新しい指標の知見を得る



    問題の難易度         新しい指標



                       知見
    既存の問題群

                   順序関係を導く



 発現したエージェント群の複雑性
システムの複雑性の指標
情報エントロピーと相互情報量
 自己組織化するシステムにおける情報エントロピー                  散逸構造論、非平衡開放系

   ?エントロピーの低い状態 : 情報を獲得して行動が自己組織化
   ?エントロピーが増える : 情報を獲得していない,異なる安定状態に移行

   ?エージェントと環境のエントロピーのやりとり[Parunak 2001]
   ?非平衡開放系としてのMASにおけるエントロピーのふるまい[Guerin 2004]

エージェントにとっての情報の価値を定量化する相互情報量
  ?相互情報量が大きい : 情報がエージェントにとって意味のあるものとなっている
  ?相互情報量が小さい : 情報がエージェントにとって意味のないものとなっている

  ?エージェントの相互作用の定量化[西川 2004]
  ?セルオートマトンの複雑さと計算能力の指標[Langton 1990]


 こうした指標を用いたシステム間の比較は行われていない
研究概要

   問題の難易度         新しい指標



                      知見
   既存の問題群

                  順序関係を導く



発現したエージェント群の複雑性
協調荷押し問題 概要
 MASの協調行動を促す問題設定         [大倉2008][片田2008][伍賀2007]


均一な自律エージェント              荷の数字は押すために必要なエージェント数


                   5               3            2




                                                ゴール



                                       シミュレータとしてODEを使用



        様々な設定 : エージェント数 , 荷の数 , 配置


   設定により,難易度がどのように変化するかは不明
問題一覧
下図のようなエージェント数,荷の配置でシミュレーション
               エージェント数n体,荷の数m個の設定をnAmPと表記する

                                                          1A1P           2A1P
                                                  1              2


         2A2P               3A1P       3A2P       1       3A3P           4A1P
    1                              2
                    3                             1                  4
    1                              1
                                                      1

         4A2P      1        4A4P       5A1P               5A2P       1 5A3P
2                                                     1
                   1               5                                 3
2                  1                                  4
                       1                                             1
                            6A1P       6A2P       1 6A3P         1       6A6P
1       5A5P                       3                             1
1                                             2                  1
1                       6                                        1
    1                              3
1                                             3                  1
                                                                 1
エージェントの入出力
                              Input0~7   0or1   IRセンサ
                              Input8     -1~1   エージェントとの距離(2m以下)

                              Input9     -1~1   〃(2m~5m)

                              Input10    -1~1   〃(5m~)

                              Input11    -1~1   エージェントとの角度sinα

                              Input12    -1~1   〃cosα
                  GAによって学習    Input13    -1~1   荷との距離(2m以下)
                              Input14    -1~1   〃(2m~5m)
    最近のエージェント
                              Input15    -1~1   〃(5m~)

                  最近の荷        Input16    -1~1   最近の荷との角度sinβ
y
                              Input17    -1~1   〃cosβ
                         針路
                              Input18    -1~1   エージェントの針路sinγ
      α       β
                              Input19    -1~1   〃cosγ
                   x
          γ                   Output0    -1~1   左モータの出力(目標角速度)
                              Output1    -1~1   右モータの出力
情报量の计算

              各エージェント毎に観測された入出力の確率分布から
                  情報エントロピーと相互情報量を計算


  IN={input0,input1,     入力                                             OUT={out0,out1}
     ???,input }
              19
                                                       出力
        PIN                                                                      POUT


     情報エントロピー                            相互情報量
                                                                                   p(out, input )
H (OUT )           P(out) log P(out)   I (OUT ; IN )              p(out, input ) log
                                                       out   in                   P(out ) P(input )
                                                                          H (OUT ) H (OUT | IN )
出力のエントロピー = 行動の多様性                       入力と出力の相互情報量 =センサの重要性

                                            出力のエントロピーで割ることで入力が
                                            出力に与える割合を算出
各設定毎の情報量
個別の設定毎に適用 (エージェント2体 荷1個の例)

           2A1P


                      相互情報量から,各エージェントの
                      入力の処理の違いを比較




      エージェント1の相互情報量         エージェント2の相互情報量
研究概要

   問題の難易度         新しい指標



                      知見
   既存の問題群

                  順序関係を導く



発現したエージェント群の複雑性
设定毎に発现したエージェント差
      「タスク達成に要求されるエージェントの多様さ」 =設定の複雑性
      とすると
      「一つの設定で発生したエージェントの差」=設定の複雑性

            各エージェントの相互情報量をベクトルとして捉え距離を算出




        エージェント1の各相互情報量                                                  エージェント2の各相互情報量
 A1 = {IR 1, Ar1 , Ad1 , Pr 1, Pd1 , D1}            A2 = {IR2 , Ar2 , Ad2 , Pr2 , Pd2 , D2}

                          ( IR   1       IR     2   )       2
                                                                        ( Ar    1       Ar       2   )   2


エージェント間の距離=               ( Ad       1     Ad           2       )   2
                                                                          (Pr       1   Pr       2   )   2


                          ( Pd       1     Pd       2       )       2
                                                                          ( d   1       d    2   )   2
设定毎に现れるエージェントの违い
    エージェント間の差が大きかった問題設定順に並べたもの


エ
ー
ジ
ェ
ン
ト
間
の
距
離




                                  各設定
      エージェントや荷の数に応じて差が大きくなっていない
組み合わせとの照合
 荷に対してエージェントを割り当てる組み合わせの数で並べ替えたもの




荷にエージェントを割り当てる組み合わせの数≠問題の複雑さ
动作からの考察

               最も相互情報量に差のあったエージェントを比較
                  5Agents 3Packagesのデータ

                  2体のエージェントでは挙動やセンサ
                  の使い方に差が見られる


                  1つのニューラルネットワークに多様な
Goal Line
                  計算を要求される設定




     エージェント2                     エージェント5
出力のエントロピーと相互情报量から见る性质
            全エージェントのエントロピーと相互情報量

                         設定に応じた自己組織化


(センサの重要性)




                         (行動の多様性)


    行動の多様性が求められる問題ほど入力の情報の価値が高い
まとめ

   問題の難易度          新しい指標
                      知見
                       エージェントの数や荷の数で
                       は決まらない

   既存の問題群              エージェントの差が大きいほど
                       多様な計算を要求され,複雑



                  順序関係を導く
発現したエージェント群の複雑性

More Related Content

More from harmonylab (20)

【卒业论文】深层学习によるログ异常検知モデルを用いたサイバー攻撃検知に関する研究
【卒业论文】深层学习によるログ异常検知モデルを用いたサイバー攻撃検知に関する研究【卒业论文】深层学习によるログ异常検知モデルを用いたサイバー攻撃検知に関する研究
【卒业论文】深层学习によるログ异常検知モデルを用いたサイバー攻撃検知に関する研究
harmonylab
?
【卒业论文】尝尝惭を用いたエージェントの相互作用による俳句の生成と评価に関する研究
【卒业论文】尝尝惭を用いたエージェントの相互作用による俳句の生成と评価に関する研究【卒业论文】尝尝惭を用いたエージェントの相互作用による俳句の生成と评価に関する研究
【卒业论文】尝尝惭を用いたエージェントの相互作用による俳句の生成と评価に関する研究
harmonylab
?
【修士论文】帝国议会および国会议事速记録における可能表现の长期的変迁に関する研究
【修士论文】帝国议会および国会议事速记録における可能表现の长期的変迁に関する研究【修士论文】帝国议会および国会议事速记録における可能表现の长期的変迁に関する研究
【修士论文】帝国议会および国会议事速记録における可能表现の长期的変迁に関する研究
harmonylab
?
【修士论文】竞轮における注目レース选定と尝尝惭を用いたレース绍介记事生成に関する研究
【修士论文】竞轮における注目レース选定と尝尝惭を用いたレース绍介记事生成に関する研究【修士论文】竞轮における注目レース选定と尝尝惭を用いたレース绍介记事生成に関する研究
【修士论文】竞轮における注目レース选定と尝尝惭を用いたレース绍介记事生成に関する研究
harmonylab
?
【卒業論文】ステレオカメラによる車両制御における深層学習の適用に関する研究(A Study on Application of Deep Learning...
【卒業論文】ステレオカメラによる車両制御における深層学習の適用に関する研究(A Study on Application of Deep Learning...【卒業論文】ステレオカメラによる車両制御における深層学習の適用に関する研究(A Study on Application of Deep Learning...
【卒業論文】ステレオカメラによる車両制御における深層学習の適用に関する研究(A Study on Application of Deep Learning...
harmonylab
?
A Study on the Method for Generating Deformed Route Maps for Supporting Detou...
A Study on the Method for Generating Deformed Route Maps for Supporting Detou...A Study on the Method for Generating Deformed Route Maps for Supporting Detou...
A Study on the Method for Generating Deformed Route Maps for Supporting Detou...
harmonylab
?
【修士论文】尝尝惭を用いた俳句推敲と批评文生成に関する研究
【修士论文】尝尝惭を用いた俳句推敲と批评文生成に関する研究 【修士论文】尝尝惭を用いた俳句推敲と批评文生成に関する研究
【修士论文】尝尝惭を用いた俳句推敲と批评文生成に関する研究
harmonylab
?
【修士論文】視覚言語モデルを用いた衣服画像ペアの比較文章生成に関する研究(A Study on the Generation of Comparative...
【修士論文】視覚言語モデルを用いた衣服画像ペアの比較文章生成に関する研究(A Study on the Generation of Comparative...【修士論文】視覚言語モデルを用いた衣服画像ペアの比較文章生成に関する研究(A Study on the Generation of Comparative...
【修士論文】視覚言語モデルを用いた衣服画像ペアの比較文章生成に関する研究(A Study on the Generation of Comparative...
harmonylab
?
【DLゼミ】Generative Image Dynamics, CVPR2024
【DLゼミ】Generative Image Dynamics, CVPR2024【DLゼミ】Generative Image Dynamics, CVPR2024
【DLゼミ】Generative Image Dynamics, CVPR2024
harmonylab
?
From Pretraining Data to Language Models to Downstream Tasks: Tracking the Tr...
From Pretraining Data to Language Models to Downstream Tasks:Tracking the Tr...From Pretraining Data to Language Models to Downstream Tasks:Tracking the Tr...
From Pretraining Data to Language Models to Downstream Tasks: Tracking the Tr...
harmonylab
?
Generating Automatic Feedback on UI Mockups with Large Language Models
Generating Automatic Feedback on UI Mockups with Large Language ModelsGenerating Automatic Feedback on UI Mockups with Large Language Models
Generating Automatic Feedback on UI Mockups with Large Language Models
harmonylab
?
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
harmonylab
?
【修士论文】代替出勤者の选定业务における依頼顺决定方法に関する研究   千坂知也
【修士论文】代替出勤者の选定业务における依頼顺决定方法に関する研究   千坂知也【修士论文】代替出勤者の选定业务における依頼顺决定方法に関する研究   千坂知也
【修士论文】代替出勤者の选定业务における依頼顺决定方法に関する研究   千坂知也
harmonylab
?
【修士论文】経路探索のための媒介中心性に基づく道路ネットワーク阶层化手法に関する研究
【修士论文】経路探索のための媒介中心性に基づく道路ネットワーク阶层化手法に関する研究【修士论文】経路探索のための媒介中心性に基づく道路ネットワーク阶层化手法に関する研究
【修士论文】経路探索のための媒介中心性に基づく道路ネットワーク阶层化手法に関する研究
harmonylab
?
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
harmonylab
?
【卒业论文】印象タグを用いた衣服画像生成システムに関する研究
【卒业论文】印象タグを用いた衣服画像生成システムに関する研究【卒业论文】印象タグを用いた衣服画像生成システムに関する研究
【卒业论文】印象タグを用いた衣服画像生成システムに関する研究
harmonylab
?
【卒业论文】大规模言语モデルを用いたマニュアル文章修正手法に関する研究
【卒业论文】大规模言语モデルを用いたマニュアル文章修正手法に関する研究【卒业论文】大规模言语モデルを用いたマニュアル文章修正手法に関する研究
【卒业论文】大规模言语モデルを用いたマニュアル文章修正手法に関する研究
harmonylab
?
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
harmonylab
?
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile BackboneDLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
harmonylab
?
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat ModelsDLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
harmonylab
?
【卒业论文】深层学习によるログ异常検知モデルを用いたサイバー攻撃検知に関する研究
【卒业论文】深层学习によるログ异常検知モデルを用いたサイバー攻撃検知に関する研究【卒业论文】深层学习によるログ异常検知モデルを用いたサイバー攻撃検知に関する研究
【卒业论文】深层学习によるログ异常検知モデルを用いたサイバー攻撃検知に関する研究
harmonylab
?
【卒业论文】尝尝惭を用いたエージェントの相互作用による俳句の生成と评価に関する研究
【卒业论文】尝尝惭を用いたエージェントの相互作用による俳句の生成と评価に関する研究【卒业论文】尝尝惭を用いたエージェントの相互作用による俳句の生成と评価に関する研究
【卒业论文】尝尝惭を用いたエージェントの相互作用による俳句の生成と评価に関する研究
harmonylab
?
【修士论文】帝国议会および国会议事速记録における可能表现の长期的変迁に関する研究
【修士论文】帝国议会および国会议事速记録における可能表现の长期的変迁に関する研究【修士论文】帝国议会および国会议事速记録における可能表现の长期的変迁に関する研究
【修士论文】帝国议会および国会议事速记録における可能表现の长期的変迁に関する研究
harmonylab
?
【修士论文】竞轮における注目レース选定と尝尝惭を用いたレース绍介记事生成に関する研究
【修士论文】竞轮における注目レース选定と尝尝惭を用いたレース绍介记事生成に関する研究【修士论文】竞轮における注目レース选定と尝尝惭を用いたレース绍介记事生成に関する研究
【修士论文】竞轮における注目レース选定と尝尝惭を用いたレース绍介记事生成に関する研究
harmonylab
?
【卒業論文】ステレオカメラによる車両制御における深層学習の適用に関する研究(A Study on Application of Deep Learning...
【卒業論文】ステレオカメラによる車両制御における深層学習の適用に関する研究(A Study on Application of Deep Learning...【卒業論文】ステレオカメラによる車両制御における深層学習の適用に関する研究(A Study on Application of Deep Learning...
【卒業論文】ステレオカメラによる車両制御における深層学習の適用に関する研究(A Study on Application of Deep Learning...
harmonylab
?
A Study on the Method for Generating Deformed Route Maps for Supporting Detou...
A Study on the Method for Generating Deformed Route Maps for Supporting Detou...A Study on the Method for Generating Deformed Route Maps for Supporting Detou...
A Study on the Method for Generating Deformed Route Maps for Supporting Detou...
harmonylab
?
【修士论文】尝尝惭を用いた俳句推敲と批评文生成に関する研究
【修士论文】尝尝惭を用いた俳句推敲と批评文生成に関する研究 【修士论文】尝尝惭を用いた俳句推敲と批评文生成に関する研究
【修士论文】尝尝惭を用いた俳句推敲と批评文生成に関する研究
harmonylab
?
【修士論文】視覚言語モデルを用いた衣服画像ペアの比較文章生成に関する研究(A Study on the Generation of Comparative...
【修士論文】視覚言語モデルを用いた衣服画像ペアの比較文章生成に関する研究(A Study on the Generation of Comparative...【修士論文】視覚言語モデルを用いた衣服画像ペアの比較文章生成に関する研究(A Study on the Generation of Comparative...
【修士論文】視覚言語モデルを用いた衣服画像ペアの比較文章生成に関する研究(A Study on the Generation of Comparative...
harmonylab
?
【DLゼミ】Generative Image Dynamics, CVPR2024
【DLゼミ】Generative Image Dynamics, CVPR2024【DLゼミ】Generative Image Dynamics, CVPR2024
【DLゼミ】Generative Image Dynamics, CVPR2024
harmonylab
?
From Pretraining Data to Language Models to Downstream Tasks: Tracking the Tr...
From Pretraining Data to Language Models to Downstream Tasks:Tracking the Tr...From Pretraining Data to Language Models to Downstream Tasks:Tracking the Tr...
From Pretraining Data to Language Models to Downstream Tasks: Tracking the Tr...
harmonylab
?
Generating Automatic Feedback on UI Mockups with Large Language Models
Generating Automatic Feedback on UI Mockups with Large Language ModelsGenerating Automatic Feedback on UI Mockups with Large Language Models
Generating Automatic Feedback on UI Mockups with Large Language Models
harmonylab
?
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
harmonylab
?
【修士论文】代替出勤者の选定业务における依頼顺决定方法に関する研究   千坂知也
【修士论文】代替出勤者の选定业务における依頼顺决定方法に関する研究   千坂知也【修士论文】代替出勤者の选定业务における依頼顺决定方法に関する研究   千坂知也
【修士论文】代替出勤者の选定业务における依頼顺决定方法に関する研究   千坂知也
harmonylab
?
【修士论文】経路探索のための媒介中心性に基づく道路ネットワーク阶层化手法に関する研究
【修士论文】経路探索のための媒介中心性に基づく道路ネットワーク阶层化手法に関する研究【修士论文】経路探索のための媒介中心性に基づく道路ネットワーク阶层化手法に関する研究
【修士论文】経路探索のための媒介中心性に基づく道路ネットワーク阶层化手法に関する研究
harmonylab
?
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
harmonylab
?
【卒业论文】印象タグを用いた衣服画像生成システムに関する研究
【卒业论文】印象タグを用いた衣服画像生成システムに関する研究【卒业论文】印象タグを用いた衣服画像生成システムに関する研究
【卒业论文】印象タグを用いた衣服画像生成システムに関する研究
harmonylab
?
【卒业论文】大规模言语モデルを用いたマニュアル文章修正手法に関する研究
【卒业论文】大规模言语モデルを用いたマニュアル文章修正手法に関する研究【卒业论文】大规模言语モデルを用いたマニュアル文章修正手法に関する研究
【卒业论文】大规模言语モデルを用いたマニュアル文章修正手法に関する研究
harmonylab
?
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
harmonylab
?
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile BackboneDLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
harmonylab
?
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat ModelsDLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
harmonylab
?

Ppt takahashi

  • 1. 協調荷押し問題の複雑性に関する考察 Complexity of Cooperative Package Pushing Problem 複合情報学専攻 複雑系工学講座 調和系工学研究室 修士2年 高橋 春樹
  • 2. 背景 MASの設計技術を向上させるため,適切な難易度の問題設定が必要 MAS 設 計 技 術 創発(GAなどによるMAS設計) 現状:「評価関数 = 問題の難易度」 適用問題の難易度 評価関数による難易度 評価関数に現れない性質も多く, 問題の難易度を正しく表しているとはいえない 問題の難易度を正しく測る指標が必要
  • 3. 目的 既存の問題群の複雑性や難易度の順序関係を求め 複雑さの新しい指標の知見を得る 問題の難易度 新しい指標 知見 既存の問題群 順序関係を導く 発現したエージェント群の複雑性
  • 4. システムの複雑性の指標 情報エントロピーと相互情報量 自己組織化するシステムにおける情報エントロピー 散逸構造論、非平衡開放系 ?エントロピーの低い状態 : 情報を獲得して行動が自己組織化 ?エントロピーが増える : 情報を獲得していない,異なる安定状態に移行 ?エージェントと環境のエントロピーのやりとり[Parunak 2001] ?非平衡開放系としてのMASにおけるエントロピーのふるまい[Guerin 2004] エージェントにとっての情報の価値を定量化する相互情報量 ?相互情報量が大きい : 情報がエージェントにとって意味のあるものとなっている ?相互情報量が小さい : 情報がエージェントにとって意味のないものとなっている ?エージェントの相互作用の定量化[西川 2004] ?セルオートマトンの複雑さと計算能力の指標[Langton 1990] こうした指標を用いたシステム間の比較は行われていない
  • 5. 研究概要 問題の難易度 新しい指標 知見 既存の問題群 順序関係を導く 発現したエージェント群の複雑性
  • 6. 協調荷押し問題 概要 MASの協調行動を促す問題設定 [大倉2008][片田2008][伍賀2007] 均一な自律エージェント 荷の数字は押すために必要なエージェント数 5 3 2 ゴール シミュレータとしてODEを使用 様々な設定 : エージェント数 , 荷の数 , 配置 設定により,難易度がどのように変化するかは不明
  • 7. 問題一覧 下図のようなエージェント数,荷の配置でシミュレーション エージェント数n体,荷の数m個の設定をnAmPと表記する 1A1P 2A1P 1 2 2A2P 3A1P 3A2P 1 3A3P 4A1P 1 2 3 1 4 1 1 1 4A2P 1 4A4P 5A1P 5A2P 1 5A3P 2 1 1 5 3 2 1 4 1 1 6A1P 6A2P 1 6A3P 1 6A6P 1 5A5P 3 1 1 2 1 1 6 1 1 3 1 3 1 1
  • 8. エージェントの入出力 Input0~7 0or1 IRセンサ Input8 -1~1 エージェントとの距離(2m以下) Input9 -1~1 〃(2m~5m) Input10 -1~1 〃(5m~) Input11 -1~1 エージェントとの角度sinα Input12 -1~1 〃cosα GAによって学習 Input13 -1~1 荷との距離(2m以下) Input14 -1~1 〃(2m~5m) 最近のエージェント Input15 -1~1 〃(5m~) 最近の荷 Input16 -1~1 最近の荷との角度sinβ y Input17 -1~1 〃cosβ 針路 Input18 -1~1 エージェントの針路sinγ α β Input19 -1~1 〃cosγ x γ Output0 -1~1 左モータの出力(目標角速度) Output1 -1~1 右モータの出力
  • 9. 情报量の计算 各エージェント毎に観測された入出力の確率分布から 情報エントロピーと相互情報量を計算 IN={input0,input1, 入力 OUT={out0,out1} ???,input } 19 出力 PIN POUT 情報エントロピー 相互情報量 p(out, input ) H (OUT ) P(out) log P(out) I (OUT ; IN ) p(out, input ) log out in P(out ) P(input ) H (OUT ) H (OUT | IN ) 出力のエントロピー = 行動の多様性 入力と出力の相互情報量 =センサの重要性 出力のエントロピーで割ることで入力が 出力に与える割合を算出
  • 10. 各設定毎の情報量 個別の設定毎に適用 (エージェント2体 荷1個の例) 2A1P 相互情報量から,各エージェントの 入力の処理の違いを比較 エージェント1の相互情報量 エージェント2の相互情報量
  • 11. 研究概要 問題の難易度 新しい指標 知見 既存の問題群 順序関係を導く 発現したエージェント群の複雑性
  • 12. 设定毎に発现したエージェント差 「タスク達成に要求されるエージェントの多様さ」 =設定の複雑性 とすると 「一つの設定で発生したエージェントの差」=設定の複雑性 各エージェントの相互情報量をベクトルとして捉え距離を算出 エージェント1の各相互情報量 エージェント2の各相互情報量 A1 = {IR 1, Ar1 , Ad1 , Pr 1, Pd1 , D1} A2 = {IR2 , Ar2 , Ad2 , Pr2 , Pd2 , D2} ( IR 1 IR 2 ) 2 ( Ar 1 Ar 2 ) 2 エージェント間の距離= ( Ad 1 Ad 2 ) 2 (Pr 1 Pr 2 ) 2 ( Pd 1 Pd 2 ) 2 ( d 1 d 2 ) 2
  • 13. 设定毎に现れるエージェントの违い エージェント間の差が大きかった問題設定順に並べたもの エ ー ジ ェ ン ト 間 の 距 離 各設定 エージェントや荷の数に応じて差が大きくなっていない
  • 15. 动作からの考察 最も相互情報量に差のあったエージェントを比較 5Agents 3Packagesのデータ 2体のエージェントでは挙動やセンサ の使い方に差が見られる 1つのニューラルネットワークに多様な Goal Line 計算を要求される設定 エージェント2 エージェント5
  • 16. 出力のエントロピーと相互情报量から见る性质 全エージェントのエントロピーと相互情報量 設定に応じた自己組織化 (センサの重要性) (行動の多様性) 行動の多様性が求められる問題ほど入力の情報の価値が高い
  • 17. まとめ 問題の難易度 新しい指標 知見 エージェントの数や荷の数で は決まらない 既存の問題群 エージェントの差が大きいほど 多様な計算を要求され,複雑 順序関係を導く 発現したエージェント群の複雑性