際際滷

際際滷Share a Scribd company logo
Vivere in un ambiente che contiene cibo e predatori Fabio Ruini 123 , Domenico Parisi 1 1  Consiglio Nazionale delle Ricerche Istituto di Scienze e Tecnologie della Cognizione (ISTC-CNR) Laboratory of Autonomous Robotics and Artificial Life (LARAL) 2  Universita degli Studi di Modena e Reggio Emilia Dipartimento di Scienze Sociali, Cognitive e Quantitative 3  University of Plymouth School of Computing, Communications and Electronics (SoCCE) Adaptive Behaviour and Cognition Research Group (ABC)  WIVACE - Workshop Italiano di Vita Artificiale e Computazione Evolutiva Sampieri (RG) / 5-7 Settembre 2007
Introduzione
I due livelli del comportamento livello  strategico : il livello a cui, in un dato momento, un organismo decide a quale, tra le attivit possibili, dedicarsi; livello  tattico : il livello a cui lorganismo esegue i comportamenti specifici che implementano lattivit decisa al livello strategico. Possiamo individuare due livelli entro i quali si articola il comportamento degli organismi viventi:
Il principio one simulation - one task Perch竪, questo? Controller basati su reti neurali (tradizionali della psicologia cognitivista, orientata principalmente allo studio del livello tattico del comportamento); poco interesse a livello applicativo (chi vorrebbe avere a che fare con robots indecisi o magari depressi?); maggior importanza allaspetto tattico (perlomeno nella cultura occidentale). Nella maggior parte delle ricerche dove vengono impiegati robot e/o simulazioni, esiste una tendenza diffusa a costruire una simulazione (o un robot)  per ciascuna attivit o abilit che si 竪 interessati a studiare, ignorando il fatto che un essere vivente sia solitamente in grado di svolgere pi湛 azioni e possegga differenti abilit.
Simulazione
The Predator: la simulazione Un organismo vive allinterno di un mondo discreto, non-toroidale, costituito da un quadrato di dimensioni 15x15; lorganismo pu嘆 ruotare il suo corpo di 90属 (in senso orario od anti-orario) spostarsi nella casella di fronte a lui, oppure rimanere immobile; alcune celle contengono al proprio interno ununit di cibo. Quando lorganismo termina su una di queste celle, il cibo in questione viene mangiato e di conseguenza scompare dallambiente; di tanto in tanto, sulla scena compare un predatore che d la caccia allorganismo. Il predatore pu嘆 muoversi in qualsiasi cella adiacente la propria, senza dover preliminarmente ruotare il corpo. Quando predatore ed organismo si trovano a stazionare sulla stessa cella, ha luogo una cattura, che provoca allorganismo un certo danno.
The Predator: lambiente (un po pi湛 chiaro)
The Predator: architettura neurale degli organismi Durante ogni step, lorganismo percepisce la posizione dellunit di cibo a lui pi湛 vicina, in termini di angolo e distanza (espressa come distanza di Manhattan) Quando nellambiente 竪 presente il predatore, anchesso viene percepito allo stesso modo.
The Predator: levoluzione genetica Popolazione iniziale composta da 100 individui; Evoluzione genetica per 1000 generazioni; Gli organismi vengono testati, singolarmente, per 25 epoche di 100 passi ciascuna (2500 steps complessivi). Le epoche si differenziano tra loro per una diversa distribuzione iniziale del cibo (allinizio di ciascunepoca, ogni cella ha probabilit .15 di contenere al suo interno ununit di cibo); Durante ogni epoca, il predatore compare in un momento casuale e vive per un massimo di 25 passi; Formula di fitness:  ammontare di cibo raccolto - (numero di catture subite * danno provocato dal predatore [capture damage]) ; I 20 migliori individui di ciascuna generazione vengono selezionati per la riproduzione e (mediante mutazione che agisce con probabilit .25) generano 5 figli ciascuno.
Primi risultati
Risultati per CD=10: fitness
Risultati per CD=10: ammontare di cibo raccolto
Risultati per CD=10: numero di catture subite
Modifiche al parametro capture damage
Risultati per CD=5, 10 e 50: fitness
Risultati per CD=5, 10 e 50: ammontare di cibo raccolto
Risultati per CD=5, 10 e 50: numero di catture subite
Attenzione selettiva
Discriminazione tra gli input sensoriali Limpressione che si ha, osservando il comportamento degli organismi simulati, 竪 che essi adottino effettivamente un comportamento discriminatorio: raccolta del cibo quando lambiente 竪 sicuro, fuga dal predatore quando questo fa la sua comparsa allinterno dellambiente. Il che presuppone che gli organismi siano in grado di discriminare tra linput sensoriale: quando compare il predatore, essi ignorano il cibo che continuano comunque a percepire. Si tratta di un fenomeno molto simile a quello attentivo, tipico degli esseri umani.
Una definizione operazionale dellattenzione Essendo alle prese con organismi che possono percepire soltanto due tipi diversi di oggetti (cibo e predatore) 竪 possibile indagare il fenomeno della attenzione analizzando i pattern di attivazione dellhidden layer della rete neurale. Lidea di fondo 竪 che, in un dato momento in cui 竪 presente nellambiente il predatore (che viene percepito al pari del cibo), lorganismo stia ignorando il cibo se il pattern di attivazione delle sue unit intermedie 辿 simile a quello che si avrebbe in assenza di cibo.
La misurazione dellattenzione (dove i=1 corrisponde ad ununit di cibo collocata a 45属 dallorganismo, i=2 indica 135属, i=3 rappresenta 225属 ed i=4 sta per 315属) Considerato il predatore fisso alle spalle dellorganismo, si sono presi in considerazione i pattern di attivazione variando la sua distanza e con il cibo presente/assente a diversi angoli e distanze.
Esempio per un organismo dellultima generazione, evoluto con CD=10 Ci嘆 che emerge dalla tabella qui accanto 竪 che, in presenza del predatore, lorganismo in esame opera effettivamente unoperazione di filtraggio sullinput sensoriale relativo al cibo. Tale filtering 竪 tanto pi湛 forte quanto pi湛 organismo e predatore si trovano ad essere vicini tra loro (ovvero quanto pi湛 alta 竪 la probabilit di essere catturati).
confronto tra due organismi dellultima generazione, evoluti rispettivamente con CD=10 e CD=50 Capture Damage = 10 Capture Damage = 50
Circuito motivazionale
Cortical pathway vs. sub-cortical pathway Nel cervello degli esseri umani 竪 possibile identificare due macro-componenti: parte corticale: maggiormente cognitiva, basata su neurotrasmettitori (in primis glutammato e GABA), azione molto veloce e specifica per ciascuna coppia neurone pre-sinaptico/neurone post-sinaptico; parte sottocorticale: pi湛 motivazionale/emotiva, basata su neuromodulatori (dopamina, ormoni), azione pi湛 lenta e persistente, ha una dimensione spaziale.
Larchitettura con circuito motivazionale Per rappresentare questo dualismo allinterno della nostra rete neurale abbiamo aggiunto uno strato composto da due neuroni, che viene alimentato dallinput sensoriale relativo al predatore (la componente motivazionale/emotiva nella nostra simulazione) ed 竪 collegato allhidden layer.
Assenza/presenza del circuito motivazionale (CD=10): fitness media
Assenza/presenza del circuito motivazionale (CD=10): numero di catture subite
Assenza/presenza del circuito motivazionale (CD=10): ammontare di cibo raccolto
Assenza/presenza del circuito motivazionale (CD=10): ammontare di cibo raccolto in presenza/assenza del predatore
Non una mera questione computazionale: limportanza della topologia
Confronto tra diverse architetture Per fugare il dubbio che larchitettura dotata di circuito motivazionale performi meglio di quella che ne 竪 priva soltanto per una mera questione di capacit di calcolo a disposizione, sono state poste sotto esame altre architetture neurali: 12 neuroni (senza circuito motivazionale, ma con un livello di complessit, intesa come numero di connessioni, praticamente identico); 9 neuroni (con circuito motivazionale connesso direttamente alloutput layer della rete); 9 neuroni (con circuito motivazionale collegato allhidden layer, alimentato per嘆 dallinput percettivo relativo al cibo).
Larchitettura con 12 neuroni nellhidden layer
Larchitettura con circuito motivazionale collegato direttamente alloutput layer
Larchitettura con circuito motivazionale alimentato dallinput relativo al cibo
Diverse architetture (CD=10): fitness media
Diverse architetture (CD=10): ammontare di cibo raccolto
Diverse architetture (CD=10): numero di catture subite
Un vantaggio che risiede nella capacit di filtering (I) Predator distance CD 10 - Without MC CD 10 - With MC 1 8.489375 6.546218 2 9.970525 6.80293425 3 11.794475 7.0488615 4 13.9506 7.29594175 5 16.3495 7.5685325 6 18.81695 7.916155 7 21.14095 8.4310035 8 23.153725 9.24300548
Un vantaggio che risiede nella capacit di filtering (II) Predator distance CD 50 - Without MC CD 50 - With MC 1 7.616275 0.9764835 2 8.58305 1.047504 3 9.70695 1.1608202 4 10.958125 1.31460728 5 12.28345 1.5083423 6 13.631875 1.7447572 7 14.98005 2.03258975 8 16.33185 2.39004955
Conclusioni
Conclusioni (I) Quello che 竪 stato proposto 竪 un primo tentativo (sicuramente passibile di modifiche/miglioramenti) di fornire una misura quantitativa dellattenzione allinterno di un organismo virtuale embodied. Lattenzione 竪 sicuramente un fenomeno da studiare in maniera approfondita per arrivare, un giorno, ad avere robot non solo poliedrici, ma anche e soprattutto pi湛 realistici.
Conclusioni (II) Riprodurre, anche ad un livello piuttosto astratto, circuiti nervosi (o anche soltanto la macro-organizzazione del SN) realmente esistenti negli organismi viventi pu嘆 permettere alle reti neurali di replicare una gamma di comportamenti pi湛 ampia rispetto a quella per la quale esse sono solitamente utilizzate. Nel caso specifico, il circuito limbico/motivazionale implementato ha portato a vantaggi notevoli nella capacit degli organismi nel fuggire dal predatore. Un vantaggio che si manifesta soltanto quando leffetto di questo circuito 竪 mediato dallo strato intermedio della rete e solo quando 竪 alimentato da una motivazione forte o negativa.
Sviluppi futuri Alcuni dei possibili sviluppi futuri: indagare pi湛 a fondo il ruolo del circuito motivazionale; espandere il numero di attivit alle quali lorganismo pu嘆 dedicarsi; rendere sociale lambiente di riferimento.
Main references Cecconi F., Parisi D.,  Neural Networks with Motivational Units  (in J.A. Meyer, H. Roitblat, S.W. Wilson (eds), From Animals to Animats 2: proceedings of the Second International Conference on Simulation of Adaptive Behavior. MIT Press/Bradford Books, 1992); Balkenius C.,  Motivation and Attention in an Autonomous Agent  (in Sloman, A. (Ed.), Proceedings of the Workshop on Architectures Underlying Motivation and Emotion (WAUME '93). Birmingham: University of Birmingham, 1993); Nolfi S., Parisi D.,  Neural Networks in an Artificial Life Perspective  (in W. Gerstner, A. Germond, M. Hasler, and J.D. Nicoud (Eds.) Artificial Neural Networks (ICANN97). Proceedings of the 7th International Conference on Artificial Neural Networks. Berlin: Springer Verlag, 1997, pp. 733-738); Mitchell M.,  An Introduction to Genetic Algorithms  (Cambridge MA, MIT Press, 1998); Parisi D.,  Mente. I nuovi modelli della vita artificiale  (Bologna, Il Mulino, 1999); Nolfi S., Parisi D.,  Evolution of Artificial Neural Networks  (in M. A. Arbib, Handbook of brain theory and neural networks, Second Edition (pp. 418-421). Cambridge, MA: MIT Press, 2002); Floreano D., Mattiussi C.,  Manuale sulle Reti Neurali  (Bologna, Il Mulino, 2002); Parisi D.,  Robot Futuri  (in Sistemi Intelligenti, Anno XVIII, n.1, Il Mulino, 2006);
Fine... Contatti Skype: fabio.ruini e-mail:  [email_address] web:  http://www.fabioruini.eu

More Related Content

Vivere in un ambiente che contiene cibo e predatori

  • 1. Vivere in un ambiente che contiene cibo e predatori Fabio Ruini 123 , Domenico Parisi 1 1 Consiglio Nazionale delle Ricerche Istituto di Scienze e Tecnologie della Cognizione (ISTC-CNR) Laboratory of Autonomous Robotics and Artificial Life (LARAL) 2 Universita degli Studi di Modena e Reggio Emilia Dipartimento di Scienze Sociali, Cognitive e Quantitative 3 University of Plymouth School of Computing, Communications and Electronics (SoCCE) Adaptive Behaviour and Cognition Research Group (ABC) WIVACE - Workshop Italiano di Vita Artificiale e Computazione Evolutiva Sampieri (RG) / 5-7 Settembre 2007
  • 3. I due livelli del comportamento livello strategico : il livello a cui, in un dato momento, un organismo decide a quale, tra le attivit possibili, dedicarsi; livello tattico : il livello a cui lorganismo esegue i comportamenti specifici che implementano lattivit decisa al livello strategico. Possiamo individuare due livelli entro i quali si articola il comportamento degli organismi viventi:
  • 4. Il principio one simulation - one task Perch竪, questo? Controller basati su reti neurali (tradizionali della psicologia cognitivista, orientata principalmente allo studio del livello tattico del comportamento); poco interesse a livello applicativo (chi vorrebbe avere a che fare con robots indecisi o magari depressi?); maggior importanza allaspetto tattico (perlomeno nella cultura occidentale). Nella maggior parte delle ricerche dove vengono impiegati robot e/o simulazioni, esiste una tendenza diffusa a costruire una simulazione (o un robot) per ciascuna attivit o abilit che si 竪 interessati a studiare, ignorando il fatto che un essere vivente sia solitamente in grado di svolgere pi湛 azioni e possegga differenti abilit.
  • 6. The Predator: la simulazione Un organismo vive allinterno di un mondo discreto, non-toroidale, costituito da un quadrato di dimensioni 15x15; lorganismo pu嘆 ruotare il suo corpo di 90属 (in senso orario od anti-orario) spostarsi nella casella di fronte a lui, oppure rimanere immobile; alcune celle contengono al proprio interno ununit di cibo. Quando lorganismo termina su una di queste celle, il cibo in questione viene mangiato e di conseguenza scompare dallambiente; di tanto in tanto, sulla scena compare un predatore che d la caccia allorganismo. Il predatore pu嘆 muoversi in qualsiasi cella adiacente la propria, senza dover preliminarmente ruotare il corpo. Quando predatore ed organismo si trovano a stazionare sulla stessa cella, ha luogo una cattura, che provoca allorganismo un certo danno.
  • 7. The Predator: lambiente (un po pi湛 chiaro)
  • 8. The Predator: architettura neurale degli organismi Durante ogni step, lorganismo percepisce la posizione dellunit di cibo a lui pi湛 vicina, in termini di angolo e distanza (espressa come distanza di Manhattan) Quando nellambiente 竪 presente il predatore, anchesso viene percepito allo stesso modo.
  • 9. The Predator: levoluzione genetica Popolazione iniziale composta da 100 individui; Evoluzione genetica per 1000 generazioni; Gli organismi vengono testati, singolarmente, per 25 epoche di 100 passi ciascuna (2500 steps complessivi). Le epoche si differenziano tra loro per una diversa distribuzione iniziale del cibo (allinizio di ciascunepoca, ogni cella ha probabilit .15 di contenere al suo interno ununit di cibo); Durante ogni epoca, il predatore compare in un momento casuale e vive per un massimo di 25 passi; Formula di fitness: ammontare di cibo raccolto - (numero di catture subite * danno provocato dal predatore [capture damage]) ; I 20 migliori individui di ciascuna generazione vengono selezionati per la riproduzione e (mediante mutazione che agisce con probabilit .25) generano 5 figli ciascuno.
  • 12. Risultati per CD=10: ammontare di cibo raccolto
  • 13. Risultati per CD=10: numero di catture subite
  • 14. Modifiche al parametro capture damage
  • 15. Risultati per CD=5, 10 e 50: fitness
  • 16. Risultati per CD=5, 10 e 50: ammontare di cibo raccolto
  • 17. Risultati per CD=5, 10 e 50: numero di catture subite
  • 19. Discriminazione tra gli input sensoriali Limpressione che si ha, osservando il comportamento degli organismi simulati, 竪 che essi adottino effettivamente un comportamento discriminatorio: raccolta del cibo quando lambiente 竪 sicuro, fuga dal predatore quando questo fa la sua comparsa allinterno dellambiente. Il che presuppone che gli organismi siano in grado di discriminare tra linput sensoriale: quando compare il predatore, essi ignorano il cibo che continuano comunque a percepire. Si tratta di un fenomeno molto simile a quello attentivo, tipico degli esseri umani.
  • 20. Una definizione operazionale dellattenzione Essendo alle prese con organismi che possono percepire soltanto due tipi diversi di oggetti (cibo e predatore) 竪 possibile indagare il fenomeno della attenzione analizzando i pattern di attivazione dellhidden layer della rete neurale. Lidea di fondo 竪 che, in un dato momento in cui 竪 presente nellambiente il predatore (che viene percepito al pari del cibo), lorganismo stia ignorando il cibo se il pattern di attivazione delle sue unit intermedie 辿 simile a quello che si avrebbe in assenza di cibo.
  • 21. La misurazione dellattenzione (dove i=1 corrisponde ad ununit di cibo collocata a 45属 dallorganismo, i=2 indica 135属, i=3 rappresenta 225属 ed i=4 sta per 315属) Considerato il predatore fisso alle spalle dellorganismo, si sono presi in considerazione i pattern di attivazione variando la sua distanza e con il cibo presente/assente a diversi angoli e distanze.
  • 22. Esempio per un organismo dellultima generazione, evoluto con CD=10 Ci嘆 che emerge dalla tabella qui accanto 竪 che, in presenza del predatore, lorganismo in esame opera effettivamente unoperazione di filtraggio sullinput sensoriale relativo al cibo. Tale filtering 竪 tanto pi湛 forte quanto pi湛 organismo e predatore si trovano ad essere vicini tra loro (ovvero quanto pi湛 alta 竪 la probabilit di essere catturati).
  • 23. confronto tra due organismi dellultima generazione, evoluti rispettivamente con CD=10 e CD=50 Capture Damage = 10 Capture Damage = 50
  • 25. Cortical pathway vs. sub-cortical pathway Nel cervello degli esseri umani 竪 possibile identificare due macro-componenti: parte corticale: maggiormente cognitiva, basata su neurotrasmettitori (in primis glutammato e GABA), azione molto veloce e specifica per ciascuna coppia neurone pre-sinaptico/neurone post-sinaptico; parte sottocorticale: pi湛 motivazionale/emotiva, basata su neuromodulatori (dopamina, ormoni), azione pi湛 lenta e persistente, ha una dimensione spaziale.
  • 26. Larchitettura con circuito motivazionale Per rappresentare questo dualismo allinterno della nostra rete neurale abbiamo aggiunto uno strato composto da due neuroni, che viene alimentato dallinput sensoriale relativo al predatore (la componente motivazionale/emotiva nella nostra simulazione) ed 竪 collegato allhidden layer.
  • 27. Assenza/presenza del circuito motivazionale (CD=10): fitness media
  • 28. Assenza/presenza del circuito motivazionale (CD=10): numero di catture subite
  • 29. Assenza/presenza del circuito motivazionale (CD=10): ammontare di cibo raccolto
  • 30. Assenza/presenza del circuito motivazionale (CD=10): ammontare di cibo raccolto in presenza/assenza del predatore
  • 31. Non una mera questione computazionale: limportanza della topologia
  • 32. Confronto tra diverse architetture Per fugare il dubbio che larchitettura dotata di circuito motivazionale performi meglio di quella che ne 竪 priva soltanto per una mera questione di capacit di calcolo a disposizione, sono state poste sotto esame altre architetture neurali: 12 neuroni (senza circuito motivazionale, ma con un livello di complessit, intesa come numero di connessioni, praticamente identico); 9 neuroni (con circuito motivazionale connesso direttamente alloutput layer della rete); 9 neuroni (con circuito motivazionale collegato allhidden layer, alimentato per嘆 dallinput percettivo relativo al cibo).
  • 33. Larchitettura con 12 neuroni nellhidden layer
  • 34. Larchitettura con circuito motivazionale collegato direttamente alloutput layer
  • 35. Larchitettura con circuito motivazionale alimentato dallinput relativo al cibo
  • 37. Diverse architetture (CD=10): ammontare di cibo raccolto
  • 38. Diverse architetture (CD=10): numero di catture subite
  • 39. Un vantaggio che risiede nella capacit di filtering (I) Predator distance CD 10 - Without MC CD 10 - With MC 1 8.489375 6.546218 2 9.970525 6.80293425 3 11.794475 7.0488615 4 13.9506 7.29594175 5 16.3495 7.5685325 6 18.81695 7.916155 7 21.14095 8.4310035 8 23.153725 9.24300548
  • 40. Un vantaggio che risiede nella capacit di filtering (II) Predator distance CD 50 - Without MC CD 50 - With MC 1 7.616275 0.9764835 2 8.58305 1.047504 3 9.70695 1.1608202 4 10.958125 1.31460728 5 12.28345 1.5083423 6 13.631875 1.7447572 7 14.98005 2.03258975 8 16.33185 2.39004955
  • 42. Conclusioni (I) Quello che 竪 stato proposto 竪 un primo tentativo (sicuramente passibile di modifiche/miglioramenti) di fornire una misura quantitativa dellattenzione allinterno di un organismo virtuale embodied. Lattenzione 竪 sicuramente un fenomeno da studiare in maniera approfondita per arrivare, un giorno, ad avere robot non solo poliedrici, ma anche e soprattutto pi湛 realistici.
  • 43. Conclusioni (II) Riprodurre, anche ad un livello piuttosto astratto, circuiti nervosi (o anche soltanto la macro-organizzazione del SN) realmente esistenti negli organismi viventi pu嘆 permettere alle reti neurali di replicare una gamma di comportamenti pi湛 ampia rispetto a quella per la quale esse sono solitamente utilizzate. Nel caso specifico, il circuito limbico/motivazionale implementato ha portato a vantaggi notevoli nella capacit degli organismi nel fuggire dal predatore. Un vantaggio che si manifesta soltanto quando leffetto di questo circuito 竪 mediato dallo strato intermedio della rete e solo quando 竪 alimentato da una motivazione forte o negativa.
  • 44. Sviluppi futuri Alcuni dei possibili sviluppi futuri: indagare pi湛 a fondo il ruolo del circuito motivazionale; espandere il numero di attivit alle quali lorganismo pu嘆 dedicarsi; rendere sociale lambiente di riferimento.
  • 45. Main references Cecconi F., Parisi D., Neural Networks with Motivational Units (in J.A. Meyer, H. Roitblat, S.W. Wilson (eds), From Animals to Animats 2: proceedings of the Second International Conference on Simulation of Adaptive Behavior. MIT Press/Bradford Books, 1992); Balkenius C., Motivation and Attention in an Autonomous Agent (in Sloman, A. (Ed.), Proceedings of the Workshop on Architectures Underlying Motivation and Emotion (WAUME '93). Birmingham: University of Birmingham, 1993); Nolfi S., Parisi D., Neural Networks in an Artificial Life Perspective (in W. Gerstner, A. Germond, M. Hasler, and J.D. Nicoud (Eds.) Artificial Neural Networks (ICANN97). Proceedings of the 7th International Conference on Artificial Neural Networks. Berlin: Springer Verlag, 1997, pp. 733-738); Mitchell M., An Introduction to Genetic Algorithms (Cambridge MA, MIT Press, 1998); Parisi D., Mente. I nuovi modelli della vita artificiale (Bologna, Il Mulino, 1999); Nolfi S., Parisi D., Evolution of Artificial Neural Networks (in M. A. Arbib, Handbook of brain theory and neural networks, Second Edition (pp. 418-421). Cambridge, MA: MIT Press, 2002); Floreano D., Mattiussi C., Manuale sulle Reti Neurali (Bologna, Il Mulino, 2002); Parisi D., Robot Futuri (in Sistemi Intelligenti, Anno XVIII, n.1, Il Mulino, 2006);
  • 46. Fine... Contatti Skype: fabio.ruini e-mail: [email_address] web: http://www.fabioruini.eu