際際滷

際際滷Share a Scribd company logo
L'intelligenza collettiva per
 organizzare la conoscenza
            sul Web


          Federico Cairo
      7属 Nexa Lunch Seminar
Politecnico di Torino  23/01/2013
Il concetto di intelligenza collettiva
nasce nellambito della biologia per
    descrivere il comportamento di
alcune specie animali (come le api e
le formiche) che agiscono in gruppo
   come un unico superorganismo.
In sociologia 竪 stato affrontato da
 diversi autori come Douglas Engelbart
  (1945), Pierre L辿vy (1994) e Howard
  Bloom (1995), ma 竪 divenuto noto al
  grande pubblico grazie allopera del
giornalista americano James Surowiecki
    The Wisdom of Crowds (2004).
Surowiecki racconta un esempio
  di intelligenza collettiva che fu
rilevato nel 1906 dallo scienziato
inglese Francis Galton durante la
fiera contadina di Plymouth, nel
        sud dellInghilterra.
Nel suo testo Reinventing
    Discovery: The New Era of
  Networked Science, il fisico
canadese Michael Nielsen indaga
    come gli strumenti online
possano amplificare lintelligenza
collettiva per favorire la scoperta
            scientifica.
Nel 1999 Garry Kasparov affronta il
resto del mondo in una partita a scacchi
   online organizzata da Microsoft. Per
     Nielsen 竪 un esempio di come gli
 strumenti collaborativi online possano
 attivare meccanismi di problem solving
   inarrivabili per il singolo individuo.
Wikipedia 竪 la pi湛 grande
enciclopedia digitale del mondo.
Contiene pi湛 di 23 milioni di voci
     scritte in 275 lingue. 
  interamente gestita da una
comunit di utenti e pu嘆 essere
   modificata e arricchita da
chiunque abbia accesso al Web.
Per quanto superficiali o incomplete possano
     apparire le voci di Wikipedia ai suoi
 detrattori, esse sono il frutto di un accordo
    semantico degli utenti di Internet che
attribuisce ad ogni voce un concetto univoco.
  Wikipedia ha vinto una sorta di selezione
 naturale che lha portata ad essere usata di
fatto come ontologia di riferimento sul Web.
Wikipedia condivide il sistema di valori del
movimento FOSS (Free and Open Source
 Software) di cui Jimmy Wales 竪 stato fin
dallinizio un sostenitore. Given enough
   eyeballs, all bugs are shallow (Eric
Raymond, The Cathedral and the Bazaar),
   questa fiducia 竪 il presupposto della
       collaborazione in Wikipedia.
DBpedia, la trasposizione in
formato Linked Data dei contenuti
  di Wikipedia, costituisce oggi il
nodo principale del Web dei Dati. I
Linked Data publisher connettono
 sempre pi湛 spesso i propri nodi a
  quelli di DBpedia, rendendola il
  fulcro di interconnessione tra i
dataset pubblicati nello spazio del
          Web Semantico.
Il sovraccarico cognitivo, meglio
  conosciuto come information
  overload, si verifica quando si
  ricevono troppe informazioni
    per riuscire a prendere una
    decisione o sceglierne una
 specifica sulla quale focalizzare
l'attenzione. (fonte: Wikipedia)
I Linked Open Data possono
   contribuire efficacemente a
    contrastare il problema del
sovraccarico informativo. Questo
aspetto del Web Semantico viene
 indagato da David Weinberger
  nel capitolo 9 della sua ultimo
saggio Too big to know (2011).
Una strategia per contrastare il sovraccarico
   informativo 竪 aggiungere informazione
allinformazione. I LOD possono metadatare
i contenuti del Web attraverso concetti non
     ambigui rappresentati da URI. Se gli
      argomenti di una pagina Web sono
identificati attraverso URI, anzich辿 semplici
 tag, si elimina lambiguit delle parole e si
 migliora la precisione dei motori di ricerca.
Essendo DBpedia collegata a un vasto
 "corpus" multilingue preannotato di
 carattere enciclopedico (Wikipedia),
risulta tecnicamente molto adatta ad
 essere utilizzata per procedimenti di
natural language processing e di text
mining, finalizzati alla classificazione
 automatica dei documenti sul Web.
I software che utilizzano Wikipedia e
         DBpedia per l'estrazione e
  l'arricchimento dei contenuti sul Web,
       come per esempio TellMeFirst
(tellmefirst.polito.it), fanno appunto leva
sullintelligenza collettiva delle comunit
  online, mostrandone le potenzialit e i
      benefici per gli utenti di Internet.
TellMeFirst 竪 uno strumento per la
  classificazione e l'arricchimento dei
documenti testuali tramite Linked Open
Data. Sfrutta le tecnologie del Semantic
 Web e del NLP per estrarre dai testi gli
argomenti principali in forma di risorse
     DBpedia e arricchirli con nuove
informazioni e contenuti recuperati dal
 Web (immagini, video, mappe, news).
Demo!
Quest'opera 竪 distribuita con licenza Creative Commons
Attribuzione - Non commerciale - Condividi allo stesso modo 3.0 Italia.



                   Grazie per lattenzione!

                     Federico Cairo
                 federico.cairo@polito.it
           Politecnico di Torino  23/01/2013

More Related Content

Federico Cairo - L'intelligenza collettiva per organizzare la conoscenza sul Web

  • 1. L'intelligenza collettiva per organizzare la conoscenza sul Web Federico Cairo 7属 Nexa Lunch Seminar Politecnico di Torino 23/01/2013
  • 2. Il concetto di intelligenza collettiva nasce nellambito della biologia per descrivere il comportamento di alcune specie animali (come le api e le formiche) che agiscono in gruppo come un unico superorganismo.
  • 3. In sociologia 竪 stato affrontato da diversi autori come Douglas Engelbart (1945), Pierre L辿vy (1994) e Howard Bloom (1995), ma 竪 divenuto noto al grande pubblico grazie allopera del giornalista americano James Surowiecki The Wisdom of Crowds (2004).
  • 4. Surowiecki racconta un esempio di intelligenza collettiva che fu rilevato nel 1906 dallo scienziato inglese Francis Galton durante la fiera contadina di Plymouth, nel sud dellInghilterra.
  • 5. Nel suo testo Reinventing Discovery: The New Era of Networked Science, il fisico canadese Michael Nielsen indaga come gli strumenti online possano amplificare lintelligenza collettiva per favorire la scoperta scientifica.
  • 6. Nel 1999 Garry Kasparov affronta il resto del mondo in una partita a scacchi online organizzata da Microsoft. Per Nielsen 竪 un esempio di come gli strumenti collaborativi online possano attivare meccanismi di problem solving inarrivabili per il singolo individuo.
  • 7. Wikipedia 竪 la pi湛 grande enciclopedia digitale del mondo. Contiene pi湛 di 23 milioni di voci scritte in 275 lingue. interamente gestita da una comunit di utenti e pu嘆 essere modificata e arricchita da chiunque abbia accesso al Web.
  • 8. Per quanto superficiali o incomplete possano apparire le voci di Wikipedia ai suoi detrattori, esse sono il frutto di un accordo semantico degli utenti di Internet che attribuisce ad ogni voce un concetto univoco. Wikipedia ha vinto una sorta di selezione naturale che lha portata ad essere usata di fatto come ontologia di riferimento sul Web.
  • 9. Wikipedia condivide il sistema di valori del movimento FOSS (Free and Open Source Software) di cui Jimmy Wales 竪 stato fin dallinizio un sostenitore. Given enough eyeballs, all bugs are shallow (Eric Raymond, The Cathedral and the Bazaar), questa fiducia 竪 il presupposto della collaborazione in Wikipedia.
  • 10. DBpedia, la trasposizione in formato Linked Data dei contenuti di Wikipedia, costituisce oggi il nodo principale del Web dei Dati. I Linked Data publisher connettono sempre pi湛 spesso i propri nodi a quelli di DBpedia, rendendola il fulcro di interconnessione tra i dataset pubblicati nello spazio del Web Semantico.
  • 11. Il sovraccarico cognitivo, meglio conosciuto come information overload, si verifica quando si ricevono troppe informazioni per riuscire a prendere una decisione o sceglierne una specifica sulla quale focalizzare l'attenzione. (fonte: Wikipedia)
  • 12. I Linked Open Data possono contribuire efficacemente a contrastare il problema del sovraccarico informativo. Questo aspetto del Web Semantico viene indagato da David Weinberger nel capitolo 9 della sua ultimo saggio Too big to know (2011).
  • 13. Una strategia per contrastare il sovraccarico informativo 竪 aggiungere informazione allinformazione. I LOD possono metadatare i contenuti del Web attraverso concetti non ambigui rappresentati da URI. Se gli argomenti di una pagina Web sono identificati attraverso URI, anzich辿 semplici tag, si elimina lambiguit delle parole e si migliora la precisione dei motori di ricerca.
  • 14. Essendo DBpedia collegata a un vasto "corpus" multilingue preannotato di carattere enciclopedico (Wikipedia), risulta tecnicamente molto adatta ad essere utilizzata per procedimenti di natural language processing e di text mining, finalizzati alla classificazione automatica dei documenti sul Web.
  • 15. I software che utilizzano Wikipedia e DBpedia per l'estrazione e l'arricchimento dei contenuti sul Web, come per esempio TellMeFirst (tellmefirst.polito.it), fanno appunto leva sullintelligenza collettiva delle comunit online, mostrandone le potenzialit e i benefici per gli utenti di Internet.
  • 16. TellMeFirst 竪 uno strumento per la classificazione e l'arricchimento dei documenti testuali tramite Linked Open Data. Sfrutta le tecnologie del Semantic Web e del NLP per estrarre dai testi gli argomenti principali in forma di risorse DBpedia e arricchirli con nuove informazioni e contenuti recuperati dal Web (immagini, video, mappe, news).
  • 17. Demo!
  • 18. Quest'opera 竪 distribuita con licenza Creative Commons Attribuzione - Non commerciale - Condividi allo stesso modo 3.0 Italia. Grazie per lattenzione! Federico Cairo federico.cairo@polito.it Politecnico di Torino 23/01/2013