際際滷

際際滷Share a Scribd company logo
classificare informazione:  le tendenze del nuovo web Gino Roncaglia Universit della Tuscia
nuovo web, nuovi termini per cominciare, un po di confusione:  web 2.0 web semantico metadati social networking collaborative filtering user generated content folksonomies web 3.0  partiamo dal concetto che sembra essere pi湛 chiaro: il semantic web
semantic web, macchine, utenti il progetto del semantic web  affiancare allinformazione primaria presente in rete, metainformazioni (e in particolare metainformazioni semantiche)  suscettibili di elaborazione automatica ; lobiettivo principale 竪 quello di permettere la realizzazione di agenti di ricerca, selezione, organizzazione, elaborazione dei dati che, utilizzando le metainformazioni fornite e interagendo fra loro grazie alla condivisione dei relativi formalismi, permettano una gestione e manipolazione intelligente dellinformazione primaria, in un contesto di interoperabilit; lutente finale non 竪 il  destinatario immediato  della metainformazione semantica aggiunta al sistema: ne 竪 piuttosto un  destinatario mediato , avendo in tal modo a disposizione strumenti pi湛 potenti ed intelligenti per reperire, selezionare, organizzare, gestire linformazione.
metadati il cuore del problema 竪 nella metainformazione  ma cos竪 la metainformazione?  metadata are data about data alcune distinzioni tradizionali non sempre funzionano metadati descrittivi e gestionali (ormai anche i metadati descrittivi hanno una funzione gestionale) la stessa distinzione fra dati e metadati pu嘆 essere problematica (il titolo di un articolo 竪 insieme metadato e parte del testo) metadati testuali per informazione non testuale metadati descrittivi e modelli di descrizione la costruzione di sistemi di metadati presuppone di norma una  interpretazione , un  modello  di ci嘆 che si descrive
un compito non facile i problemi del semantic web  quali forme di modellizzazione adottare? quali soluzioni e formalismi adottare per rappresentare linformazione primaria e associarvi le opportune metainformazioni semantiche? chi deve fare questo lavoro? E di quali strumenti ha bisogno? come garantire linteroperabilit fra soluzioni e formalismi diversi? ma anche di che tipo di strumenti intelligenti ha bisogno lutente finale? come evitare che il rapporto fortemente mediato (dai professionisti della metainformazione, dalle loro scelte in materia di modellizzazione e formalismo, dagli agenti software utilizzati)  non crei strumenti lontani dalle effettive necessit  e capacit  degli utenti?
semantiche controllate il semantic web sembra presupporre, in prima istanza, semantiche rigide, controllate e altamente formali per renderle suscettibili di elaborazione automatica in maniera efficiente per garantirne linteroperabilit per garantire uniformit e rigore nei criteri di classificazione
 e semantiche libere gli utenti sembrano spesso operare in base a semantiche non rigorose, non rigide, soggettive, facili apparentemente incompatibili con presupposti e metodi del semantic web apparentemente non utilizzabili per classificare, ricercare, selezionare ed elaborare in maniera efficace linformazione in rete
folksonomies (social tagging) e allora perch辿 tanta attenzione attorno alle folksonomies? innanzitutto: di cosa si tratta? un sistema di categorizzazione collaborativa ( social tagging ) dei contenuti sulla base di parole chiave o etichette ( tag ) assegnate direttamente dagli utenti finali (siano essi i produttori e/o i fruitori dei contenuti classificati) cio竪 proprio quello che pensavamo fosse meglio evitare?? forse o forse no. Attenzione allaspetto collaborativo e sociale del processo di categorizzazione: potrebbe aiutare a superare alcuni dei problemi tradizionali delle semantiche non controllate
una definizione e allora perch辿 tanta attenzione attorno alle folksonomies? innanzitutto: di cosa si tratta? Folksonomy is the result of personal free tagging of information and objects (anything with a URL) for one's own retrieval. The tagging is done in a social environment (shared and open to others). The act of tagging is done by the person consuming the information. The value in this external tagging is derived from people using their own vocabulary and adding explicit meaning (). The people are not so much categorizing as providing a means to connect items and to provide their meaning in their own understanding. (T. Vanderwal 2005; cf. anche T. Vanderwal 2006: http://www.dlib.org/dlib/january06/guy/01guy.html)
not all folksonomies are equal i sistemi di classificazione semantica basati su folksonomies possono essere anche assai diversi luno dallaltro Gene Smith 2005, http://atomiq.org/archives/2005/01/visual_folksonomy_explanation.html
user generated content la diffusione del social tagging 竪 strettamente legata alla crescita esponenziale del cosiddetto user generated content quando enormi quantit di contenuti informativi sono immessi in rete direttamente dagli utenti, gli utenti stessi tendono inevitabilmente ad essere anche i responsabili della descrizione dei contenuti immessi corollario: gli strumenti di upload di contenuti verso la rete devono permettere meccanismi semplici e funzionali di descrizione dei contenuti inviati i tag sembrano essere la soluzione pi湛 semplice
folksonomies e collaborative filtering i sistemi basati su folksonomies che funzionano meglio sono quelli che sfruttano la loro natura sociale e collaborativa per migliorare la qualit del processo di classificazione semantica lo strumento normalmente usato a questo scopo 竪 quello del  collaborative filtering i comportamenti classificatori di pi湛 utenti relativamente a uno stesso contenuto vengono confrontati fra loro, con lobiettivo di fare emergere quelli pi湛 frequenti, che possono a loro volta essere suggeriti (ma non imposti) ai nuovi classificatori
collaborative filtering un esempio: Amazon segnalazione del consenso normalizzazione e frequenza
migliorare il collaborative filtering strategie non ancora ottimali, ma che potrebbero essere integrate da altri strumenti; ad es folksonomies con start-up specialistico il sistema viene aperto alla classificazione libera dopo aver registrato per un certo periodo solo comportamenti classificatori di utenti preparati  che assumono funzione guida per i comportamenti classificatori dei nuovi utenti
collaborative filtering e autorit richiesta esplicita del contributo specialistico ad es. Google Co-op
premiare il consenso folksonomies che premiano il consenso ad es. Google Image Labeler
folksonomies: i problemi nessun problema, dunque? non proprio le folksonomies  senza aiuti  restano uno strumento assai povero per  organizzare e strutturare  la metainformazione semantica (ma strumenti di questo tipo potrebbero essere aggiunti anche a metodi di modellizzazione semantica assai pi湛 complessi, come le mappe topiche) sono soggette a problemi di  meta noise  (metadati irrilevanti) e vandalismo (senza gli strumenti di revert dei wiki) gli strumenti di collaborative filtering richiedono grandi numeri per funzionare
folksonomies non standard Nonostante i problemi, il social tagging offre dunque  uno strumento che pu嘆 essere integrato con altri, formalmente pi湛 rigorosi e soddisfacenti ma meno facili e diffusi.  In questo lavoro di integrazione va tenuta presente la ricchezza che si pu嘆 nascondere dietro le etichette di una folksonomy, che in fondo rappresentano, pi湛 che un significato, un insieme di risorse ( interpretazione estensionale dei tag ) etichette non standard: citato  da  x (social trackback)
il livello della mediazione sembra dunque essere  possibile una terza via fra folksonomies costruite dal basso (in cui il collaborative filtering 竪 lunico strumento di normalizzazione) e ontologie rigidamente controllate una terza via di questo genere presuppone un  livello di mediazione  ( mediation layer ), in cui le tassonomie sono discusse e raffinate in maniera esplicita  potrebbe essere utile una nuova generazione di strumenti destinata proprio a semplificare e razionalizzare la discussione esplicita di tassonomie e il loro miglioramento qualitativo ( explicit collaborative filtering )
social tagging e mediazione informativa per la loro capacit di coinvolgere gli utenti nel processo di organizzazione dei contenuti e di recepirne i comportamenti classificatori, le folksonomies possono essere uno strumento utilissimo in situazioni di mediazione informativa 竪 bene per嘆 che siano usate in modo consapevole, verificando che i numeri di comportamenti classificatori raccolti sia sufficiente a garantirne la significativit e affiancando strumenti di collaborative filtering (nonch辿, se possibile, un  mediation layer )
classificare materiali didattici nellambito del master, avete incontrato o incontrerete diversi sistemi di metadatazione utilizzabili per classificare materiali didattici (a cominciare da LOM). Non 竪 questa la sede per parlarne, ma pu嘆 essere utile indicare un problema di un certo rilievo: molti sistemi di metadatazione per materiali didattici sembrano presupporre che questi materiali siano nati in un contesto di apprendimento formale e siano bene organizzati (modello learning object) ma 竪 bene ricordare sempre che non tutti i materiali didattici sono learning object!
flessibilit, interoperabilit i nostri sistemi di metadatazione devono essere abbastanza flessibili da funzionare anche con materiali ( learning assets ) di natura eterogenea, magari prodotti in contesti informali in questo caso i sistemi di social tagging ci possono aiutare? in molti casi probabilmente s狸, ma attenzione a non lavorare su due strade troppo divergenti 竪 bene prevedere dei  mediation layers le ricerche devono poter essere integrate 竪 dunque sempre importante lavorare comunque con lobiettivo dellinteroperabilit, anche (soprattutto) a livello di metadati

More Related Content

Classificare informazione: le tendenze del nuovo web

  • 1. classificare informazione: le tendenze del nuovo web Gino Roncaglia Universit della Tuscia
  • 2. nuovo web, nuovi termini per cominciare, un po di confusione: web 2.0 web semantico metadati social networking collaborative filtering user generated content folksonomies web 3.0 partiamo dal concetto che sembra essere pi湛 chiaro: il semantic web
  • 3. semantic web, macchine, utenti il progetto del semantic web affiancare allinformazione primaria presente in rete, metainformazioni (e in particolare metainformazioni semantiche) suscettibili di elaborazione automatica ; lobiettivo principale 竪 quello di permettere la realizzazione di agenti di ricerca, selezione, organizzazione, elaborazione dei dati che, utilizzando le metainformazioni fornite e interagendo fra loro grazie alla condivisione dei relativi formalismi, permettano una gestione e manipolazione intelligente dellinformazione primaria, in un contesto di interoperabilit; lutente finale non 竪 il destinatario immediato della metainformazione semantica aggiunta al sistema: ne 竪 piuttosto un destinatario mediato , avendo in tal modo a disposizione strumenti pi湛 potenti ed intelligenti per reperire, selezionare, organizzare, gestire linformazione.
  • 4. metadati il cuore del problema 竪 nella metainformazione ma cos竪 la metainformazione? metadata are data about data alcune distinzioni tradizionali non sempre funzionano metadati descrittivi e gestionali (ormai anche i metadati descrittivi hanno una funzione gestionale) la stessa distinzione fra dati e metadati pu嘆 essere problematica (il titolo di un articolo 竪 insieme metadato e parte del testo) metadati testuali per informazione non testuale metadati descrittivi e modelli di descrizione la costruzione di sistemi di metadati presuppone di norma una interpretazione , un modello di ci嘆 che si descrive
  • 5. un compito non facile i problemi del semantic web quali forme di modellizzazione adottare? quali soluzioni e formalismi adottare per rappresentare linformazione primaria e associarvi le opportune metainformazioni semantiche? chi deve fare questo lavoro? E di quali strumenti ha bisogno? come garantire linteroperabilit fra soluzioni e formalismi diversi? ma anche di che tipo di strumenti intelligenti ha bisogno lutente finale? come evitare che il rapporto fortemente mediato (dai professionisti della metainformazione, dalle loro scelte in materia di modellizzazione e formalismo, dagli agenti software utilizzati) non crei strumenti lontani dalle effettive necessit e capacit degli utenti?
  • 6. semantiche controllate il semantic web sembra presupporre, in prima istanza, semantiche rigide, controllate e altamente formali per renderle suscettibili di elaborazione automatica in maniera efficiente per garantirne linteroperabilit per garantire uniformit e rigore nei criteri di classificazione
  • 7. e semantiche libere gli utenti sembrano spesso operare in base a semantiche non rigorose, non rigide, soggettive, facili apparentemente incompatibili con presupposti e metodi del semantic web apparentemente non utilizzabili per classificare, ricercare, selezionare ed elaborare in maniera efficace linformazione in rete
  • 8. folksonomies (social tagging) e allora perch辿 tanta attenzione attorno alle folksonomies? innanzitutto: di cosa si tratta? un sistema di categorizzazione collaborativa ( social tagging ) dei contenuti sulla base di parole chiave o etichette ( tag ) assegnate direttamente dagli utenti finali (siano essi i produttori e/o i fruitori dei contenuti classificati) cio竪 proprio quello che pensavamo fosse meglio evitare?? forse o forse no. Attenzione allaspetto collaborativo e sociale del processo di categorizzazione: potrebbe aiutare a superare alcuni dei problemi tradizionali delle semantiche non controllate
  • 9. una definizione e allora perch辿 tanta attenzione attorno alle folksonomies? innanzitutto: di cosa si tratta? Folksonomy is the result of personal free tagging of information and objects (anything with a URL) for one's own retrieval. The tagging is done in a social environment (shared and open to others). The act of tagging is done by the person consuming the information. The value in this external tagging is derived from people using their own vocabulary and adding explicit meaning (). The people are not so much categorizing as providing a means to connect items and to provide their meaning in their own understanding. (T. Vanderwal 2005; cf. anche T. Vanderwal 2006: http://www.dlib.org/dlib/january06/guy/01guy.html)
  • 10. not all folksonomies are equal i sistemi di classificazione semantica basati su folksonomies possono essere anche assai diversi luno dallaltro Gene Smith 2005, http://atomiq.org/archives/2005/01/visual_folksonomy_explanation.html
  • 11. user generated content la diffusione del social tagging 竪 strettamente legata alla crescita esponenziale del cosiddetto user generated content quando enormi quantit di contenuti informativi sono immessi in rete direttamente dagli utenti, gli utenti stessi tendono inevitabilmente ad essere anche i responsabili della descrizione dei contenuti immessi corollario: gli strumenti di upload di contenuti verso la rete devono permettere meccanismi semplici e funzionali di descrizione dei contenuti inviati i tag sembrano essere la soluzione pi湛 semplice
  • 12. folksonomies e collaborative filtering i sistemi basati su folksonomies che funzionano meglio sono quelli che sfruttano la loro natura sociale e collaborativa per migliorare la qualit del processo di classificazione semantica lo strumento normalmente usato a questo scopo 竪 quello del collaborative filtering i comportamenti classificatori di pi湛 utenti relativamente a uno stesso contenuto vengono confrontati fra loro, con lobiettivo di fare emergere quelli pi湛 frequenti, che possono a loro volta essere suggeriti (ma non imposti) ai nuovi classificatori
  • 13. collaborative filtering un esempio: Amazon segnalazione del consenso normalizzazione e frequenza
  • 14. migliorare il collaborative filtering strategie non ancora ottimali, ma che potrebbero essere integrate da altri strumenti; ad es folksonomies con start-up specialistico il sistema viene aperto alla classificazione libera dopo aver registrato per un certo periodo solo comportamenti classificatori di utenti preparati che assumono funzione guida per i comportamenti classificatori dei nuovi utenti
  • 15. collaborative filtering e autorit richiesta esplicita del contributo specialistico ad es. Google Co-op
  • 16. premiare il consenso folksonomies che premiano il consenso ad es. Google Image Labeler
  • 17. folksonomies: i problemi nessun problema, dunque? non proprio le folksonomies senza aiuti restano uno strumento assai povero per organizzare e strutturare la metainformazione semantica (ma strumenti di questo tipo potrebbero essere aggiunti anche a metodi di modellizzazione semantica assai pi湛 complessi, come le mappe topiche) sono soggette a problemi di meta noise (metadati irrilevanti) e vandalismo (senza gli strumenti di revert dei wiki) gli strumenti di collaborative filtering richiedono grandi numeri per funzionare
  • 18. folksonomies non standard Nonostante i problemi, il social tagging offre dunque uno strumento che pu嘆 essere integrato con altri, formalmente pi湛 rigorosi e soddisfacenti ma meno facili e diffusi. In questo lavoro di integrazione va tenuta presente la ricchezza che si pu嘆 nascondere dietro le etichette di una folksonomy, che in fondo rappresentano, pi湛 che un significato, un insieme di risorse ( interpretazione estensionale dei tag ) etichette non standard: citato da x (social trackback)
  • 19. il livello della mediazione sembra dunque essere possibile una terza via fra folksonomies costruite dal basso (in cui il collaborative filtering 竪 lunico strumento di normalizzazione) e ontologie rigidamente controllate una terza via di questo genere presuppone un livello di mediazione ( mediation layer ), in cui le tassonomie sono discusse e raffinate in maniera esplicita potrebbe essere utile una nuova generazione di strumenti destinata proprio a semplificare e razionalizzare la discussione esplicita di tassonomie e il loro miglioramento qualitativo ( explicit collaborative filtering )
  • 20. social tagging e mediazione informativa per la loro capacit di coinvolgere gli utenti nel processo di organizzazione dei contenuti e di recepirne i comportamenti classificatori, le folksonomies possono essere uno strumento utilissimo in situazioni di mediazione informativa 竪 bene per嘆 che siano usate in modo consapevole, verificando che i numeri di comportamenti classificatori raccolti sia sufficiente a garantirne la significativit e affiancando strumenti di collaborative filtering (nonch辿, se possibile, un mediation layer )
  • 21. classificare materiali didattici nellambito del master, avete incontrato o incontrerete diversi sistemi di metadatazione utilizzabili per classificare materiali didattici (a cominciare da LOM). Non 竪 questa la sede per parlarne, ma pu嘆 essere utile indicare un problema di un certo rilievo: molti sistemi di metadatazione per materiali didattici sembrano presupporre che questi materiali siano nati in un contesto di apprendimento formale e siano bene organizzati (modello learning object) ma 竪 bene ricordare sempre che non tutti i materiali didattici sono learning object!
  • 22. flessibilit, interoperabilit i nostri sistemi di metadatazione devono essere abbastanza flessibili da funzionare anche con materiali ( learning assets ) di natura eterogenea, magari prodotti in contesti informali in questo caso i sistemi di social tagging ci possono aiutare? in molti casi probabilmente s狸, ma attenzione a non lavorare su due strade troppo divergenti 竪 bene prevedere dei mediation layers le ricerche devono poter essere integrate 竪 dunque sempre importante lavorare comunque con lobiettivo dellinteroperabilit, anche (soprattutto) a livello di metadati