information retrieval.
Le ambiguit del linguaggio libero:
effetto rumore
effetto silenzio
1 of 22
More Related Content
Rumore Silenzio
1. Metodi di ricerca in ambienti multimediali Effetto silenzio e rumore Le ambiguit del linguaggio libero A cura di Simonetta Leonardi IULINE
2. Utilizzare Google, funzioni avanzate (operatori logici), per dimostrare: *Leffetto rumore e leffetto silenzio della ricerca in rete *Le ambiguit del linguaggio libero Effetto rumore: difficolt di utilizzo dei dati dovuta alla ridondanza delle informazioni risultanti da una ricerca o causata dalla inappropriatezza delle stesse Effetto silenzio: impossibilit di chi consulta di accedere ai dati archiviati a causa della mancanza di elementi che consentano di risalire ai criteri di catalogazione delle informazioni
6. ..troppe!!! , ci impiegherei una vita ad esaminare tutti i siti. Io cerco una presentazione Powerpoint. Effettuo un altro tentativo cambiando lindicazione cerca tutti i tipi di file con cerca solo ppt. Compaiono solo 212 pagine con ppt.
7. La maggior parte delle ppt affrontano largomento trasversalmente, energia,ambiente, ambiti lavorativi o sono troppo difficili non sono utili per il mio scopo che 竪 quello di supportare con illustrazioni e parole chiave la spiegazione del ciclo dellacqua.
8. Inserisco nella voce che contengano una qualunque delle seguenti parole la stringa scuola primaria e le pagine si riducono a 84
9. Ora la maggior parte delle ppt che compaiono sono pertinenti alle mie esigenze non rimane che scegliere
10. Riassumendo: Ricerca generica : 2.670.000 occorrenze Ricerca avanzata: 2.340.000 occorrenze Riduco la ricerca a ppt: 212 occorrenze Riduco la ricerca a ppt scuola primaria:84 occorrenze
11. Considerazioni finali: Nella ricerca da me effettuata si sono manifestati contemporaneamente : leffetto rumore, per la quantit incredibile di materiale online evidenziato. Leffetto silenzio, poich辿 il materiale risultato a me utile 竪 comparso solo dopo linserimento dei termini scuola primaria, risultati determinanti per la chiave di ricerca Leffetto rumore di per s辿 genera perdita di tempo per嘆 pu嘆 anche provocare leffetto serendipity ovvero trovare casualmente informazioni che possono esserci utili in altri campi, anche se non sono oggetto di ricerca
12. Le ambiguit del linguaggio libero Il problema della gestione delle informazioni e del loro recupero, 竪 stato sempre oggetto di studio nel campo archivistico. Lavvento dellera digitale ha esteso linteresse ai data base informatizzati e alle immense risorse contenute negli spazi del Web. L information retrieval ha come campo di applicazione il trattamento e il recupero delle informazioni
13. Trattamento informazioni I metodi di archiviazione e di ricerca dei documenti si possono distinguere in due categorie: MODELLO SEQUENZIALE o IRS (Information Retrieval System ) in cui il documento 竪 rappresentato dalle parole in esso contenute, le informazioni vengono archiviate sequenzialmente MODELLO RELAZIONALE , rappresentazione indiretta attraverso termini di indicizzazione assegnati al momento dellinserimento che ne descrivono in modo sintetico e completo il contenuto.
14. Modello relazionale Di solito si basa sulla metadatazione cio嘆 lindicizzazione dei contenuti in base a parole chiave che ne facilitino la consultazione. I metadati vengono assegnati secondo un criterio stabilito a priori, loperazione normalmente viene effettuata da chi inserisce il documento. Chi inserisce il documento di solito lo conosce, 竪 quindi 竪 in grado di stabilire relazioni semantiche che riducano o annullino la polisemia. Le numerose banche dati che adottano questo sistema riducono o annullano lambiguit semantica
15. Modello sequenziale Nel Linguaggio libero i termini sono estratti liberamente dal testo del documento o dal sito in cui sono contenuti. Essi non sono provvisti di metadati perci嘆 non definiti a priori Effettuando una ricerca attraverso un motore di ricerca del tipo Google si ottengono in risposta sia documenti rilevanti, cio竪 che soddisfano il bisogno di informazione che lutente ha espresso, che documenti assolutamente inutili. Il motore di ricerca non garantisce la rilevanza del documento , quindi pu嘆 accadere che documenti potenzialmente rilevanti per lutente non vengano recuperati dal sistema o viceversa . il recupero dellinformazione attraverso gli operatori logici booleani cerca di limitare questi due inconvenienti che, in generale, non possono essere eliminati.
16. input output input output a B c d d E Relazionale Vs sequenziale Contenuti classificati metadati c c c c c C b b b b b B a a a a a A Contenuti non classificati
17. Operatori booleani Operano una selezione nella ricerca in base alla presenza o assenza di parole chiave in base alle quali un documento o un sito vengono selezionati Essi sono: AND : i termini sono entrambi presenti OR : almeno uno dei due termini 竪 presente NOT : il termine non 竪 presente Essi costituiscono un efficace aiuto nella riduzione delleffetto rumore anche se non lo annullano
18. Indicizzazione automatica Le ricerche effettuate attraverso motori di ricerca si basano su indicizzazioni automatiche. Esse non si basano su metadati assegnati a priori ma su tecniche statistiche che assegnano rilevanza allinformazione in base alla frequenza Questo metodo non prende in considerazione le relazioni semantiche dei dati presenti Se si effettua una ricerca sulla stringa vite compaiono siti web dedicati alla coltivazione della vite, siti sulle vite da salvare, sullutensile vite, e compare anche un ristoranti chiamato vite. Il sistema informatico riconosce i dati binari 0-1 che compongono la parola vite ma non ne comprende il significato.
19. Vite = ristorante Vite = essere in vita Vite = utensile Vite= pianta
20. Accessibilit Da anni si dibatte sul tema dellaccessibilit ai dati sul web. Laumento esponenziale dei dati immessi ne rende sempre pi湛 difficile la consultazione. Le posizioni sono distinte: alcuni sostengono che la mania classificatoria indebolisce le potenzialit . altri, come il fondatore del World Wide Web, Tim Berners-Lee, sostengono che 竪 giunto il momento di porre delle regole.
21. Web semantico by Con il termine web semantico, termine coniato dal suo ideatore, Tim Berners-Lee , si intende la trasformazione del World Wide Web in un ambiente dove i documenti pubblicati (pagine HTML , file, immagini, e cos狸 via) siano associati ad informazioni e dati ( metadati ) che ne specifichino il contesto semantico in un formato adatto all'interrogazione, all'interpretazione e, pi湛 in generale, all'elaborazione automatica. Con l'interpretazione del contenuto dei documenti che il Web Semantico propugna, saranno possibili ricerche molto pi湛 evolute delle attuali, basate sulla presenza nel documento di parole chiave, ed altre operazioni specialistiche come la costruzione di reti di relazioni e connessioni tra documenti secondo logiche pi湛 elaborate del semplice link ipertestuale. http://www.w3.org/ standards / semanticweb /
22. Metodi di ricerca in ambiente multimediale Prof. Giovanni Biondi Tutors dott.sa Giusy Cannella dott.sa Elena Mosa A.A. 2009-2010