際際滷

際際滷Share a Scribd company logo
PREMIO APP4Sud
Documentazione	di	progetto	della	soluzione:	ANNA		La	libreria	che	ti	parla	
1. Descrizione	progetto;	
La Digital Library (http://www.pugliadigitallibrary.it) della Regione Puglia, on line da febbraio 2016,
costituisce un punto di svolta nel panorama della digitalizzazione, conservazione, fruizione e accessibilit
in rete del patrimonio culturale: 竪 un avanzato sistema di preservazione di materiali digitali che valorizzano
l'identit culturale della Regione Puglia (materiali a stampa, fotografie, documenti darchivio, materiali
sonori e audiovisivi, oggetti museali, monumenti e siti di interesse storico-artistico), contribuendo alla
diffusione della conoscenza del patrimonio regionale in modo semplice, immediato, libero e capillare. La
Puglia Digital Library, inoltre, si pone a livello regionale come il progetto pilota aperto al riuso per la
pubblicazione di Linked Open Data, diventando, cos狸, il principale produttore e fornitore di dati aperti
relativi alla bellezza del patrimonio culturale regionale, rendendo liberamente disponibili dati che, di solito,
risultano difficilmente reperibili e costruendo percorsi culturali.
Si tratta di un sistema di archiviazione aperto ed orientato alla conservazione a lungo termine, realizzato
nel modello logico di OAIS (Open Archival Information System, standard ISO 14721:2003) che garantisce
sia la conservazione di documenti digitali, salvandoli dal rischio obsolescenza, sia la disseminazione dei
medesimi, rendendoli disponibili alla comunit di riferimento costituita da ricercatori, studenti, cittadini,
imprese, giovani imprenditori, etc. per essere consultati e riutilizzati anche a fini commerciali, secondo le
licenze Creative Commons.
Il sistema 竪 in grado di supportare tipologie di risorse digitali eterogenee (immagini, audio, video, testi,
risorse interattive) che abbracciano i seguenti contesti: Ambiente e Paesaggio, Architettura, Archeologia,
Arte, Artigianato, Cinema, Danza, Economia e Societ, Letteratura, Luoghi della cultura, Mostre, Musica,
Spettacoli ed eventi, Sport, Storia e tradizioni, Teatro, TV.
Ladozione delle licenze Creative Commons e la definizione dei contesti sono stati deliberati dalla Regione
Puglia con la DGR n.766 del 17 aprile 2015.
Il sistema, in continua evoluzione, punta sempre pi湛 allo sviluppo e alladozione di tecnologie semantiche
associate alle buone pratiche archivistiche in materia di conservazione digitale. Attraverso la Digital Library
la Regione Puglia, infatti, divulga i dati culturali in modo innovativo, basandosi sia su modelli, specifiche
e standard internazionali (quali Dublin Core, METS, MAG, EAD, PREMIS, OAI-PMH) che la rendono
interoperabile con i principali sistemi nazionali ed internazionali (Cultura Italia, Internet Culturale, MuseiD
italia, Europeana) sia sulle pi湛 recenti tecnologie semantiche che massimizzano il valore dei dati e la
condivisione del patrimonio informativo, in linea con il percorso di valorizzazione territoriale avviato dalla
Regione Puglia.
Ogni risorsa digitale 竪 corredata di una scheda descrittiva contenente informazioni strutturate che
afferiscono alla identificazione, alla descrizione e alle caratteristiche tecniche della risorsa digitale, senza
tralasciare le informazioni pertinenti al bene fisico rappresentato, espresse con schemi e sintassi standard e
rilasciate nei formati CSV, XML e Linked Data secondo i termini di licenza CC0  No Rights Reserved.
Per far si che i dati contenuti nel portale Puglia Digital Library, fruibili nella loro versione Linked data,
siano facilmente consultabili da chiunque (dal cittadino locale al turista) 竪 stato sviluppato un agente
conversazionale (ChatBot) denominato ANNA.
ANNA si prefigge di fornire uninterfaccia di uso comune e quindi di facile utilizzo per qualsiasi utente
attraverso delle interazioni human-like, dando la possibilit di accedere alle diverse tipologie di risorse
digitali.
Lutente pu嘆 usufruire dei servizi offerti da ANNA su qualsiasi dispositivo.
 infatti possibile utilizzare sia una web application responsive accessibile da qualsiasi browser (ottimizzata
per Google Chrome), sia lassistente vocale di Google. In particolare tale assistente risulta essere
preinstallato su gran parte dei dispositivi Android oppure installabile tramite Play Store o App Store
(rispettivamente per dispositivi Android o iOS).
Tale scelta porta numerosi vantaggi tra cui la possibilit di essere utilizzata anche su dispositivi non mobili
come ad esempio PC, Smart TV e tutti quei dispositivi che integrano - e possono integrare - lassistente
Google (es. Google Home).
2. Descrizione	del	team	e	delle	proprie	risorse	e	competenze;	
ANNA 竪 un progetto nato dalla collaborazione del laboratorio di Sistemi Informativi (SisInf Lab) del
Politecnico di Bari e InnovaPuglia S.p.A.. La Puglia Digital Library 竪 coordinata dal dott. Mauro Paolo
Bruno Dirigente Sezione Economia della Cultura del Dipartimento Turismo, Economia della Cultura e
Valorizzazione del Territorio della Regione Puglia.
Il team di InnovaPuglia S.p.A., societ in house della Regione Puglia impegnata in attivit a supporto della
programmazione strategica regionale a sostegno della Innovazione Digitale, 竪 costituito da personale
tecnico-informatico e umanistico. Il gruppo di lavoro si 竪 occupato sia della progettazione e dello sviluppo
del sistema Puglia Digital Library sia della produzione e del rilascio, in formato Linked Data, dei dati che
alimentano la base di conoscenza del progetto ANNA. Esso si compone di tre risorse: la Dott.ssa Maria
Assunta Apollonio, il Dott. Giuseppe Cultrera e la Dott.ssa Maria Paola Marzocca, esperti in progettazione
ed implementazione di Biblioteche Digitali e di sistemi informativi per la valorizzazione e fruizione del
Patrimonio Culturale, in conservazione digitale di documenti informatici e multimediali, in standard di
metadati nazionali ed internazionali, in rappresentazione semantica dei dati in formato Linked Data e in
processi di interoperabilit con sistemi esterni.
Il SisInf Lab, gruppo di ricerca del Politecnico di Bari, si 竪 evoluto durante gli anni intorno a tematiche
comuni: intelligent systems e intelligent data management. Tutti gli aspetti legati allIntelligenza Artificiale
cos狸 come quelli che afferiscono allIngegneria del software e allInformatica Industriale sono parte del
background di conoscenze dei Professori, dei dottorandi e degli assistenti di ricerca che lavonano per il
SisInf Lab. Tra essi, il Prof. Ing. Tommaso Di Noia, che detiente la cattedra per la disciplina di Intelligenza
Artificiale e i dottorandi ed assistenti di ricerca Vito Walter Anelli, Luca Riccardi e Joseph Trotta
costituiscono il team che ha partecipato attivamente al progetto ANNA, dallintegrazione dei Linked
Data, alla progettazione e sviluppo dellagente conversazionale.
3. Descrizione	dei	bisogni	che	si	intende	soddisfare;		
Il progetto ANNA ha come obiettivo quello di diffondere la conoscenza e lesistenza delle risorse (digitali
e non) del territorio pugliese presenti nel sistema di Puglia Digital Library.
Levoluzione tecnologica, a cui stiamo assistendo negli ultimi decenni, sta impattando notevolmente sulle
modalit di ricerca delle informazioni, sulla cultura e sulla forma stessa della conoscenza. La societ
moderna, sempre pi湛 on line e multi-channel, infatti, sente la necessit di ricevere risposte immediate,
accedendo ad una grande mole di informazioni in maniera semplice, gratuita e utilizzando gli strumenti di
uso quotidiano (es. smartphone). Serve, di conseguenza, un nuovo modo di vivere la cultura che sia in grado
di legare il patrimonio culturale, prodotto sempre pi湛 in formato digitale, a processi innovativi che
favoriscano laccesso libero allinformazione, la fruizione, il riuso, linclusione e la costruzione di percorsi
conoscitivi che sviluppino nei cittadini il senso di appartenenza al proprio territorio. Occorre, inoltre,
abbattere la resistenza allinnovazione e alla liberalizzazione dei contenuti digitali sul web da parte dei
contenitori culturali che provoca un ridimensionamento dellinformazione culturale, rendendola spesso
frammentaria e poco fruibile.
La Puglia Digital Library intende superare questa ritrosia, legittimando il libero e pubblico riuso delle
proprie risorse digitali e della conoscenza pi湛 nascosta per offrire servizi gratuiti, disponibili su un semplice
smartphone, che garantiscono una semplice, rapida e puntuale reperibilit e consultazione delle
informazioni, rendendole accessibili da chiunque ed in qualsiasi momento. Le tecnologie dellIntelligenza
Artificiale adottate, inoltre, sono orientate verso il cittadino meno esperto di semantic web, consentendo a
tutti di interrogare e comprendere la vasta rete di conoscenza prodotta attraverso i Linked Open Data, fino
ad ora materia esclusiva di esperti del settore.
ANNA quindi permette di semplificare ulteriormente laccesso a tali risorse e la fruizione dei Linked Data,
sfruttando il vantaggio principale dei chatbot ovvero quello di dialogare utilizzando il linguaggio naturale:
lutente non ha bisogno di dover familiarizzare con una nuova interfaccia in quanto lutilizzo di un
assistente vocale o una applicazione di messaggistica 竪 ormai di uso quotidiano.
4. Descrizione dei destinatari della misura;
Obiettivo di ANNA 竪 diffondere la conoscenza relativa alle bellezze del patrimonio artistico e culturale di
interesse turistico della terra pugliese che delle volte restano sconosciute addirittura ai cittadini locali.
Quindi vuole abbracciare quel bacino di utenza che va dal semplice cittadino pugliese al turista occasionale
che attraversa la terra pugliese o il semplice curioso che vuole informarsi.
5. Descrizione	della	tecnologia	adottata.	
Il primo step necessario per lo sviluppo del progetto ANNA 竪 legato allingegnerizzazione dei dati. Infatti
il punto di forza della Digital Library della Regione Puglia (alla base del progetto ANNA) 竪 la migrazione
dei propri dati nel web semantico attraverso la produzione di Linked Open Data, pubblicati sulla piattaforma
regionale, che permettono di intrecciare dinamicamente i dati con altri appartenenti a fonti esterne e di
mantenere inalterato il legame che una risorsa ha con il suo contesto culturale, geografico e temporale.
Il rilascio dei dati della Puglia Digital Library segue un workflow standard che parte dalla selezione, analisi
e raffinamento dei dati fino ad arrivare alla loro modellazione e pubblicazione sulla piattaforma regionale,
dotata di uno SPARQL Endpoint per linterrogazione dei dati.
Basandosi su criteri di interesse, qualit, coerenza e completezza, i dati sono organizzati in dataset. Ogni
dataset corrisponde ad una collezione digitale, evitando di separare le risorse dal contesto di origine ed 竪
aggiornato tempestivamente in caso di modifiche apportate ai dati.
Per la rappresentazione semantica delle informazioni, in accordo con la politica di riuso organico dei dati
allinterno del web, sono state scelte ontologie gi esistenti e ampiamente utilizzate per domini simili per
facilitare linterrogazione e la comprensione dei dati. Questo 竪 un elemento chiave per potenziare il valore
dei dati, offrendo contenuti altamente interoperabili.
Le ontologie adottate per la modellazione dei dati sono CIDOC-CRM, DCTERMS, DBpedia, Schema.org,
Geonames, Foaf, Skos che consentono di esplicitare lintreccio di relazioni semantiche tra contesto
temporale, luoghi, persone e descrizioni di oggetti materiali e immateriali.
La semantica delle triple RDF (Resource Description Framework) viene, poi, arricchita tramite
collegamenti a dati appartenenti a fonti esterne e a domini anche differenti (DBpedia, Linked GeoData,
Getty Vocabularies e PICO Thesaurus). I concetti, di conseguenza, vengono disambiguati e resi parte di un
discorso pi湛 ampio: una rete di informazioni semanticamente rilevanti che permette, a chi cerca, di scoprire
nuovi universi di contenuti. Lutente della Digital Library ricaver, cos狸, nuove informazioni dalle
informazioni gi disponibili.
Il passo successivo 竪 stato quello di implementare il vero e proprio agente conversazionale (ChatBot). Un
ChatBot, permette di interpretare, comprendere e rispondere a delle richieste durante una conversazione, in
modo del tutto trasparente allutente.
Per fare ci嘆 deve essere in grado di analizzare il linguaggio naturale (mediante tecniche di Natural Language
Processing) e definire una risposta costruita su una base di conoscenza rappresentata dai dati
precedentemente descritti.
Figura 1- Architettura di un chatbot basato su Dialogflow
In Figura 1 竪 mostrata una panoramica delle tecnologie utilizzate per sviluppare lapplicazione e di come
esse interagiscono. In particolare 竪 possibile identificare tre macroblocchi:
l APP/DEVICE: rappresenta la componente che permette allutente di interfacciarsi con
lapplicativo e si avvale sia di uninterfaccia web sia dellassistente di Google. Le richieste possono
essere effettuate o tramite un inserimento testuale oppure vocale. Le risposte sono fornite
utilizzando le stesse modalit.
l DIALOGFLOW: rappresenta la componente che elabora la richiesta che lutente ha digitato o
pronunciato. DialogFlow 竪 la tecnologia Google che permette di implementare agenti descritti
solitamente come moduli di Natural Language Understanding (NLU) i quali cercano di risolvere
le ambiguit del linguaggio naturale, integrabili nelle proprie applicazioni. Gli agenti possono
essere progettati per gestire un dialogo avvalendosi di concetti come quello di intent, context e
fulfillment. Lintent rappresenta lobiettivo dellutente estrapolato dalla richiesta ed 竪 a sua volta
costituito da diverse componenti. Una delle componenti principali 竪 training phrases, un insieme
di frasi comuni necessarie per laddestramento (tramite tecniche di machine learning) del sistema
e che permettono di discriminare in quale intent ci si trova. Nel caso in cui stesse frasi di
addestramento vengano utilizzate in piu intent, al fine di selezionare quello corretto, si utilizzano
i contesti. Un contesto rappresenta lo stato attuale dellutente e permette di mantenere il flusso del
dialogo guidando il passaggio da un intent ad un altro in maniera corretta senza che ogni frase
risulti isolata da quella precedente. Inoltre tali contesti mantengono un riferimento ai valori e ai
parametri tra intent. Un parametro, a sua volta, rappresenta linformazione, estrapolata dalla
richiesta, necessaria per la fase successiva (fulfillment).
l FULFILLMENT: rappresenta la componente che permette di generare risposte dinamiche basate
sulle informazioni ottenute dalle basi di conoscenza. Essa si compone di un webhook che tiene
traccia delle varie richieste degli utenti, rielabora i dati ottenuti per renderli processabili da un
query manager e crea e restituisce la risposta a dialogflow. Il query manager identifica il servizio
che si occupa di comporre le query e reindirizzarle o allendpoint virtuoso o a Linked Open Street
Map (LOSM)1
. Lendpoint virtuoso contiente i dati della Puglia Digital Library mentre LOSM 竪
un middleware che permette di estrarre informazioni da OSM attraverso delle query SPARQL.
Per richiamare e usufruire dei servizi offerti da ANNA bisogna digitare o pronunciare la frase Parla con
Digital Library sullAssistente Google.
a b c
Figura 2- Esempio di dialogo con ANNA
A questo punto ANNA si mostrer e guider lutente nella formulazione della richiesta, mostrando
costantemente dei suggerimenti (selezionabili) come mostrato in Figura 3. La richiesta verr composta in
modo interattivo andando ad aumentare la complessit ad ogni interazione. Come esito della richiesta
vengono mostrati una serie di risultati disposti in un carousel contenente il nome della risorsa e una breve
descrizione. Selezionandone uno di essi si acceder a pi湛 dettagli tra cui la possibilit di apire la relativa
scheda sulla Digital Library.
1
http://sisinflab.poliba.it/semanticweb/lod/losm/

More Related Content

App4Sud Progetto Anna La Libreria che ti parla

  • 1. PREMIO APP4Sud Documentazione di progetto della soluzione: ANNA La libreria che ti parla 1. Descrizione progetto; La Digital Library (http://www.pugliadigitallibrary.it) della Regione Puglia, on line da febbraio 2016, costituisce un punto di svolta nel panorama della digitalizzazione, conservazione, fruizione e accessibilit in rete del patrimonio culturale: 竪 un avanzato sistema di preservazione di materiali digitali che valorizzano l'identit culturale della Regione Puglia (materiali a stampa, fotografie, documenti darchivio, materiali sonori e audiovisivi, oggetti museali, monumenti e siti di interesse storico-artistico), contribuendo alla diffusione della conoscenza del patrimonio regionale in modo semplice, immediato, libero e capillare. La Puglia Digital Library, inoltre, si pone a livello regionale come il progetto pilota aperto al riuso per la pubblicazione di Linked Open Data, diventando, cos狸, il principale produttore e fornitore di dati aperti relativi alla bellezza del patrimonio culturale regionale, rendendo liberamente disponibili dati che, di solito, risultano difficilmente reperibili e costruendo percorsi culturali. Si tratta di un sistema di archiviazione aperto ed orientato alla conservazione a lungo termine, realizzato nel modello logico di OAIS (Open Archival Information System, standard ISO 14721:2003) che garantisce sia la conservazione di documenti digitali, salvandoli dal rischio obsolescenza, sia la disseminazione dei medesimi, rendendoli disponibili alla comunit di riferimento costituita da ricercatori, studenti, cittadini, imprese, giovani imprenditori, etc. per essere consultati e riutilizzati anche a fini commerciali, secondo le licenze Creative Commons. Il sistema 竪 in grado di supportare tipologie di risorse digitali eterogenee (immagini, audio, video, testi, risorse interattive) che abbracciano i seguenti contesti: Ambiente e Paesaggio, Architettura, Archeologia, Arte, Artigianato, Cinema, Danza, Economia e Societ, Letteratura, Luoghi della cultura, Mostre, Musica, Spettacoli ed eventi, Sport, Storia e tradizioni, Teatro, TV. Ladozione delle licenze Creative Commons e la definizione dei contesti sono stati deliberati dalla Regione Puglia con la DGR n.766 del 17 aprile 2015. Il sistema, in continua evoluzione, punta sempre pi湛 allo sviluppo e alladozione di tecnologie semantiche associate alle buone pratiche archivistiche in materia di conservazione digitale. Attraverso la Digital Library la Regione Puglia, infatti, divulga i dati culturali in modo innovativo, basandosi sia su modelli, specifiche e standard internazionali (quali Dublin Core, METS, MAG, EAD, PREMIS, OAI-PMH) che la rendono interoperabile con i principali sistemi nazionali ed internazionali (Cultura Italia, Internet Culturale, MuseiD italia, Europeana) sia sulle pi湛 recenti tecnologie semantiche che massimizzano il valore dei dati e la condivisione del patrimonio informativo, in linea con il percorso di valorizzazione territoriale avviato dalla Regione Puglia. Ogni risorsa digitale 竪 corredata di una scheda descrittiva contenente informazioni strutturate che afferiscono alla identificazione, alla descrizione e alle caratteristiche tecniche della risorsa digitale, senza tralasciare le informazioni pertinenti al bene fisico rappresentato, espresse con schemi e sintassi standard e rilasciate nei formati CSV, XML e Linked Data secondo i termini di licenza CC0 No Rights Reserved. Per far si che i dati contenuti nel portale Puglia Digital Library, fruibili nella loro versione Linked data, siano facilmente consultabili da chiunque (dal cittadino locale al turista) 竪 stato sviluppato un agente conversazionale (ChatBot) denominato ANNA.
  • 2. ANNA si prefigge di fornire uninterfaccia di uso comune e quindi di facile utilizzo per qualsiasi utente attraverso delle interazioni human-like, dando la possibilit di accedere alle diverse tipologie di risorse digitali. Lutente pu嘆 usufruire dei servizi offerti da ANNA su qualsiasi dispositivo. infatti possibile utilizzare sia una web application responsive accessibile da qualsiasi browser (ottimizzata per Google Chrome), sia lassistente vocale di Google. In particolare tale assistente risulta essere preinstallato su gran parte dei dispositivi Android oppure installabile tramite Play Store o App Store (rispettivamente per dispositivi Android o iOS). Tale scelta porta numerosi vantaggi tra cui la possibilit di essere utilizzata anche su dispositivi non mobili come ad esempio PC, Smart TV e tutti quei dispositivi che integrano - e possono integrare - lassistente Google (es. Google Home). 2. Descrizione del team e delle proprie risorse e competenze; ANNA 竪 un progetto nato dalla collaborazione del laboratorio di Sistemi Informativi (SisInf Lab) del Politecnico di Bari e InnovaPuglia S.p.A.. La Puglia Digital Library 竪 coordinata dal dott. Mauro Paolo Bruno Dirigente Sezione Economia della Cultura del Dipartimento Turismo, Economia della Cultura e Valorizzazione del Territorio della Regione Puglia. Il team di InnovaPuglia S.p.A., societ in house della Regione Puglia impegnata in attivit a supporto della programmazione strategica regionale a sostegno della Innovazione Digitale, 竪 costituito da personale tecnico-informatico e umanistico. Il gruppo di lavoro si 竪 occupato sia della progettazione e dello sviluppo del sistema Puglia Digital Library sia della produzione e del rilascio, in formato Linked Data, dei dati che alimentano la base di conoscenza del progetto ANNA. Esso si compone di tre risorse: la Dott.ssa Maria Assunta Apollonio, il Dott. Giuseppe Cultrera e la Dott.ssa Maria Paola Marzocca, esperti in progettazione ed implementazione di Biblioteche Digitali e di sistemi informativi per la valorizzazione e fruizione del Patrimonio Culturale, in conservazione digitale di documenti informatici e multimediali, in standard di metadati nazionali ed internazionali, in rappresentazione semantica dei dati in formato Linked Data e in processi di interoperabilit con sistemi esterni. Il SisInf Lab, gruppo di ricerca del Politecnico di Bari, si 竪 evoluto durante gli anni intorno a tematiche comuni: intelligent systems e intelligent data management. Tutti gli aspetti legati allIntelligenza Artificiale cos狸 come quelli che afferiscono allIngegneria del software e allInformatica Industriale sono parte del background di conoscenze dei Professori, dei dottorandi e degli assistenti di ricerca che lavonano per il SisInf Lab. Tra essi, il Prof. Ing. Tommaso Di Noia, che detiente la cattedra per la disciplina di Intelligenza Artificiale e i dottorandi ed assistenti di ricerca Vito Walter Anelli, Luca Riccardi e Joseph Trotta costituiscono il team che ha partecipato attivamente al progetto ANNA, dallintegrazione dei Linked Data, alla progettazione e sviluppo dellagente conversazionale. 3. Descrizione dei bisogni che si intende soddisfare; Il progetto ANNA ha come obiettivo quello di diffondere la conoscenza e lesistenza delle risorse (digitali e non) del territorio pugliese presenti nel sistema di Puglia Digital Library. Levoluzione tecnologica, a cui stiamo assistendo negli ultimi decenni, sta impattando notevolmente sulle modalit di ricerca delle informazioni, sulla cultura e sulla forma stessa della conoscenza. La societ moderna, sempre pi湛 on line e multi-channel, infatti, sente la necessit di ricevere risposte immediate, accedendo ad una grande mole di informazioni in maniera semplice, gratuita e utilizzando gli strumenti di uso quotidiano (es. smartphone). Serve, di conseguenza, un nuovo modo di vivere la cultura che sia in grado di legare il patrimonio culturale, prodotto sempre pi湛 in formato digitale, a processi innovativi che
  • 3. favoriscano laccesso libero allinformazione, la fruizione, il riuso, linclusione e la costruzione di percorsi conoscitivi che sviluppino nei cittadini il senso di appartenenza al proprio territorio. Occorre, inoltre, abbattere la resistenza allinnovazione e alla liberalizzazione dei contenuti digitali sul web da parte dei contenitori culturali che provoca un ridimensionamento dellinformazione culturale, rendendola spesso frammentaria e poco fruibile. La Puglia Digital Library intende superare questa ritrosia, legittimando il libero e pubblico riuso delle proprie risorse digitali e della conoscenza pi湛 nascosta per offrire servizi gratuiti, disponibili su un semplice smartphone, che garantiscono una semplice, rapida e puntuale reperibilit e consultazione delle informazioni, rendendole accessibili da chiunque ed in qualsiasi momento. Le tecnologie dellIntelligenza Artificiale adottate, inoltre, sono orientate verso il cittadino meno esperto di semantic web, consentendo a tutti di interrogare e comprendere la vasta rete di conoscenza prodotta attraverso i Linked Open Data, fino ad ora materia esclusiva di esperti del settore. ANNA quindi permette di semplificare ulteriormente laccesso a tali risorse e la fruizione dei Linked Data, sfruttando il vantaggio principale dei chatbot ovvero quello di dialogare utilizzando il linguaggio naturale: lutente non ha bisogno di dover familiarizzare con una nuova interfaccia in quanto lutilizzo di un assistente vocale o una applicazione di messaggistica 竪 ormai di uso quotidiano. 4. Descrizione dei destinatari della misura; Obiettivo di ANNA 竪 diffondere la conoscenza relativa alle bellezze del patrimonio artistico e culturale di interesse turistico della terra pugliese che delle volte restano sconosciute addirittura ai cittadini locali. Quindi vuole abbracciare quel bacino di utenza che va dal semplice cittadino pugliese al turista occasionale che attraversa la terra pugliese o il semplice curioso che vuole informarsi. 5. Descrizione della tecnologia adottata. Il primo step necessario per lo sviluppo del progetto ANNA 竪 legato allingegnerizzazione dei dati. Infatti il punto di forza della Digital Library della Regione Puglia (alla base del progetto ANNA) 竪 la migrazione dei propri dati nel web semantico attraverso la produzione di Linked Open Data, pubblicati sulla piattaforma regionale, che permettono di intrecciare dinamicamente i dati con altri appartenenti a fonti esterne e di mantenere inalterato il legame che una risorsa ha con il suo contesto culturale, geografico e temporale. Il rilascio dei dati della Puglia Digital Library segue un workflow standard che parte dalla selezione, analisi e raffinamento dei dati fino ad arrivare alla loro modellazione e pubblicazione sulla piattaforma regionale, dotata di uno SPARQL Endpoint per linterrogazione dei dati. Basandosi su criteri di interesse, qualit, coerenza e completezza, i dati sono organizzati in dataset. Ogni dataset corrisponde ad una collezione digitale, evitando di separare le risorse dal contesto di origine ed 竪 aggiornato tempestivamente in caso di modifiche apportate ai dati. Per la rappresentazione semantica delle informazioni, in accordo con la politica di riuso organico dei dati allinterno del web, sono state scelte ontologie gi esistenti e ampiamente utilizzate per domini simili per facilitare linterrogazione e la comprensione dei dati. Questo 竪 un elemento chiave per potenziare il valore dei dati, offrendo contenuti altamente interoperabili. Le ontologie adottate per la modellazione dei dati sono CIDOC-CRM, DCTERMS, DBpedia, Schema.org, Geonames, Foaf, Skos che consentono di esplicitare lintreccio di relazioni semantiche tra contesto temporale, luoghi, persone e descrizioni di oggetti materiali e immateriali. La semantica delle triple RDF (Resource Description Framework) viene, poi, arricchita tramite collegamenti a dati appartenenti a fonti esterne e a domini anche differenti (DBpedia, Linked GeoData, Getty Vocabularies e PICO Thesaurus). I concetti, di conseguenza, vengono disambiguati e resi parte di un discorso pi湛 ampio: una rete di informazioni semanticamente rilevanti che permette, a chi cerca, di scoprire
  • 4. nuovi universi di contenuti. Lutente della Digital Library ricaver, cos狸, nuove informazioni dalle informazioni gi disponibili. Il passo successivo 竪 stato quello di implementare il vero e proprio agente conversazionale (ChatBot). Un ChatBot, permette di interpretare, comprendere e rispondere a delle richieste durante una conversazione, in modo del tutto trasparente allutente. Per fare ci嘆 deve essere in grado di analizzare il linguaggio naturale (mediante tecniche di Natural Language Processing) e definire una risposta costruita su una base di conoscenza rappresentata dai dati precedentemente descritti. Figura 1- Architettura di un chatbot basato su Dialogflow In Figura 1 竪 mostrata una panoramica delle tecnologie utilizzate per sviluppare lapplicazione e di come esse interagiscono. In particolare 竪 possibile identificare tre macroblocchi: l APP/DEVICE: rappresenta la componente che permette allutente di interfacciarsi con lapplicativo e si avvale sia di uninterfaccia web sia dellassistente di Google. Le richieste possono essere effettuate o tramite un inserimento testuale oppure vocale. Le risposte sono fornite utilizzando le stesse modalit. l DIALOGFLOW: rappresenta la componente che elabora la richiesta che lutente ha digitato o pronunciato. DialogFlow 竪 la tecnologia Google che permette di implementare agenti descritti solitamente come moduli di Natural Language Understanding (NLU) i quali cercano di risolvere le ambiguit del linguaggio naturale, integrabili nelle proprie applicazioni. Gli agenti possono essere progettati per gestire un dialogo avvalendosi di concetti come quello di intent, context e fulfillment. Lintent rappresenta lobiettivo dellutente estrapolato dalla richiesta ed 竪 a sua volta costituito da diverse componenti. Una delle componenti principali 竪 training phrases, un insieme di frasi comuni necessarie per laddestramento (tramite tecniche di machine learning) del sistema e che permettono di discriminare in quale intent ci si trova. Nel caso in cui stesse frasi di addestramento vengano utilizzate in piu intent, al fine di selezionare quello corretto, si utilizzano i contesti. Un contesto rappresenta lo stato attuale dellutente e permette di mantenere il flusso del dialogo guidando il passaggio da un intent ad un altro in maniera corretta senza che ogni frase risulti isolata da quella precedente. Inoltre tali contesti mantengono un riferimento ai valori e ai parametri tra intent. Un parametro, a sua volta, rappresenta linformazione, estrapolata dalla richiesta, necessaria per la fase successiva (fulfillment). l FULFILLMENT: rappresenta la componente che permette di generare risposte dinamiche basate sulle informazioni ottenute dalle basi di conoscenza. Essa si compone di un webhook che tiene traccia delle varie richieste degli utenti, rielabora i dati ottenuti per renderli processabili da un query manager e crea e restituisce la risposta a dialogflow. Il query manager identifica il servizio che si occupa di comporre le query e reindirizzarle o allendpoint virtuoso o a Linked Open Street
  • 5. Map (LOSM)1 . Lendpoint virtuoso contiente i dati della Puglia Digital Library mentre LOSM 竪 un middleware che permette di estrarre informazioni da OSM attraverso delle query SPARQL. Per richiamare e usufruire dei servizi offerti da ANNA bisogna digitare o pronunciare la frase Parla con Digital Library sullAssistente Google. a b c Figura 2- Esempio di dialogo con ANNA A questo punto ANNA si mostrer e guider lutente nella formulazione della richiesta, mostrando costantemente dei suggerimenti (selezionabili) come mostrato in Figura 3. La richiesta verr composta in modo interattivo andando ad aumentare la complessit ad ogni interazione. Come esito della richiesta vengono mostrati una serie di risultati disposti in un carousel contenente il nome della risorsa e una breve descrizione. Selezionandone uno di essi si acceder a pi湛 dettagli tra cui la possibilit di apire la relativa scheda sulla Digital Library. 1 http://sisinflab.poliba.it/semanticweb/lod/losm/