Università degli studi di Siena – Sede di Arezzo
Dipartimento di Teoria e documentazione delle tradizioni culturali
Master Informatica del Testo – Edizione elettronica
2012
1 of 39
Download to read offline
More Related Content
Master Informatica del Testo – Edizione elettronica - Arezzo - 2012
2. Obiettivo
Elementi del Contesto: la società dell’informazione produce e
2
consuma documenti digitali.
Necessità: le organizzazioni/enti devono:
• Saper produrre e consumare documenti digitali
• Saper trasmettere documenti documenti digitali
• Saper gestire documenti digitali
• Saper archiviare i documenti digitali
• Saper conservare i documenti digitali
Obiettivo della lezione:
• Individuare una possibile soluzione
• Le infrastrutture e gli strumenti per poter realizzare la
soluzione
• Illustrare alcuni primi parziali esempi di implementazioni di tale
soluzione
3. 3
Principale
FILE <.> elemento
[.]Principale
DOCUMENTO
<.> Lista di FILE
documento: unità di informazione
producibile
Firma <.>attributi
Marca
Temporale
<.>attributi
<.>attributi
Impronta
<.>attributi
Segnatura
Documenti Digitali
Quanto è distante dalla vostra
idea di documento?
4. Documenti Digitali
Processo astrazione
semantica
4
Computer possono tradurre 0 e 1
in simboli interpretabili da persone
che possono modificarli
Computer possono eseguire dei
“ragionamenti”
Estrazione di semantica dai
documenti
=> convivenza con l’esistente
Nella definizione di prima il
concetto di semantica dove sta?
Formalizzazione dei documenti dalla
loro nascita
=> premesse per il futuro
“Il documento attesta un evento e ne tramanda la memoria
testimoniando il passato”
Nella definizione di prima il
concetto di semantica dove sta?
5. Produzione e Consumo di documenti digitali
La Produzione e Consumo di documenti digitali avviene tramite
applicazioni software che trasformano sequenze di “0” e “1” in
simboli interpretabili dalle persone e da essi modificabili
Processo di estrazione semantica => passaggio da applicazioni
caratterizzate dai formati quali:
- word processor (l’utente dice “scrivo un documento”)
- editor di contenuti (l’utente dice “faccio una slide”)
- altri...
- Da Word ad Aps
- Da Generici a Specifici
ad applicazioni caratterizzate dai contenuti => applicazioni
specializzate quali:
- apps per i Cittadini (l’utente dice “mando una fattura”)
- sistemi verticali (l’utente dice “emetto un mandato di pagamento”)
per gli Enti
Applicazioni Specializzate => definizione forma, contenuto e supporto del documento
5
- Da Word ad Aps
- Da Generici a Specifici
6. Trasmissione di documenti digitali
Applicazioni Specializzate => passare da poche applicazioni a molte
applicazioni => problema della trasmissione dei documenti e
interoperabilità delle applicazioni.
Trasmissione di un file => invio di un flusso di “0” e “1” (mittente) /
ricostruzione del flusso di “0” e “1” (destinatario)
Interoperabilità delle applicazioni =>
a) tecnica: ricostruzione della stessa sequenza di simboli
b) semantica: attribuzione dello stesso significato
c) giuridica: legalmente riconosciuta da entrambe le parti ossia
conforme alla normativa
d) organizzativa: strutture e servizi tra organizzazioni diverse.
6
7. Gestione di documenti digitali
La gestione dei documenti digitali è l’insieme delle attività volte a:
registrare, organizzare, classificare, assegnare, reperire i documenti digitali.
Inoltre spesso è necessario:
- definire azioni automatiche o processi da svolgere sui documenti
- definire proprietà e meta-informazioni essenziali dei documenti digitali
Tali attività sono svolte da un Sistema per la Gestione Documentale
(SGD).
es. Carta->Scanner->Upload
attuale .. futuro
7
Cambiamento nel modo di lavorare
dell’archivista?
- forma
- contenuto
- supporto
già formalizzati
- forma
- contenuto
- supporto
da formalizzare
Cambiamento nel modo di lavorare
dell’archivista?
8. Open Document (ODF)
ODF - Open Document Format for Office Applications
Un documento è: un file compresso così fatto:
- File XML: content.xml; meta.xml; settings.xml; styles.xml- Altri file:
mimetype- Cartelle: META-INF/ Thumbnails/
I file che noi leggiamo sono costituiti da una serie di file
XML che vengono interpretati.
Il documento non è quello che ci immaginiamo ma è una
serie di file XML interpretati dal computer.
Stiamo quindi andando nella direzione della
formalizzazione e quindi in una potenziale gestione
automatizzata anche del significato.
8
esempio: content.xml
<text:h text:style-name="Heading_2">Questo è un titolo
</text:h>
<text:p text:style-name="Text_body">
Questo è un paragrafo. Le informazioni di formattazione
si
trovano nello stile Text_body.
</text:p>
esempio: meta.xml
<meta:creation-date>2003-09-10T15:31:11</meta:creation-date>
<dc:creator>Daniel Carrera</dc:creator>
<dc:date>2005-06-29T22:02:06</dc:date>
<dc:language>es-ES</dc:language>
<meta:document-statistic
meta:table-count="6" meta:object-count="0"
meta:page-count="59" meta:paragraph-count="676"
meta:image-count="2" meta:word-count="16701"
meta:character-count="98757"/>
I file che noi leggiamo sono costituiti da una serie di file
XML che vengono interpretati.
Il documento non è quello che ci immaginiamo ma è una
serie di file XML interpretati dal computer.
Stiamo quindi andando nella direzione della
formalizzazione e quindi in una potenziale gestione
automatizzata anche del significato.
9. XForms
XForms (XML Forms) è un linguaggio basato su XML per la definizione
delle form all’interno di documenti XML
XForm consente di separare i dati dalla loro presentazione. Una XForm è
costituita da due parti:
- XForm Model
- XForm User Interface
Il contenuto di un documento è estratto dal
documento stesso.
Ci si spinge sempre di più verso una
formalizzazione.
Il contenuto di un documento è estratto dal
documento stesso.
Ci si spinge sempre di più verso una
formalizzazione.
- XForm Model: definisce la struttura dei dati e come questi verranno
trasmessi
- XForm User Interface: definisce i controlli di input ossia stabilisce come
l’utente può interagire con il documento
9
<head>
<xf:model>
<xf:instance>
<utente>
<nome/>
<cognome/>
</utente>
</xf:instance>
<xf:submission id=”invioDati”
method=”post”
action=”elabora.asp”/>
</xf:model>
</head>
<body>
<xf:input
ref=”nome”><xf:label>Nome</xf
:label></xf:input>
<br/>
<xf:input
ref=”cognome”><xf:label>Cogno
me</xf:label></xf:input>
<br/>
<xf:submit
submission=”invioDati”><xf:la
bel>Invia</xf:label></xf:subm
it>
</body>
=> <utente>
<nome>Mario</nome>
<cognome>Rossi</cognome>
</utente>
10. Struttura meta-informazioni obbligatorie per la gestione
dei documenti informatici
la struttura delle meta informazioni obbligatorie per la gestione dei documenti
informatici (http://www.digitpa.gov.it/sites/default/files/Bozza%20-%20Allegato%205%20-%20Metadati.pdf)
=> sia il documento che le meta-informazioni
<?xml version="1.0" encoding="ISO-8859-1" ?><xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"><xs:element
name="documento"><xs:complexType><xs:sequence><xs:element name="datachiusura" type="xs:date"/><xs:element name="oggettodocumento"
type="xs:string /><xs:element name="soggettoproduttore"><xs:complexType><xs:sequence><xs:element name="nome" type="xs:string"/><xs:element
name="cognome" type="xs:string"/><xs:element name="codicefiscale" type="xs:string"/></xs:sequence></xs:complexType></xs:element><xs:element
name="destinatario"><xs:complexType><xs:sequence><xs:element name="nome" type="xs:string"/><xs:element name="cognome"
type="xs:string"/><xs:element name="codicefiscale" type="xs:string"/></xs:sequence></xs:complexType></xs:element></xs:sequence><xs:attribute
name="IDDocumento" type="xs:string" use="required"/></xs:complexType></xs:element></xs:schema>
10
necessarie alla gestione
sono descritte in linguaggio XML
XML è quindi l’elemento che fa da collante.
Due concetti su XML:
XML ben formato
XML valido
XML per la gestione documentale
XML è quindi l’elemento che fa da collante.
Due concetti su XML:
XML ben formato
XML valido
XML per la gestione documentale
11. La Gestione Documentale per la PA Italiana
CNIPA -> DigitPA -> Agenzia Digitale Italiana
http://www.digitpa.gov.it
11
12. Archiviazione dei documenti digitali
Il documento in SGD è “vivo” e arricchito, durante il suo ciclo di vita,
di meta-informazioni funzionali alla ricerca e alla creazione del vincolo
archivistico
Chiuso = è nel senso di compiuto e
completo di tutti gli elementi
(perfezionato)
Il documento “Chiuso” viene archiviato. Il Sistema di Gestione di
Archivio (SGA) è lo strumento per la garanzia nel tempo della
memoria.
12
Applicazione
più oneroso
- Versamento
- Ricerca
- Invio piano di classificazione
- Invio organigramma
Standard di riferimento: OAIS
Chiuso = è nel senso di compiuto e
completo di tutti gli elementi
(perfezionato)
13. Conservazione dei documenti digitali
Un documento digitale può aver associato: firme digitali e marche
temporali => necessaria applicare una procedura di gestione nel
tempo.
Un documento archiviato deve poter essere visualizzato anche tra
molti anni => necessario dare garanzia della sua corretta
consultazione nel tempo.
Il documento in SGD o SGA deve essere “conservato a norma”. Il
Sistema di Conservazione a Norma (SCN) deve offrire queste
garanzie.
13
Applicazione
Standard di
riferimento:
UNISInCRO
14. Caratteristiche di una soluzione per la gestione del ciclo
di vita di documenti digitali
1) basata su infrastruttura aperta => interoperabilità => a livello:
a) tecnico
b) semantico
c) organizzativo
d) legale
2) integrata con interfacce standard
3) gestione dei documenti digitali e della loro semantica
4) registrazione degli eventi relativi al ciclo di vita dei documenti digitali.
5) dotata di strumenti per la gestione delle esigenze degli utenti
14
15. Struttura di un SGD
(scomposizione funzionale)
15
Servizi agli utenti
Controllo del funzionamento
delle applicazioni
Comunicazioni tra applicazioni conformi
Comunicazioni tra applicazioni
non conformi
Descrizione delle interazioni
Memorizzazione dei messaggi
e documenti
Gestione dei processi
16. Struttura di un SGD
(produzione e consumo di documenti digitali)
Gestione comunicazione standard
Gestione comunicazione non standard
16
Conforme alle regole di SGD
NON
Conforme alle regole di SGD
17. Struttura di un SGD
(interoperabilità)
Censimento di Applicazioni e loro
responsabili
17
Censimento dei possibili usi (servizi) del
SGD (WSDL)
Struttura dei messaggi che possono
accompagnare il documento
(XML-Schema)
Associa ad un messaggio
una forma (XSLT)
Catalogo dei significati
dei messaggi
o documenti
(OWL/RDF)
- Quali servizi offre l’ente?
- A chi sono offerti i servizi?
- Come faccio ad utilizzare i servizi?
...
18. Struttura di un SGD
(memorizzazione)
18
Memorizza i documenti (messaggi) che si
scambiano le applicazioni o che vengono
inserite da utenti
Memorizza le meta-informazioni associate
ai documenti
Memorizza tutte le operazioni svolte sui
messaggi/documenti ossia i legami:
Produttore-Consumatore-Unità Documentaria
- Che cosa è successo?
- Quando è successo?
- Chi ha fatto che cosa?
...
=>
premesse alla archiviazione
19. Posizione di SGD nell’ente
SUAP:
Sportello
Unico
delle
Attività
Produttive
Esempio 1 Esempio 2
19
Schema
Generale
SUAP:
Sportello
Unico
delle
Attività
Produttive
20. Operazioni DI BASE sui documenti
- Firma digitale
- Marca temporale
- Scadenza certificati
- Visualizzazione nel tempo dei documenti
- Riversamento contro l’obsolescenza
20
21. Firma Digitale
Che cosa deve avere un utente per firmare un documento?
- Dispositivo di firma (lettore di smart card)
- Supporto di memorizzazione della chiave privata (smart card)
- Certificato digitale pubblico (sito della Certification Autority)
- Software per la firma (installato sul PC)
Dove prende tutta questa roba?
- Lettore di smart card se lo compra ad un negozio e la installa sul
PC
- smart card acquistata da una Certification Autority qualificato da
DigitPA insieme al Certificato
- software per la firma se lo scarica da internet
21
22. Firma Digitale
Chiavi Asimmetriche Pub e Priv di un Utente:
Pub(Priv(File))=File
22
Hash di un file:
Hash(File)=file;
File1<> File2 => Hash(File1)<>Hash(File2)
Che cosa c’è nella Smart Card? Priv + Certificato
A che è la Smart Card? dispositivo che garantisce che nessuno possa
prelevare la chiave Priv a meno che si acceda alla Smart Card con un
software appropriato e che l’utente digiti il corretto PIN
Che cosa c’è nel Certificato? Pub + Informazioni sulla Persona +
Informazioni sulla CA + Informazioni su algoritmi usati
23. Firma Digitale
Esempio di come si firma un documento?
1. l’utente trascina il FILE da firmare sull’applicazione di firma installata
sul computer
2. l’applicazione chiede il PIN
3. l’utente digita il PIN
4. l’applicazione verifica se il PIN è corretto
5. l’applicazione esegue la firma: usando il lettore accede alla Smart
Card; prende Priv dalla Smart Card e dal certificato legge l’algoritmo
di firma e di Hash da applicare; esegue le seguenti operazioni
matematiche Priv(Hash(FILE) e ottiene una sequenza di bit detta
FIRMA; crea un nuovo file così ottenuto FILE+FIRMA+CERTIFICATO
6. crea un nuovo file con estensione .p7m (es. FILE_FIRMATO.p7m)
le cui informazioni contenute sono <FILE,FIRMA,CERTIFICATO>
7. l’applicazione scrive il file FILE_FIRMATO.p7m sul computer
dell’utente e gli comunica che ha terminato la firma
23
24. Firma Digitale
Esempio di come si verifica un documento?
1. l’utente trascina il FILE_FIRMATO.p7m da verificare
sull’applicazione di firma installata sul computer
2. l’applicazione esegue la verifica: accede al FILE_FIRMATO.p7m (si
ricorda che le informazioni in esso contenute sono
<FILE,FIRMA,CERTIFICATO> ) e dal certificato in esso contenuto
estrae la chiave Pubblica e l’algoritmo di Hash usato per la firma; se
Pub(FIRMA)=Hash(FILE) allora l’applicazione comunica all’utente che
la firma è corretta; se Pub(FIRMA)<>Hash(FILE) allora l’applicazione
comunica all’utente che la firma NON è corretta
24
25. Marcatura Temporale
- Serve a collocare nel tempo un documento firmato digitalmente
- E’ effettuata da una terza parte (una Certification Autority) rispetto
a chi firma o riceve il documento
- L’utente utilizza un software installato sul proprio PC che dato in
ingresso un file .p7m restituisce un file .m7m
- Il file .m7m è firmato digitalmente dalla Certification Autority e
contiene la data della sua firma. P.s. Per legge la marca temporale
25
P.s. Per legge la marca temporale
può essere sostituita dalla
segnatura di protocollo.
Tecnologia Vs Processo?
Spesso è meglio il processo :-)
può essere sostituita dalla
segnatura di protocollo.
Tecnologia Vs Processo?
Spesso è meglio il processo :-)
26. Alcuni problemi nell’archiviazione di documenti digitali
- Per evitare attacchi o frodi => i certificati digitali scadono => potrei
archiviare documenti e scoprire che non sono più giuridicamente
validi
- Obsolescenza della tecnologia => potrei archiviare un documento
ma non esiste più nessun PC, dispositivo o software per poterlo
consultare
- Script all’interno di un documento (es. “la data di oggi”) => ho
archiviato un documento che cambia significato nel tempo
- ..
=> lo sforzo per gestire questa complessità è enorme e deve essere
supportato da ogni soggetto pubblico
26
27. Esempi
Elementi per la gestione documentale in Toscana:
- Contesto: RTRT
- AP@CI
- InterPro
- DAX
27
28. RTRT un approccio condiviso con gli enti del territorio
toscano
- Pianificazione: Regione Toscana sviluppa un piano quinquennale per
la «Società dell’informazione e della conoscenza»
- Modello Organizzativo: Rete Telematica Regionale Toscana (RTRT),
Comitato Strategico, Direzione Tecnico Operativa, Gruppi di lavoro
tematici- Modello Tecnologico: Infrastrutture, Open Specific, Open
Source- Progetti condivisi: SUAP, InterPRO, AP@CI, DAX, ...
28
29. AP@CI
Obiettivo:
- Dare alle Imprese e ai Cittadini uno strumento semplice (CNS più
semplice della firma ed equivalente) inviare/ricevere documenti alla PA
toscana- Dare alle Imprese e ai Cittadini evidenza che la PA ha iniziato il
processo di elaborazione della istanza presentata (numero di
protocollo è attesta l’inizio del processo)- Migliorare i tempi dei gestione delle
istanza da parte della PA toscana
29
Documenti:
- autenticazione tramite CNS
- firmati digitalmente
- trasformati in PDF/a e accettati dall’utente
- numero di protocollo viene notificato
all’utente
30. InterPro
Obiettivo:
- Interconnettere gli uffici di protocollo della PA Regionale- Interconnettere
gli uffici di protocollo della PA- Trasmettere i dati della segnatura di
protocollo- Iniziare un processo di gestione documentale e degli archivi
30
Documenti:
- Gestione della Segnatura di Protocollo
- Gestione eventi del documento
protocollato (es. annullamento)
31. DAX
Obiettivo:
- Realizzare sistema di gestione e conservazione di archivi già formati:
insieme di documenti funzionalmente strutturati e organizzati- Salvaguardare
l’unitarietà dell’archivio (descrizione e gestione)
31
32. SGA (Sistema di Gestione degli Archivi) - OAIS
32
CARATTERISTICHE:
- Gestione funzionalità
archivistiche (descrizione,
riordino, scarto, gestione,
topografici)
- Utilizza gli strumenti di
gestione archivistica
(classificazione,
massimario)
- Gestione di entità
archivistiche (aggregati,
unità archivistiche, unità di
conservazione)
- E' l'unico punto di
accesso
OAIS = Open Archival Information System
SIP: Subscribe Information Package
AIP: Archivial Information Package
DIP: Dissemination Information Package
FASI: Acquisizione, Archiviazione,
Accesso, Pianificazione, Amministrazione
33. SGA (Sistema di Gestione degli Archivi) - OAIS
33
Meta dati principali del
documento:
- identificativo
- classifica/fascicolo
- data
- autore
- destinatario
- sintesi (oggetto)
- allegati
- tipo supporto
Meta-dati archivistici
- n° protocollo e data
- oggetto
- codice di classificazione
Meta-dati identità
- autore
- scrittore
- data creazione
- mittente
- destinatario
Meta-dati accesso
- consultabile SI/NO -
profili
- stampabile SI/NO - profili
- copia SI/NO - profili
Meta-dati informatici
- firma digitale
- marca temporale
- data/ora ultimo accesso
- tipo di operazione
- formato
34. Sistema di Conservazione a Norma (SCN) -
UNISInCRO
Conservare è un’attività della fase di Archiviazione (OAIS)
Conservare vuol dire mantenere nel tempo:
- autenticità
- leggibilità
- integrità
- affidabilità
del documento digitale.
Caratteristiche
- rispetta la normativa DigitPA e comunque la normativa sulla conservazione
- prevede di essere aggiornato a nuove norme
- accetta documenti solo in determinati formati, per i quali garantisce l’esibizione
a norma
- ha la capacità di memorizzazione dei documenti e mantenere traccia delle
operazioni eseguite su di essi
34
35. Sistema DAX
Comunicazioni tra sistemi di enti diversi (stesso problema per AP@CI e
InterPro, SUAP, ...)
=> necessari strumenti e metodi standard (infrastrutture):
[quale strumento?] CART: Cooperazione Applicativa Regionale Toscana
[come si accordano gli enti?] e.Toscana Compliance
35
36. e.Toscana Compliance
- e.Toscana Compliance è uno strumento per definire le modalità con
cui interagiscono le applicazioni di un Ente con le applicazioni esterne.
Tale strumento è articolato in:
§ Comitato e.Toscana Compliance
§ Centro Tecnico e.Toscana Compliance
§ Sito e.Toscana Compliance
- RFC e.Toscana è il documento concertato tra gli enti e le imprese
utilizzato per descrivere le interfacce delle applicazioni
- Accreditamento delle applicazioni è un attestato che garantisce gli
enti della perfetta aderenza del software che acquistano alle specifiche
descritte nelle RFC e.Toscana
36
37. CART (Cooperazione Applicativa Regionale Toscana)
37
Interoperabilità
SPCoop
- integra le applicazioni di più di 300 enti diversi
- gestisce più di 100.000.000 di interazioni al mese
- conforme alle specifiche SPCoop
- gestito da Regione Toscana