Legal Open Document and Data is an increasing phenomena that can produce benefits for the citizens, for the companies for the society in term of transparency, sharing knowledge, accessibility of the decisions. However the judgments, decisions, case-law include personal and sensitive data that can affect the life of the people. This presentation want to present some thought about how to manage the legal information in a correct balancing between right to access and privacy issues (e.g., right to be forgotten) and to suggest some technical solutions from the Semantic Web (e.g., ECLI and Akoma Ntoso, anonymization editor).
1 of 38
Download to read offline
More Related Content
Legal Open Document - OpenSentenze
1. L'informazione giuridica nella societ
della conoscenza:
la rappresentazione del sapere
giuridico nell'era digitale
Monica Palmirani, Universit di Bologna, CIRSFID
Milano
3 giugno 2015
2. Agenda
Societ della conoscenza e open data
Le caratteristiche dellinformazione
giuridica nella societ della conoscenza
Sentenze, trattamento dei dati personali e
open data giuridici
Soluzioni tecniche
3. Internet e la Societ della
conoscenza condivisa
Dati/informazioni + Esperienza =
Conoscenza
Open Source INTelligence
4. Un nuovo paradigma
Raw Data now TED 2009
損Reuse data and create new markets
損Access, transparency, control,
monitoring, evaluation, partecipation
5. Obamas Open Gov Initiative 2009
http://www.data.gov/
an unprecedented level of openness in government
the public trust and establish a system of transparency,
public participation, and collaboration.
an unprecedented level of openness in government
the public trust and establish a system of transparency,
public participation, and collaboration.
9. LItalia e lOpen Data:
Art. 52 CAD
Accesso telematico e riutilizzo dei dati delle pubbliche amministrazioni
Le pubbliche amministrazioni pubblicano nel proprio sito web, all'interno della
sezione "Trasparenza, valutazione e merito", il catalogo dei dati, dei
metadati e delle relative banche dati in loro possesso ed i regolamenti
che ne disciplinano l'esercizio della facolta' di accesso telematico e il
riutilizzo, fatti salvi i dati presenti in Anagrafe tributaria
I dati e i documenti che le amministrazioni titolari pubblicano, con qualsiasi
modalita', senza l'espressa adozione di una licenza di cui all'articolo 2,
comma 1, lettera h), del decreto legislativo 24 gennaio 2006, n. 36, si
intendono rilasciati come dati di tipo aperto ai sensi
all'articolo 68, comma 3, del presente Codice.
Le attivita' volte a garantire l'accesso telematico e il riutilizzo dei dati delle
pubbliche amministrazioni rientrano tra i parametri di valutazione della
performance dirigenziale ai sensi dell'articolo 11, comma 9, del decreto
legislativo 27 ottobre 2009, n. 150.
d.l. 179/2012
10. Art. 50 CAD
Disponibilit dei dati delle pubbliche
amministrazioni
1. I dati delle pubbliche amministrazioni sono formati, raccolti, conservati, resi
disponibili e accessibili con l'uso delle tecnologie dell'informazione e della
comunicazione che ne consentano la fruizione e riutilizzazione, alle condizioni
fissate dall'ordinamento, da parte delle altre pubbliche amministrazioni e dai
privati; restano salvi i limiti alla conoscibilit dei dati previsti dalle leggi e
dai regolamenti, le norme in materia di protezione dei dati personali ed il
rispetto della normativa comunitaria in materia di riutilizzo delle
informazioni del settore pubblico.
2. Qualunque dato trattato da una pubblica amministrazione, con le
esclusioni di cui all'articolo 2, comma 6, salvi i casi previsti dall'articolo
24 della legge 7 agosto 1990, n. 241, e nel rispetto della
normativa in materia di protezione dei dati personali, 竪 reso accessibile e
fruibile alle altre amministrazioni quando l'utilizzazione del dato sia necessaria
per lo svolgimento dei compiti istituzionali dell'amministrazione richiedente,
senza oneri a carico di quest'ultima, salvo per la prestazione di elaborazioni
aggiuntive 竪 fatto comunque salvo il disposto dell'articolo 43, comma 4, del
decreto del Presidente della Repubblica 28 dicembre 2000, n. 445.
11. Art. 68 CAD
(per la prima volta la definizione di open data)
Agli effetti del presente decreto legislativo si intende per:
a) formato dei dati di tipo aperto, un formato di dati reso pubblico,
documentato esaustivamente e neutro rispetto agli strumenti
tecnologici necessari per la fruizione dei dati stessi;
b) dati di tipo aperto, i dati che presentano le seguenti caratteristiche:
a) sono disponibili secondo i termini di una licenza che ne permetta l'utilizzo da parte di
chiunque, anche per finalita' commerciali, in formato disaggregato;
b) sono accessibili attraverso le tecnologie dell'informazione e della comunicazione, ivi
comprese le reti telematiche pubbliche e private, in formati aperti ai sensi della lettera a),
sono adatti all'utilizzo automatico da parte di programmi per elaboratori e sono
provvisti dei relativi metadati;
c) sono resi disponibili gratuitamente attraverso le tecnologie dell'informazione e della
comunicazione, ivi comprese le reti telematiche pubbliche e private, oppure sono resi
disponibili ai costi marginali sostenuti per la loro riproduzione e divulgazione. L'Agenzia
per l'Italia digitale deve stabilire, con propria deliberazione, i casi eccezionali,
individuati secondo criteri oggettivi, trasparenti e verificabili, in cui essi sono resi
disponibili a tariffe superiori ai costi marginali. In ogni caso, l'Agenzia, nel trattamento
dei casi eccezionali individuati, si attiene alle indicazioni fornite dalla direttiva 2003/98/CE
del Parlamento europeo e del Consiglio, del 17 novembre 2003, sul riutilizzo
dell'informazione del settore pubblico, recepita con il decreto legislativo 24 gennaio 2006,
n. 36.
12. Caratteristiche
dellopen government data
Formati aperti: JSON, XML, RDF, CSV, excel, txt, etc.
Dotati di licenza aperta con attribuzione (cc0 si usa
limitatamente nellOGD)
Con metadati che tracciano la storia del dataset
A disposizione senza filtri rispetto ai motori di ricerca
Gratuitamente distribuiti o a costi marginali
Limiti ?
Tanti: dati personali, dati sensibili, copyright, marchi,
segreto statistico, segreto amministrativo, segreto di
stato. e tutto lart. 24 della L. 241/90
13. Linformazione giuridica digitale
Accursio
Magna Glossa
XI
Corpus iuris
civilis
CODEX
Accursio
Magna Glossa
XI
Corpus iuris
civilis
CODEX
copia del contenuto
presentazione
annotazione
Caratteristiche da preservare: distinguere chiaramente fra contenuto
autorevole, metadati aggiuntivi, presentazione editoriale
14. Linformazione giuridica digitale:
Funzionalit
Drafting cooperativo
Tagging e annotazioni
Tracciamento della storia del documento giuridico
Anonimizzazione e alterazioni per la pubblicazione
Autorevolezza, Autenticit, Autorialit, Consistenza,
Integrit
Validit legale e preservazione nel lungo periodo
Provenienza delle asserzioni semantiche
Ricerche semantiche problema dellincrocio dei dati
15. Motivazioni per lapertura
dellinformazione giuridica
La libera accessibilit delle sentenze ha lo scopo di
rendere un migliore servizio al cittadino e rendere pi湛
trasparente il sistema della giustizia in Italia:
per le imprese per sviluppare servizi
per gli operatori della giustizia: giudici, avvocati, liberi
professionisti
per gli studenti e ricercatori
per le associazioni, cittadini, attivisti.
Lofferta di servizi su banche di dati dinformazione
giuridica 竪 costituita da un piccolo gruppo di soggetti che
determinano una situazione di sostanziale oligopolio
17. Contesto Europeo
CURIA Corte di Giustizia Europea
http://curia.europa.eu/juris/document/document.jsf?text=hiv&docid=48564&pageI
ndex=0&doclang=IT&mode=req&dir=&occ=first&part=1&cid=602664#ctx1
ECLI:EU:C:2004:262
ECLI: Standard europeo
per gli URI persistenti
18. Corte di Strasburgo
http://hudoc.echr.coe.int/sites/eng/pages/search.aspx?i=001-127055
19. Quadro normativo italiano per
favorire lapertura delle sentenze
Trasparenza: d.lgs. 33/2013
Pubblicit delle sentenze: CAD, art.
56, comma 2bis
2-bis. I dati identificativi delle questioni
pendenti, le sentenze e le altre
decisioni depositate in cancelleria o
segreteria dell'autorit giudiziaria di
ogni ordine e grado sono, comunque,
rese accessibili ai sensi dell'articolo
51 del codice in materia di protezione
dei dati personali approvato con
decreto legislativo n.196 del 2003.
Pubblicazione e comunicazione della
sentenza: Art. 133 Codice di
Procedura Civile
Linee guida Garante (2 dicembre
2010)
Privacy artt. 51 e 52, d.lgs.
196/2003 (privacy)
Anonimizzazione: Linee guida in
materia di trattamento dei dati
personali nella riproduzione di
provvedimenti giurisdizionali per
finalit di informazione giuridica
(2 dicembre 2010)
Pena accessoria di
pubblicazione per intero o per
estratto della sentenza nel
penale art. 186 Codice Penale
20. Linee guida del Garante Privacy
La diffusione dei provvedimenti giurisdizionali
costituisce fonte preziosa per lo studio e
l'accrescimento della cultura giuridica e
strumento indispensabile di controllo da parte
dei cittadini dell'esercizio del potere
giurisdizionale.
Il Codice favorisce la pi湛 ampia diffusione delle sentenze
e degli altri provvedimenti dell'Autorit giudiziaria per i
quali sia stato assolto, mediante il deposito nella
cancellerie e nelle segreterie giudiziarie, l'onere della
pubblicazione previsto dalle disposizioni dei codici di
procedura civile e penale.
23. Garante Privacy
E tuttavia, la circostanza della pubblicazione integrale
delle pronunce con anche i nominativi, per esteso,
delle parti e dei terzi coinvolti a qualunque titolo non
pu嘆 non suscitare pi湛 di una preoccupazione in ordine
alla garanzia del diritto alla protezione dei dati personali
(spesso anche sensibili e giudiziari) degli interessati.
Questa preoccupazione si fonda, in particolare, sui rischi
di indicizzazione, decontestualizzazione, finanche
alterazione dei dati stessi, inevitabilmente connessi alla
loro indiscriminata accessibilit via web; rischi ben
evidenziati dalla sentenza della Corte di giustizia
dell'Unione europea del 13 maggio scorso, in re C-
131/12 (Google-Spain).
http://www.garanteprivacy.it/web/guest/home/docweb/-/docweb-
display/docweb/3432529
25. Punti critici
Soggetti che hanno diritto ad accedere
Tutto il documento o solo lestratto
Finalit del trattamento e pertinenza (non eccedenza)
Le motivazioni della sentenza o solo il dispositivo
Per quanto tempo
In che forma e formato (XML??)
Indicizzate dai motori generalistici
Diritto alloblio
Anonimizzazione dei dati di identificazione indiretta
De-anonimizzazione
Metadati di ricerca
Penale (Indagati, imputati, condannati ????)
26. OpenSentenze
Gruppo di lavoro composto da circa 50 esperti,
professionisti, accademici:
favorire la pubblicazione delle sentenze come dati di tipo
aperto, ai sensi dellart 68 comma 3 del Codice di
Amministrazione Digitale (Dlgs. n. 82 del 2005) nel
rispetto delle norme sulla protezione dei dati personali;
apertura dei dati statistici in open data;
creare delle linee guida;
Creare tool per facilitare il compito delle corti.
27. Soluzioni tecnologiche
possibili
Linee guida per la pubblicazione delle sentenze in
formato aperto
Standard: ECLI and Akoma Ntoso
ECLI/ELI per i riferimenti
Sentenza n. 12/2008 Tribunale di Milano
ECLI:IT:TRBMI:2008:S12LA
ECLI components under national responsibility
ECLI : [CountryCode] : [CourtCode] : [Year] : [OrdinalNumber]
(Agnoloni, Bacci, Francesconi, ITTG-CNR)
http://www.cortedicassazione.it/cassazione-
resources/resources/cms/documents/20141014_Francesconi.pdf
28. Akoma Ntoso
Akoma Ntoso: Standard
XML per i documenti
giuridici
Adottato dal Parlamento
EU, Camera, Senato, etc.
Nel futuro anche dalla
Corte di Cassazione
Non 竪 un semplice
strumento sintattico ma
ingloba i principi ontologici
del documento giuridico
31. Soluzioni tecnologiche
possibili
NLP tools per
lanonimizzazione (nomi, indirizzi, ruoli,
contesto)
Il detecting automatico dei riferimenti
normativi e delle sentenze
Classificazione automatica degli
oggetti/argomenti
35. Indice di rischio
Categoria delloggetto della sentenza 20% (e.g., diritto di famiglia)
Presenza di minori 30%
Abusi sessuali 15%
Dati sanitari 20%
Dati sullo stato della persona 15%
36. Anonimizzazione
Hash: ossia un metodo per crittografare i dati
personali/sensibili senza cancellarli ma oscurarli a coloro
che non hanno le finalit e i permessi per accedervi
37. Conclusione e
considerazioni su JurisWiki
Lati positivi
Difficile bilanciamento fra informazione giuridica /diritto alla conoscenza e trattamento
dei dati personali secondo finalit e pertinenza
Positivo impulso verso il nuovo come sfida alla staticit e al monopolio
Strumenti Web 2.0 per lannotazione in crowdsourcing delle risorse giuridiche in linea
con lemergente societ della conoscenza
Nuove forme imprenditoriali
Lati oscuri
Problematica ancora aperta sulle licenze nella composizione di fonti eterogenee
provenienti dalle corti: esempio Creative Commons (CC-BY-SA 3.0) Corte
Costituzionale combinate con altre risorse del Web
Problematica aperta sullindicizzazione dellinformazione da parte di motori di ricerca
(Google) e gestione del diritto alloblio molti siti delle corti non sono indicizzati
mentre JurisWiki espone allindicizzazione i materiali sottratti precedentemente
Uso commerciale non autorizzato di dati sensibili (uso di AdSense)
Gestione della presentazione via Web delle fonti giuridiche per preservare la
semantica inclusa nella forma
Dati sensibili relativamente specie nelle sentenze penali (pena accessoria)