Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
1. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
Il femminicidio in Italia nell’ultimo decennio:
dimensioni, caratteristiche e profili di rischio
Iezzi Domenica Fioredistella - email:
stella.iezzi@uniroma2.it
−
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
2. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
Outline
1
2
3
4
5
6
7
Obiettivo
Scenario
definizione
Fonti statistiche
Dati
femminicidi nel mondo
femminicidi in Italia
Webmining
Schemi di ponderazione
Caso di studio
dati
metodo
Conclusioni e futuri sviluppi
Riferimenti bibliografici
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
3. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
esaminare i dati, le fonti e le metodologie adottate a livello
mondiale per raccogliere informazioni sulla violenza contro
le donne;
descrivere i femminicidi avvenuti in Italia nell’ultimo
decennio;
illustrare alcuni metodi di web-mining per raccogliere e
analizzare dati non strutturati provenienti dal web
analizzare alcuni problemi metodologici e interpretativi
legati al fenomeno del femmincidio
1) costruzione della matrice dei pesi;
2) algoritmi utilizzati in un processo di text clustering.
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
4. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
definizione
Il femminicidio o femicidio?
Il femminicidio e’ qualsiasi forma di violenza esercitata
sistematicamente sulle donne in nome di una sovrastruttura
ideologica di matrice patriarcale, allo scopo di perpetuarne la
subordinazione e di annientarne l’identita’ attraverso
l’assoggettamento fisico o psicologico, fino alla schivitu’ o alla
morte. Prop. Uccisione di una donna o di una ragazza.
data: 2006. (Fonte: Devoto-Oli, 2013)
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
5. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
definizione
1.png
Figure : Google Books Ngram Viewer - English corpus from 1800 to
2013
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
6. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
definizione
La violenza contro le donne e’ un problema globale che
attraversa le frontiere culturali, geografiche, religiose,
sociali ed economiche di tutti i paesi del mondo,
provocando innumerevoli problemi fisici e mentali alle
donne e alla loro prole. Il femminicidio e’ la punta di questo
iceberg di violenze, perpetrate soprattutto da partner ed
ex-partner.
In Italia, il 31,9% delle donne, con un’eta’ compresa tra
16-70 anni, ha avuto un’esperienza di violenza fisica o
sessuale durante la propria vita, il 23,0% ha subito
violenze sessuali, 18,8% solo violenze fisiche e il 4,8%
stupri o tentati stupri (ISTAT, 2007).
Dal 2000 al 2012, nel nostro paese, ci sono stati 2.220
femicidi, di cui 1.570 in ambito domestico (EURES, 2012).
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
7. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
definizione
Convenzione di Istanbul (Maggio, 2011) - articolo 1
proteggere le donne da ogni forma di violenza e prevenire,
perseguire ed eliminare violenza contro le donne e la
violenza domestica;
contribuire ad eliminare ogni forma di discriminazione
contro le donne e promuovere la concreta parita’ tra i
sessi, ivi compreso rafforzando l’autonomia e
l’autodeterminazione delle donne;
promuovere la cooperazione internazionale al fine di
eliminare la violenza contro le donne e la violenza
domestica;
sostenere e assistere le organizzazioni e
autorita’incaricate dell’applicazione della legge in modo
che possano collaborare efficacemente, al fine di adottare
un approccio integrato per l’eliminazione della violenza
contro le donne e ivi la violenza domestica.
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
8. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
definizione
il decreto su femminicidio in Italia e’ composto da 11 articoli. I
punti piu’ significativi sono:
diventa rilevante, sotto il profilo penale, la relazione tra due
persone a prescindere da convivenze o vincolo
matrimoniale (attuale o pregresso);
Se si e’ in presenza di minacce ripetute la querela diventa
irrevocabile. Resta revocabile negli altri casi, ma solo in
sede processuale;
Nei casi piu’ gravi si puo’ applicare l’allontanamento dalla
casa familiare e il divieto di avvicinamento ai luoghi
frequentati dalla persona offesa;
Chi e’ allontanato dalla casa familiare puo’ essere
controllato con il braccialetto elettronico: nel caso di atti
persecutori si possono usare le intercettazioni.
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
9. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
definizione
Delitti contro la persona denunciati dalle forze di polizia
all’autorita’ giudiziaria in base al sesso - anno 2010
tipo
omicidi volontari
violenze sessuali
stalking
lesioni dolose
percosse
minacce
ingiurie
totale vittime (VA)
530
3981
6598
57716
14544
76708
59421
vittime donne (VA e %)
158 (29,8)
3601 (90,5)
5110 (77,4)
23406 (40,6)
7030 (48,3)
34810 (45,4)
31806 (53,5)
Fonte: Elaborazioni su dati ISTAT e EURES per gli omicidi
volontari
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
10. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
definizione
Delitti contro la persona denunciati dalle forze di polizia
all’autorita’ giudiziaria in base all’autore - anno 2010
tipo
Omicidi volontari
Violenze sessuali
stalking
lesioni dolose
percosse
minacce
ingiurie
totale vittime (VA)
530
3981
6598
57716
14544
76708
59421
%autori uomini
89,5
98,0
85,7
83,5
75,1
78,7
65,5
Fonte: Elaborazioni su dati ISTAT e EURES per gli omicidi
volontari
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
11. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
definizione
Donne vittime di alcuni reati in base alla nazionalita’ - anno
2010
tipo
Omicidi volontari
Violenze sessuali
stalking
lesioni dolose
percosse
minacce
ingiurie
vittime italiane
VA
127
2395
4239
17844
5345
29052
27260
vittime straniere
VA
31
1206
871
5562
1685
5758
4546
Fonte: Elaborazioni su dati ISTAT e EURES per gli omicidi
volontari
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
12. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
Fonti statistiche
ISTAT- Rilevazione sulle cause di morte
- Numero di decessi per causa di morte, sesso, eta’ e
residenza, in particolare la voce "Omicidio e aggressioni".
- Rilevazione annuale - Ultimi dati 2013 (rif. 2010)
DB EURES sull’Omicidio Volontario in Italia
- raccoglie e classifica tutti gli episodi di omicidio volontario
avvenuti in Italia
- Oltre 18.000 casi dal 1990 ad oggi
- 219 variabili (141 relative alla vittima e 78 all’autore)
- I dati NON sono pubblici
Centro Antiviolenza Casa delle donne per non subire
violenza di Bologna dal 2008 al 2011
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
13. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
Alla forte attrazione mediatica si accompagna un rischio di
inadeguata scientificita’ nei criteri utilizzati per raccogliere,
selezionare e classificare gli eventi osservati, inoltre,
l’autoproduzione di statistiche, non soggette ad alcuna verifica,
sta producendo molta confusione.
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
14. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
femminicidi nel mondo
Figure : Rates of female homicide victims per 100,000 female
population, 2004 − 2009
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
15. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
femminicidi nel mondo
Figure : Proportion of women experiencing intimate partner physical
violence at least once in their lifetime and in the last 12 months.
19952006
1
1
WHO, 2010
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
16. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
femminicidi nel mondo
Figure : Femicide no., and prevalence rate per million women in UE
(27 countries)
2
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
2
Fonte: Iezzi, decennio:
Il femminicidio in Italia nell’ultimo 2013 dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
17. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
femminicidi nel mondo
Figure : Violence against Women Prevalence Data: extracted from
surveys by Country Compiled by UN Women (as of March 2011)
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
18. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
femminicidi in Italia
Figure : Femminicidi in Italia 2000 − 2012
Fonte: Elaborazioni su DB EURES (2013)
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
19. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
femminicidi in Italia
Figure : Femminicidi in Italia - indice per mln di donne 2000 − 2012
Fonte: Elaborazioni su DB EURES (2013)
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
20. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
femminicidi in Italia
Distribuzione del femminicidio in Italia per ambito - 2000 − 2012
tipo
famiglia
criminalita’
criminalita’ comune/occasionale
criminalita’ organizzata
altre relazioni di prossimita’
omicidio tra conoscenti/intragruppo
abitazione/vicinato
lavoro/rapporti economici
altro
serial killer/omicidio psicopatici
sette religiose/sataniche
non rilevato
VA
1570
315
274
41
174
91
54
34
28
26
2
128
%
70,7
14,2
12,3
1,8
8,1
4,1
2,4
1,5
1,3
1,2
0,1
5,8
Fonte: Elaborazioni su dati ISTAT e EURES per gli omicidi- 15 ottobre 2013
Milano
volontari
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
21. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
femminicidi in Italia
Figure : Autori dei femminicidi in ambito familiare
Fonte: Iezzi (2013)
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
22. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
femminicidi in Italia
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Figure : Distribuzione regionale dei femminicidi
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
23. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
femminicidi in Italia
Figure : Eta’ vittima e autore
Fonte: Iezzi (2013)
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
24. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
femminicidi in Italia
Figure : Femminicidi in ambito familiare: motivazioni
Fonte: Iezzi (2013)
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
25. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
femminicidi in Italia
Figure : Femminicidi in ambito familiare: arma del delitto
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Fonte: Iezzi (2013)
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
26. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
femminicidi in Italia
Figure : Femminicidi in ambito familiare: luogo del delitto
Fonte: Iezzi (2013)
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
27. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
femminicidi in Italia
Figure : Femminicidi in ambito familiare: ampiezza del comune in cui
avviene il delitto (%)
Fonte: Iezzi (2013)
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
28. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
femminicidi in Italia
Figure : Femminicidi in ambito familiare: ampiezza del comune in cui
avviene il delitto (pr)
Fonte: Iezzi (2013)
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
29. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
femminicidi in Italia
Figure : Nazionalita’ della vittima, valori % 2000 − 2012
Fonte: Iezzi (2013)
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
30. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
femminicidi in Italia
Figure : Nazionalita’ della vittima, indice per mln di donne residenti
2000 − 2012
Fonte: Iezzi (2013)
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
31. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
femminicidi in Italia
Figure : Omicidi di coppia in base alla relazione tra vittima e autore al
momento dellâomicidio Anni 2000-2011 â Valori percentuali
Fonte: Iezzi (2013)
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
32. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
femminicidi in Italia
Figure : Soggetto che ha deciso di separarsi
Fonte: Iezzi (2013)
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
33. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
femminicidi in Italia
Figure : Tempo separazione-femminicidio
Fonte: Iezzi (2013)
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
34. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
Perche’ il webmining?
le fonti disponibili presentano molti dati mancanti;
raccogliere nuovi dati ad integrazione delle informazioni
esistenti;
costruire un vocabolario del linguaggio specifico.
...
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
35. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
Strategia di analisi
1
Fase di acquisizione dei testi:
Reperimento: Web crawling, internet, basi documentali)
Formattazione: trasformazione in XLM; riconoscimento di differenti tipi di Digital encoding: Latin 1, UTF-8, ...
Archiviazione: costituzione del corpus di testi o del document warehouse
2
Fase di NLP (trattamento del linguaggio naturale):
Riconoscere termini (uso di dizionari e basi di conoscenza/reti semantiche)
Effettuare stemming (con attribuzione delle parti del discorso: sostantivi, aggettivi, verbi, avverbi)
Costruire risorse specifiche personalizzate
Normalizzare grafie di numeri, nomi e sigle
Individuare classi di parole chiave
Misurare concetti mediante estrazione di entita’ e loro relazioni
3
Text mining:
Text clustering di testi per similarita’ del vocabolario
Estrazione di informazione
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
36. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
Figure : Le fasi di un processo di TM e Web Mining
Fonte: Elaborazioni su DB EURES (2013)
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
37. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
Schemi di ponderazione
Ciascun documento j puo’ essere rappresentato da un vettore
di termini pesati, selezionati in maniera opportuna, che assume
la seguente forma:
dj = (w1j , w2j , .., wij , ..., wkj )
,
dove wij rappresenta il peso per il termine ti , appartenente al
documentot dj . bb
Dall’unione di questi vettori, otteniamo la matrice D termini per
documenti (tdm):
w11 w12 ... w1n
w21 w2,2 ... w2n
...
... ... ...
wi1 wi2 ... win
...
... ... ...
wk 1
wk 2
... wkn
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
38. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
Schemi di ponderazione
1) Schema booleano, dove wij assume valore 1 se il termine e’
presente nel documento j e 0 altrimenti:
wij =
1
0
if nij > 0
if nij = 0
dove nij e’ il numero di documenti di in cui il termine j occorre.
2) Term frequency scheme (TF): dove wij e’ la frequenza della
parola i nel documento j e nij , frequenza assoluta della parola i
nel documento j. Questo schema e’ noto come "bag-of-words
(BoW)".
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
39. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
Schemi di ponderazione
3)Normalized frequency scheme (NTF):
wij =
tfij
maxtf ij
dove tf − ij la frequenza del termine i nel documento j e’ posta
pari al massimo della frequenza maxtf ij della parola i nel
documento j.
4) TFIDF (term frequency inverse document frequency):
wij = NTFxlog
N
ni
dove N e’ il numero totale di documenti e ni e’ il numero di
documenti in cui la parola i appare.
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
40. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
Schemi di ponderazione
Il corpus come un network.
Table : Term Document Matrix or Affiliation Matrix of twenty-four
words and seven texts
word/text
word1
text1
1
text2
1
text3
0
text4
1
text5
0
text6
0
text7
0
word2
1
0
0
0
1
1
1
...
...
...
...
...
...
...
...
word24
0
0
0
0
0
0
1
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
41. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
Schemi di ponderazione
Figure : Grafo bipartito parole-documenti
Fonte: Iezzi (2012)
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
42. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
Schemi di ponderazione
Figure : Grafo one-mode parole e testi
Fonte: Iezzi (2012)
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
43. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
Schemi di ponderazione
Basic k-means algorithm
1
repeat
3
form k clusters by assigning each
point to its closest centroid;
4
recompute the centroid of each
cluster.
5
bb
Select k point as initial centroids;
2
until centroids do not change
bb
Basic k-medoids algorithm
1
Select k data point as initial medoids;
2
repeat
3
form k clusters by assigning each
point to its closest medoid;
4
see if any other point is a ’better’
medoid.
5
until medoids do not change
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
44. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
Schemi di ponderazione
Fuzzy c-means
Questo algoritmo si basa sulla minimizzazione della seguente
funzione obiettivo:
n
c
m
uij xi − ci
cM =
2
i=1 j=1
dove m e’ qualunque numero reale maggiore di 1, uij e’ il grado
di appartenenza di xi al cluster ci
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
45. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
dati
1000 annunci ANSA, pubblicati dal 2000 al 2012 su casi di
femminicidio
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
46. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
metodo
Method
M1
M2
M3
M4
Step n.1
BOW
TFiDF
BOW
TFiDF
Step n.2
LCA
PCA
Non metric MDS
MDS
Step n. 3
Hierarchical, PAM, k-means
Hierarchical, PAM, k-means
Hierarchical, PAM, k-means
Hierarchical, PAM, k-means
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
47. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
metodo
Figure : Risultati della validazione interna da 2 a 6 gruppi
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Iezzi, 2013â
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
48. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
metodo
Figure : ACL annunci ANSA
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Iezzi, 2013â
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
49. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
Le modifiche apportate al sistema di ponderazione e agli
algoritmi evidenziano un miglioramento dei risultati.
La sperimentazione e’ stata accompagnata dalla
preparazione di programmi implementati sul software R.
E’ in corso una collaborazione scientifica tra un gruppo di
ricercatori dell’Universita’ di Parigi 3 - Sorbonne Nouvelle per sviluppare nuovi algoritmi per il text clustering da
implementare in Lexico 3 e R.
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
50. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
IEZZI D.F. (2010). Intimate femicide in Italy: a model to classify
how killings happened. In: PALUMBO F., LAURO C. N.,
GREENACRE M. J.. Data Analysis and Classification. p.
85-92, BERLIN: Springer-Verlag, ISBN/ISSN:
978-3-642-03738-2, doi: 10.1007/978-3-642-03739-9.
IEZZI D.F. (2010). Topic connections and clustering in text
mining: an analysis of the JADT network. In: Statistical
Analysis of Textual Data. vol. 2, p. 719-730, MILANO:Casa
Editrice LED.
IEZZI D.F., MASTRANGELO M, SARLO S (2011). A text
classification method to measure distance between graduate
profiles and labour market offers. In: CLASSIFICATION AND
DATA ANALYSIS. PAVIA
IEZZI D.F. (2012). Centrality measures for text clustering.
COMMUNICATIONS IN STATISTICS. THEORY AND
METHODS, vol. 41, p. 3179-3197.
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
51. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
IEZZI D.F. (2012). A new method for adapting the k -means
algorithm to text mining. Statistica Applicata Italian Journal of
Applied Statistics, Vol 22(1):. 69-80.
IEZZI D.F., MASTRANGELO M. (2012). Fuzzy c-means for web
mining: the Italian tourist forum case. In: Analysis and
Modeling of complex data in behavioural and Social Science.
Anacapri (NA) - ITALY, September 3-4, 2012, PADOVA:CLEUP.
IEZZI D.F., MASTRANGELO M., SARLO S. (2012). Text
clustering based on centrality measures: an application on job
advertisements. In: 11es Journees Internationales d’analyse
statistique des donnes textuelles. Liegi (B), 13-15 giugno 2012,
p. 515-524.
IEZZI D.F., MASTRANGELO M. (2012). IL PASSAPAROLA
DIGITALE NEI FORUM DI VIAGGIO: MAPPE ESPLORATIVE
PER L’ANALISI DEI CONTENUTI. RIVISTA ITALIANA DI
ECONOMIA, DEMOGRAFIA E STATISTICA.
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
52. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
IEZZI D.F., DERIU F. (2013). Women active citizenship and
wellbeing: the Italian case. QUALITY AND QUANTITY, Vol. 47,
p.1-18 ISSN: 0033-5177, doi: 10.1007/s11135-012-9806-0
IEZZI D.F. (IN PRESS) RIVISTA ITALIANA DI ECONOMIA,
DEMOGRAFIA E STATISTICA.
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013
53. Obiettivo
Scenario
Dati
Webmining
Caso di studio
Conclusioni e futuri sviluppi
Riferimenti bibliografici
EURES. 2013. L’omicidio volontario in Italia - Rapporto EURES
2013, Roma: EURES
ISTAT, 2013. Rapporto Annuale, Roma: ISTAT
ISTAT. 2007, Violenza e maltrattamenti contro le donne dentro
e fuori la famiglia, Comunicato stampa, Roma: ISTAT
ISTAT. 2012. Delitti denunciati dalle Forze di polizia allâAutorita’
giudiziaria. Annuario statistico italiano Roma: ISTAT
ISTAT. 2013. Rapporto annuale 2013. Roma: ISTAT.
WORLD HEALTH ORGANIZATION. 2010. Preventing intimate
partner and sexual violence against women Taking action and
generating evidence, Geneva: WHO.
Iezzi Domenica Fioredistella - email: stella.iezzi@uniroma2.it
Il femminicidio in Italia nell’ultimo decennio: dimensioni, caratteristiche e profili di rischio
Milano - 15 ottobre 2013