際際滷

際際滷Share a Scribd company logo
1
RUMORS E SENTIMENT DELLA
RETE: GEOLOCALIZZARE
LOPINIONE PUBBLICA SUI
SOCIAL MEDIA1
Le mappe dellodio in rete
Qualche settimana fa molti organi di informazione (LEspresso, il Corriere della Sera,
televisioni e agenzie di stampa) hanno diffuso i risultati della ricerca Le mappe
dellintolleranza, un progetto promosso da Vox Diritti sullhate speech attraverso i social
media. Nei giorni immediatamente successivi, la redazione italiana di Wired, noto
magazine di tecnologia, riprende la notizia sollevando alcuni dubbi sui risultati della
ricerca. Le obiezioni - espresse da Alberto Longo e supportate da esperti del settore 
chiamano in causa i limiti metodologici dellopinion mining, soprattutto rispetto a quella
che 竪 la cifra distintiva della ricerca, ossia la geolocalizzazione dei tweet sottoposti ad
analisi.
La ricerca di Vox, realizzata in collaborazione con le Universit di Milano, Roma e Bari,
aveva lobiettivo di creare una mappa geografica dei discorsi dodio nei confronti di
immigrati, omosessuali, disabili, donne ed ebrei attraverso la raccolta dei tweet
discriminatori. Il problema del flaming, il linguaggio eccessivo, violento e aggressivo degli
utenti,竪 uno degli aspetti pi湛 controversi delluso dei social: lanonimato e la distanza
fisica dalla vittima dellaggressione spesso liberano le ultime inibizioni delle persone2
. Non
竪 quindi raro leggere sulle bacheche dei principali social network, ma anche nello spazio
commenti degli articoli dei giornali online, scambi di battute razzisti, omofobi, antisemiti;
ancor pi湛 di recente, come ciclicamente accade, sono stati i Rom a essere stati il bersaglio
di numerose micro-aggressioni online, brevi scambi comunicativi contenenti messaggi
1
Il paper 竪 il risultato della collaborazione tra Alfredo Borrelli (Estrogeni),
Davide Magini (Estrogeni), Olivier La Rocca (Europartners),
Gianfranco Zucca (Europartners).
Per informazioni: a.borrelli@estrogeni.net
o.larocca@europartnersnetwork.eu
2. Un flame 竪 un messaggio deliberatamente ostile e provocatorio
inviato da un utente alla comunit o a un altro individuo specifico, lo
scambio di insulti che spesso ne consegue, paragonabile a una
rissa virtuale; cfr. P. WALLACE, The psychology of the Internet,
Cambridge (UK), Cambridge University Press, 1999
2
volti a denigrare alcuni individui a causa del loro gruppo appartenenza3
. Per i provider di
servizi come Facebook e Twitter la discriminazione digitale e, pi湛 in generale, il flaming 竪
un grosso problema, al punto che di recente il CEO della societ ha dichiarato che Twitter
sta lavorando a degli strumenti per contrastare questo genere di comportamenti, la
dichiarazione di Dick Costolo 竪 molto onesta: we suck at dealing with abuse and trolls on
the platform. Sotto laspetto sostantivo, liniziativa di Vox diritti va quindi a colmare un
vuoto di conoscenza significativo
Meno convincente, almeno stando alle critiche ricevute, 竪 lapproccio metodologico. Le
critiche si appuntano sul fatto che la geografia dellintolleranza 竪 basata su un numero di
tweet molto basso. Le discussioni che hanno seguito la pubblicazione di questa ricerca
danno lopportunit di fare una riflessione sulle potenzialit di geolocalizzare lanalisi
dellopinione pubblica. In questo articolo cercheremo di offrire alcune indicazioni a
riguardo. Lelemento che contraddistingue il contributo 竪 dato dal fatto che non ci
limiteremo a fare riflessioni di metodo, ma proporremo un confronto basato su una
rilevazione realizzata ad hoc per verificare le differenze tra il metodo Vox e un metodo
basato su un approccio alla localizzazione geografica che assicura basi dati pi湛 ampie e
robuste. Occorre precisare che lanalisi proposta ha lobiettivo di avviare una discussione e
non certo di giudicare la qualit di altre ricerche.
Cosa funziona e cosa non funziona nelle hate map
Le hate map sono una rappresentazione geografica dei messaggi a carattere
discriminatorio rinvenuti sui social, realizzate attraverso le coordinate geografiche degli
utenti (latittudine e longitudine). Su Twitter ad esempio 竪 possibile abilitare la funzione di
geolocalizzazione dei tweet, permettendo cos狸 agli utenti di dare e avere informazioni
sulla localit dalla quale proviene il messaggio 4
. Questa opzione apre delle grandi
possibilit alla sentiment analysis, lo studio dellumore della rete attraverso lanalisi di
grandi quantit di messaggi. La ricerca di Vox sulla geografia italiana dellintolleranza
sfrutta questa possibilit, replicando la metodologia di unindagine realizzata nel 2013
sugli Stati Uniti5
. Sotto il profilo metodologico, lanalisi di Vox 竪 basata sulla raccolta oltre
2 milioni di tweet nel periodo gennaio-agosto 2014. Il retrieving dei dati 竪 stato realizzato
usando parole chiave collegate al sentimento di intolleranza nei confronti di stranieri,
omosessuali, disabili, donne ed ebrei: ad esempio, per esaminare il razzismo sono stati
raccolti i tweet contenenti parole come negro, zingaro e terrone. Il passaggio
successivo 竪 stato lindividuazione dei messaggi contenenti le coordinate geografiche
dellutente al momento della pubblicazione: nel complesso, i tweet geolocalizzati sono
circa 43.000 (il 2,3% del totale). Sulla base delle coordinate geografiche sono state
realizzate delle mappe termografiche che indicano le zone dellItalia dove i tweet
discriminatori sono pi湛 frequenti.
La metodologia dellindagine sollecita alcune domande.
Prima domanda. Di quale popolazione sono rappresentative la mappe? La risposta 竪
banale. Le mappe dellodio rappresentano una parte della popolazione che usa un
linguaggio discriminatorio su Twitter, quel segmento che decide di geolocalizzare i propri
messaggi. In senso stretto, il campione analizzato 竪 autoeletto, ossia contiene solo coloro
che usano tag geografici quando twittano. Quindi le mappe sono inutili? No, tuttaltro. Le
3. Cfr. D.W. SUE, Micro-aggressions in Everyday Life. Race, Gender,
and Sexual Orientation, John Wiley & Sons, Hoboken [N.J.] 2010.
4. In linguaggio tecnico questo tipo di dati viene definito Voluntereed
Geographical Information (VGI).
5. Il progetto 竪 denominato Geography of Hate. Geotagged Hateful
Tweets in the United States 竪 realizzato della Humboldt University
di Arcata in California
3
hate map rappresentano una fonte di conoscenza preziosissima, soprattutto se collegate
ad altre informazioni geografiche e socio-economiche. Di norma, nellanalisi dellopinione
pubblica, si usano variabili territoriali dal potere esplicativo molto limitato: dire che nel
Nord-Est le persone la pensano in un certo modo, significa poco anche perch辿 in questarea
geografica rietrano sia Belluno che Riccione, due comuni tra loro molto differenti.
Seconda domanda. Il 2,3% di messaggi geolocalizzati 竪 tanto o 竪 poco? In assoluto 竪 tanto,
perch辿 ad oggi, almeno in Italia, la geolocalizzazione nelluso dei social non 竪 cos狸 diffusa,
anzi gli user sembrano ancora avere una certa diffidenza. Daltronde 竪 pur vero che se si
vogliono usare tecniche statistiche avanzate, la numerosit dei casi 竪 importante,
soprattutto quando si ha lesigenza di risultati con un dettaglio territoriale molto fine. Non
a caso, nel commento delle mappe i ricercatori di Vox si guardano bene dal citare comuni
o province specifiche, ma si limitano a discutere le differenze tra macro-ripartizioni o
tuttal pi湛 regioni.
Un confronto tra due approcci di geotagging
Pur con i suoi limiti, la ricerca realizzata da Vox ha lindubbio pregio di introdurre almeno
nel panorama italiano un approccio nuovo. Combinare gli strumenti di opinion mining con
lattenzione alla dimensione territoriale dei fenomeni, 竪 un approccio molto promettente
che merita di essere approfondito e applicato in numerosi contesti di analisi.
Con questo obiettivo, presentiamo i risultati di una rilevazione sperimentale che, partendo
dagli stessi presupposti delle mappe dellintolleranza, introduce unimportante differenza.
La sperimentazione 竪 collegata allo sviluppo di uno strumento che integra statistica
territoriale e sentiment analysis, denominato DEEP (Drawing Elements for Effective
Politics)6
.
Cos狸 come fatto dai ricercatori di Vox, abbiamo raccolto tutti i tweet contenenti le parole:
negro, zingaro, muso giallo, mangiabanane. Il periodo di riferimento della
rilevazione 竪, invece, molto inferiore: le prime tre settimane di febbraio 2015.
Nel complesso, la base dati a disposizione 竪 di 11.655 tweet. Per comparare i risultati
ottenuti tramite DEEP con quelli delle mappe dellintolleranza, 竪 necessario esplicitare il
processo di geotagging usato. Sotto questo profilo la differenza 竪 sostanziale: al posto di
usare le coordinate geografiche  scelta che comporta un netto restringimento della base
dati disponibile  DEEP lavora sulla user location (UL), un campo previsto dal modulo di
registrazione su Twitter, allinterno del quale lutente pu嘆 specificare la localit nella
quale risiede. I vantaggi di usare la UL sono almeno due, uno di ordine tecnico, laltro
teorico.
Gli utenti che rendono disponibile la propria UL sono molto pi湛 numerosi degli utenti che
geolocalizzano i tweet: nella rilevazione pilota realizzata a febbraio 2015, il 61,4% dei
tweet raccolti conteneva unindicazione della UL, una percentuale non confrontabile con il
2,3% di tweet geolocalizzati analizzati da Vox.
Usare la UL offre anche un vantaggio di tipo teorico. Decidere di inserire una localit
allinterno del proprio profilo twitter significa rivendicare unappartenenza territoriale:
sono romano, sono napoletano, sono milanese. Si tratta di uninformazione allapparenza
banale, ma che nellanalisi di molti fenomeni di opinione pu嘆 risultare importante. Inoltre,
a differenza delle coordinate geografiche, lUL 竪 stabile: se un tweet 竪 taggato con
6. DEEP 竪 un prodotto realizzato da Europartners ed Estrogeni con la
collaborazione di Aster. Su richiesta 竪 disponibile un paper di
presentazione dello strumento, contenente anche unapplicazione
alla regione Marche. Per informazioni contattare: Olivier La Rocca
(o.larocca@europartnersnetwork.eu) o Alfredo Borrelli
(a.borrelli@estrogeni.net).
4
coordinate geografiche ricadenti nel centro citt di Milano, non 竪 possibile sapere se la
persona vive effettivamente in cittoppure se 竪 un pendolare o un turista.
La scelta di usare la UL comporta per嘆 un lavoro supplementare per la preparazione della
base dati. La tabella 1 illustra numericamente i tre passaggi di cleaning necessari alla
creazione di una database di messaggi geolocalizzati sulla base dellUL.
Tabella 1  Processo didentificazione dei tweet geolocalizzati
STEP 1 STEP 2 STEP 3
Presenza
della User
Location (UL)
N %
Pertinenza del
tweet
N % Usabilit della UL N %
Tweet con UL 7157 61.4
Tweet con UL
pertinenti
3839 53.6
Tweet pertinenti
con UL utilizzabile
1547 46.6
Tweet senza
UL
4498 38.6
Tweet con UL non
pertinenti
3318 46.4
Tweet pertinenti
con UL inutilizzabile
1771 53.4
Tweet totali 11655 100.0 Totale tweet con UL 7157 100.0
Totale tweet con UL
pertinenti
3318 100.0
Fonte: elaborazioni Europartners/Estrogeni su dati propri (febbraio 2015)
Le operazioni di pulizia dei dati comportano una perdita dinformazione che tuttavia non
arriva ai livelli che si ottengono usando le coordinate geografiche. Come detto, il primo
step (eliminazione dei tweet senza UL) comporta una perditadinformazione del 38,6%. Nel
secondo step, si analizza la pertinenza del contenuto del tweet, eliminando i messaggi che
pur contenendo una o pi湛 keywords non rientrano tra quelli dinteresse per lanalisi: nel
caso specifico si 竪 trattato soprattutto di messaggi che rimandavano a materiale
pornografico e che, spesso, contenevano la parola negro.
Nel secondo step, 竪 stato eliminato il 46,4% dei messaggi risultanti dalla prima operazione
di cleaning dei dati. C竪 da precisare che, sebbene nella metodologia della ricerca Vox
questo passaggio non sia esplicitato, 竪 probabile che sia stato realizzato. Infine, nel terzo
step si 竪 provveduto a identificare i messaggi pertinenti contenenti una UL utilizzabile ai
fini della geolocalizzazione. Questa passaggio 竪 necessario per eliminare i tweet di quegli
utenti che non valorizzano il campo UL usando unindicazione geografica. Siccome nel form
di registrazione usato da Twitter il campo UL 竪 libero, alcuni utenti inseriscono indicazioni
fittizie, ironiche o semplicemente lacunose. Si precisa che il livello di geottaging usato da
DEEP 竪 molto fine perch辿 si considerano solo i tweet riconducibili a uno degli oltre
ottomila comuni italiani. Questo passaggio ha comportato la perdita del 53,4% dei tweet
pertinenti con indicazione di UL.
Nel complesso, luso della user location in luogo delle coordinate geografiche ha garantito
una percentuale del 13,3% di tweet utili allanalisi (la ricerca Vox dichiara una percentuale
di messaggi utile del 2,3%): in pratica da una base di partenza di oltre 11mila messaggi, si
竪 ottenuto un corpus di 1547 messaggi geolocalizzati a livello comunale.
5
A scopo illustrativo si riporta la distribuzione regionale dei tweet (grafico 1), corredata
dalla classifica dei primi dieci comuni per numero di tweet (tabella 2).
Grafico 1  N Tweet geolocalizzati
Fonte: elaborazioni Europartners/Estrogeni su dati propri (febbraio 2015)
Trattandosi di una rilevazione pilota, la numerosit di alcune regioni 竪 decisamente
esigua. Tuttavia, emergono alcune informazioni interessanti come ad esempio il fatto che i
tweet provengono da 275 diversi comuni italiani e che in testa alla classifica per regioni
oltre alla Lombardia e al Lazio (indicate anche da Vox), ci sia anche la Sicilia.
Tabella 2  Primi dieci comuni per numero di tweet
(N comuni = 275)
Comune N. Tweet %
1 Roma 304 19.7
2 Milano 169 10.9
3 Palermo 107 6.9
4 Napoli 68 4.4
5 Torino 49 3.2
6 Genova 41 2.7
7 Bologna 38 2.5
8 Firenze 24 1.6
9 Padova 22 1.4
10 Verona 22 1.4
Totale primi 10 comuni 844 54.6
Altri comuni (265) 703 45.4
Totale 1547 100.0
Fonte: elaborazioni Europartners/Estrogeni su dati propri (febbraio 2015)
312
271
180
113
99 98 93 85 75
56
44
32
19 18 16 12 11 5 4 2 1 10
50
100
150
200
250
300
350
N. Tweet
6
Venti giorni di antiziganismo in rete
Nel periodo compreso tra il 2 e il 22 febbraio abbiamo analizzato il sentiment di Twitter
nei confronti dei rom. Allinterno della rilevazione pilota,realizzata per testare lefficienza
di DEEP e confrontarne le prestazioni con i dati della ricerca Vox, era presente anche la
keyword zingaro. La raccolta ha originato, 317 tweet geolocalizzati sulla base della UL.
Si tratta del 20,5% del totale di messaggi utili. Bench辿 la rilevazione fosse un test dello
strumento, pensiamo sia utile analizzare i dati di sentiment poich辿 mettono in luce
elementi interessanti sul pregiudizio e lostilit che circola su Twitter7
.
Il grafico 2 rappresenta il sentiment generale nei confronti dei rom: nelle tre settimane di
riferimento il dato 竪 abbastanza inequivocabile poco meno del 60% dei tweet analizzati
conteneva messaggio negativi, denigratori, aggressivi o apertamente razzisti nei confronti
dei rom. Un terzo dei tweet, invece, presentava un contenuto neutro. Infine, solo il 4,1%
dei messaggi aveva un contenuto positivo.
Grafico 2  Il sentiment di twitter verso i rom
Fonte: elaborazioni Europartners/Estrogeni su dati propri (febbraio 2015)
Il secondo dato dinteresse si trova nel grafico 3, nel quale si presenta il sentiment per
regione. Non si usa la localizzazione comunale, pur disponibile, poich辿 lesiguit numerica
7. DEEP analizza il sentiment con un approccio qualitativo, ossia la
classificazione dei tweet non avviene attraverso procedure
automatiche o semi-automatiche, ma attraverso lanalisi del
contenuto tweet per tweet.
4,1
36,0
59,9
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
Positivo Neutro Negativo
Twitter SENTIMENT nei confronti dei ROM (periodo: 2-22 febbraio - N=317)
7
dei dati raccolti durante il test non permette statistiche robuste. Le regioni sono ordinate
sulla base del numero di tweet negativi.
Grafico 3  Sentiment verso i rom per regione (N)
Fonte: elaborazioni Europartners/Estrogeni su dati propri (febbraio 2015)
Lazio e Lombardia, pur avendo circa lo stesso numero totale di messaggi, presentano una
differente composizione interna. Dal Lazio provengono soprattutto tweet negativi, mentre
in Lombardia messaggi negativi e neutri quasi si equivalgono: rimane fermo lo scenario di
sostanziale negativit nei confronti dei rom. Purtroppo i dati della rilevazione pilota non
permettono altri approfondimenti. C竪 comunque da ricordare che il periodo analizzato 竪
coinciso con un fatto di cronaca che ha avuto una larga eco: in Veneto, il benzinaio
Graziano Stacchio ha ucciso Albano Cassol, vicentino di origini rom, mentre stava tentando
una rapina in una gioielleria. Nei giorni successivi, i media hanno dato spazio e amplificato
i sentimenti di antiziganismo suscitati dallepisodio.
Twitter non ha fatto eccezione: leggendo i tweet raccolti per questa sperimentazione
(molti riferiti allhashtag #iostoconstacchio) si ha lidea di quanta violenza e ostilit ci
possano essere in 140 caratteri. Molti messaggi infatti riportano commenti sprezzanti e
denigratori, basati su pregiudizi e stereotipi; in alcuni casi vengono formulate vere e
proprie minacce. Non di rado, infine, la molla che fa scattare le aggressioni verbali via
Twitter sono i talk show televisivi: i tweet contro i rom che contengono hashtag riferiti a
trasmissioni come La gabbia (La7) o Quinta colonna (Rete4) sono numerosi.
Twitter diventa cos狸 la cassa di risonanza di un discorso pubblico esacerbato e polarizzato:
come in quei talk show dove non ci sono argomentazioni da discutere, ma solo fazioni da
sostenere o avversare.
1
1
1
2
2
3
3
3
5
6
8
8
9
10
17
20
32
59
1
3
2
3
3
4
4
5
8
10
2
2
4
10
5
11
25
12
1
1
1
1
1
7
1
0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75
Valle d'Aosta
Calabria
Molise
Trentino Alto Adige
Marche
Umbria
Abruzzo
Puglia
Sardegna
Sicilia
Emilia Romagna
Friuli Venezia Giulia
Liguria
Campania
Toscana
Piemonte
Veneto
Lombardia
Lazio
Negativo
Neutro
Positivo
8
Analizzare lopinione pubblica sulla rete:
alcune riflessioni
Sulla scorta delle riflessioni proposte in precedenza si possono porre tre questioni sulle
quali occorre lavorare per sfruttare appieno le potenzialit della geolocalizzazione
nellanalisi dellopinione pubblica sui social.
o Migliorare i sistemi di geotagging: al momento gli utenti che usano le coordinate
geografiche non sono abbastanza numerosi, peraltro la localizzazione latitudine-
longitudine pu嘆 essere fuorviante se si vuole considerare lappartenenza territoriale
di una persona come una variabile socio-culturale della quale tenere conto nel
corso dellanalisi. Nel caso di Twitter la soluzione basata sulluso della user
location ci sembra, al momento, soddisfacente.
o Associare ai dati di opinione, informazioni socio-economiche: geolocalizzare le
opinioni delle persone permette di agganciare allanalisi una serie di informazioni
accessorie che possono risultare molto utili in sede di interpretazione. Le
statistiche territoriali sono sempre pi湛 ricche e dettagliate. Lobiezione che si pu嘆
fare allanalisi del sentiment 竪 che le opinioni espresse su internet galleggino in un
vuoto socio-economico, si pu嘆 ovviare a questo problema collegando i dati di
opinione con le statistiche territoriali, anche comunali. Ad esempio, in un recente
test di DEEP - lo strumento di analisi sul quale 竪 basata lanalisi presentata in
questo paper  abbiamo collegato, lanalisi dei tweet, con statistiche comunali e
dati elettorali. Questo 竪 solo un esempio di come la combinazione tra dati di
diversa fonte e origine sia una prospettiva metodologica molto promettente.
o Usare tecniche quali-quantitative: lanalisi quantitativa del sentiment 竪 ormai uno
standard, tuttavia pensiamo che per alcuni fenomeni specifici non sia lapproccio
migliore. Le metriche quantitative in alcuni casi non sono applicabili, in altri non
colgono aspetti importanti dei fenomeni. La ricchezza informativa dei social media
pu嘆 essere sfruttata anche usando tecniche di analisi qualitativa, basate
sullinterpretazione dei messaggi e sulla capacit di creare collegamenti tra i
comportamenti online e la vita offline delle persone.

More Related Content

Similar to Rumors e sentiment della rete (20)

Apprendere con i social media
Apprendere con i social mediaApprendere con i social media
Apprendere con i social media
Dino Amenduni
Odio online, il report finale del gruppo di lavoro
Odio online, il report finale del gruppo di lavoroOdio online, il report finale del gruppo di lavoro
Odio online, il report finale del gruppo di lavoro
Massa Critica
Rodolfo Baggio - Recensioni Online
Rodolfo Baggio - Recensioni OnlineRodolfo Baggio - Recensioni Online
Rodolfo Baggio - Recensioni Online
BTO Educational
際際滷s digital methods Massimo Airoldi x bertram niessen
際際滷s digital methods Massimo Airoldi x bertram niessen際際滷s digital methods Massimo Airoldi x bertram niessen
際際滷s digital methods Massimo Airoldi x bertram niessen
Bertram Niessen
Infosfera italiana 2016
Infosfera italiana 2016Infosfera italiana 2016
Infosfera italiana 2016
Giorgia Piccolo
Infosfera italiana 2016
Infosfera italiana 2016Infosfera italiana 2016
Infosfera italiana 2016
eugenio iorio
I cani la band: tra social strategy e viral marketing
I cani la band: tra social strategy e viral marketingI cani la band: tra social strategy e viral marketing
I cani la band: tra social strategy e viral marketing
Alessia Morichi
Lo stato trasparente. Linked open data e cittadinanza attiva.
Lo stato trasparente. Linked open data e cittadinanza attiva.Lo stato trasparente. Linked open data e cittadinanza attiva.
Lo stato trasparente. Linked open data e cittadinanza attiva.
AmmLibera AL
Reference-informazione-comunicazione mobile
Reference-informazione-comunicazione mobileReference-informazione-comunicazione mobile
Reference-informazione-comunicazione mobile
Paola Gargiulo
Sociologia dell'odio digitale e dello hate speech
Sociologia dell'odio digitale e dello hate speechSociologia dell'odio digitale e dello hate speech
Sociologia dell'odio digitale e dello hate speech
Davide Bennato
Primo learning meeting Wister: nuove forme di comunicazione e work life-balance
Primo learning meeting Wister: nuove forme di comunicazione e work life-balancePrimo learning meeting Wister: nuove forme di comunicazione e work life-balance
Primo learning meeting Wister: nuove forme di comunicazione e work life-balance
WISTER: Women for Intelligent and Smart TERritories
#Folksonomies & #Law: Stato dellarte, profili teoretici e prospettive di ric...
#Folksonomies & #Law: Stato dellarte, profili teoretici e prospettive di ric...#Folksonomies & #Law: Stato dellarte, profili teoretici e prospettive di ric...
#Folksonomies & #Law: Stato dellarte, profili teoretici e prospettive di ric...
Federico Costantini
Twitter in redazione
Twitter in redazioneTwitter in redazione
Twitter in redazione
Carlo Felice Dalla Pasqua
First life app4city
First life  app4cityFirst life  app4city
First life app4city
Guido Boella
Diffondere la ricerca con i social media
Diffondere la ricerca con i social mediaDiffondere la ricerca con i social media
Diffondere la ricerca con i social media
Davide Bennato
G8 Net Game Andrea Calderaro
G8 Net Game Andrea CalderaroG8 Net Game Andrea Calderaro
G8 Net Game Andrea Calderaro
Marco Binotto
Cittadini digitali - lagire politico al tempo dei social media
Cittadini digitali - lagire politico al tempo dei social mediaCittadini digitali - lagire politico al tempo dei social media
Cittadini digitali - lagire politico al tempo dei social media
Salvatore Fabbrizio
Report d3.2 16 luglio 2014
Report d3.2 16 luglio 2014Report d3.2 16 luglio 2014
Report d3.2 16 luglio 2014
OssCom
#FoodPorn Community Detection
#FoodPorn Community Detection#FoodPorn Community Detection
#FoodPorn Community Detection
Camillo Di Tullio
Apprendere con i social media
Apprendere con i social mediaApprendere con i social media
Apprendere con i social media
Dino Amenduni
Odio online, il report finale del gruppo di lavoro
Odio online, il report finale del gruppo di lavoroOdio online, il report finale del gruppo di lavoro
Odio online, il report finale del gruppo di lavoro
Massa Critica
Rodolfo Baggio - Recensioni Online
Rodolfo Baggio - Recensioni OnlineRodolfo Baggio - Recensioni Online
Rodolfo Baggio - Recensioni Online
BTO Educational
際際滷s digital methods Massimo Airoldi x bertram niessen
際際滷s digital methods Massimo Airoldi x bertram niessen際際滷s digital methods Massimo Airoldi x bertram niessen
際際滷s digital methods Massimo Airoldi x bertram niessen
Bertram Niessen
Infosfera italiana 2016
Infosfera italiana 2016Infosfera italiana 2016
Infosfera italiana 2016
Giorgia Piccolo
Infosfera italiana 2016
Infosfera italiana 2016Infosfera italiana 2016
Infosfera italiana 2016
eugenio iorio
I cani la band: tra social strategy e viral marketing
I cani la band: tra social strategy e viral marketingI cani la band: tra social strategy e viral marketing
I cani la band: tra social strategy e viral marketing
Alessia Morichi
Lo stato trasparente. Linked open data e cittadinanza attiva.
Lo stato trasparente. Linked open data e cittadinanza attiva.Lo stato trasparente. Linked open data e cittadinanza attiva.
Lo stato trasparente. Linked open data e cittadinanza attiva.
AmmLibera AL
Reference-informazione-comunicazione mobile
Reference-informazione-comunicazione mobileReference-informazione-comunicazione mobile
Reference-informazione-comunicazione mobile
Paola Gargiulo
Sociologia dell'odio digitale e dello hate speech
Sociologia dell'odio digitale e dello hate speechSociologia dell'odio digitale e dello hate speech
Sociologia dell'odio digitale e dello hate speech
Davide Bennato
#Folksonomies & #Law: Stato dellarte, profili teoretici e prospettive di ric...
#Folksonomies & #Law: Stato dellarte, profili teoretici e prospettive di ric...#Folksonomies & #Law: Stato dellarte, profili teoretici e prospettive di ric...
#Folksonomies & #Law: Stato dellarte, profili teoretici e prospettive di ric...
Federico Costantini
First life app4city
First life  app4cityFirst life  app4city
First life app4city
Guido Boella
Diffondere la ricerca con i social media
Diffondere la ricerca con i social mediaDiffondere la ricerca con i social media
Diffondere la ricerca con i social media
Davide Bennato
G8 Net Game Andrea Calderaro
G8 Net Game Andrea CalderaroG8 Net Game Andrea Calderaro
G8 Net Game Andrea Calderaro
Marco Binotto
Cittadini digitali - lagire politico al tempo dei social media
Cittadini digitali - lagire politico al tempo dei social mediaCittadini digitali - lagire politico al tempo dei social media
Cittadini digitali - lagire politico al tempo dei social media
Salvatore Fabbrizio
Report d3.2 16 luglio 2014
Report d3.2 16 luglio 2014Report d3.2 16 luglio 2014
Report d3.2 16 luglio 2014
OssCom
#FoodPorn Community Detection
#FoodPorn Community Detection#FoodPorn Community Detection
#FoodPorn Community Detection
Camillo Di Tullio

More from Estrogeni (19)

Analisi del sentiment di #Cinema2Day - gennaio 2017
Analisi del sentiment di #Cinema2Day - gennaio 2017Analisi del sentiment di #Cinema2Day - gennaio 2017
Analisi del sentiment di #Cinema2Day - gennaio 2017
Estrogeni
#Cinema2day: la Sentiment Analysis realizzata da Estrogeni
#Cinema2day: la Sentiment Analysis realizzata da Estrogeni#Cinema2day: la Sentiment Analysis realizzata da Estrogeni
#Cinema2day: la Sentiment Analysis realizzata da Estrogeni
Estrogeni
Lancia Ypsilon Restyling - Sentiment Analysis
Lancia Ypsilon Restyling - Sentiment AnalysisLancia Ypsilon Restyling - Sentiment Analysis
Lancia Ypsilon Restyling - Sentiment Analysis
Estrogeni
Volkswagen dieselgate - Sentiment Analysis
Volkswagen dieselgate - Sentiment AnalysisVolkswagen dieselgate - Sentiment Analysis
Volkswagen dieselgate - Sentiment Analysis
Estrogeni
Estrogeni Presentazione
Estrogeni PresentazioneEstrogeni Presentazione
Estrogeni Presentazione
Estrogeni
Digital Living Kitchen
Digital Living KitchenDigital Living Kitchen
Digital Living Kitchen
Estrogeni
Top Digital Banking 2014
Top Digital Banking 2014Top Digital Banking 2014
Top Digital Banking 2014
Estrogeni
The Salt of the Earth - Social Media Marketing
The Salt of the Earth - Social Media MarketingThe Salt of the Earth - Social Media Marketing
The Salt of the Earth - Social Media Marketing
Estrogeni
Il Sale della Terra - Social Media Marketing
Il Sale della Terra - Social Media MarketingIl Sale della Terra - Social Media Marketing
Il Sale della Terra - Social Media Marketing
Estrogeni
Sentiment Analysis - Fashion Brands
Sentiment Analysis - Fashion BrandsSentiment Analysis - Fashion Brands
Sentiment Analysis - Fashion Brands
Estrogeni
Sentiment Analysis - Settore Fashion
Sentiment Analysis - Settore FashionSentiment Analysis - Settore Fashion
Sentiment Analysis - Settore Fashion
Estrogeni
Voiceover: il social sentiment applicato alla Festa del Cinema 2014
Voiceover: il social sentiment applicato alla Festa del Cinema 2014Voiceover: il social sentiment applicato alla Festa del Cinema 2014
Voiceover: il social sentiment applicato alla Festa del Cinema 2014
Estrogeni
Voiceover: un anno di social sentiment e cinema
Voiceover: un anno di social sentiment e cinemaVoiceover: un anno di social sentiment e cinema
Voiceover: un anno di social sentiment e cinema
Estrogeni
Studio per Patrizia Pepe
Studio per Patrizia PepeStudio per Patrizia Pepe
Studio per Patrizia Pepe
Estrogeni
Il team italiano per Londra 2012
Il team italiano per Londra 2012Il team italiano per Londra 2012
Il team italiano per Londra 2012
Estrogeni
Sanremo Web Stars
Sanremo Web StarsSanremo Web Stars
Sanremo Web Stars
Estrogeni
Estrogeni per Uomini che odiano le donne
Estrogeni per Uomini che odiano le donneEstrogeni per Uomini che odiano le donne
Estrogeni per Uomini che odiano le donne
Estrogeni
Effetto shopping - Case history Estrogeni
Effetto shopping - Case history EstrogeniEffetto shopping - Case history Estrogeni
Effetto shopping - Case history Estrogeni
Estrogeni
Draquila - Case history Estrogeni
Draquila - Case history EstrogeniDraquila - Case history Estrogeni
Draquila - Case history Estrogeni
Estrogeni
Analisi del sentiment di #Cinema2Day - gennaio 2017
Analisi del sentiment di #Cinema2Day - gennaio 2017Analisi del sentiment di #Cinema2Day - gennaio 2017
Analisi del sentiment di #Cinema2Day - gennaio 2017
Estrogeni
#Cinema2day: la Sentiment Analysis realizzata da Estrogeni
#Cinema2day: la Sentiment Analysis realizzata da Estrogeni#Cinema2day: la Sentiment Analysis realizzata da Estrogeni
#Cinema2day: la Sentiment Analysis realizzata da Estrogeni
Estrogeni
Lancia Ypsilon Restyling - Sentiment Analysis
Lancia Ypsilon Restyling - Sentiment AnalysisLancia Ypsilon Restyling - Sentiment Analysis
Lancia Ypsilon Restyling - Sentiment Analysis
Estrogeni
Volkswagen dieselgate - Sentiment Analysis
Volkswagen dieselgate - Sentiment AnalysisVolkswagen dieselgate - Sentiment Analysis
Volkswagen dieselgate - Sentiment Analysis
Estrogeni
Estrogeni Presentazione
Estrogeni PresentazioneEstrogeni Presentazione
Estrogeni Presentazione
Estrogeni
Digital Living Kitchen
Digital Living KitchenDigital Living Kitchen
Digital Living Kitchen
Estrogeni
Top Digital Banking 2014
Top Digital Banking 2014Top Digital Banking 2014
Top Digital Banking 2014
Estrogeni
The Salt of the Earth - Social Media Marketing
The Salt of the Earth - Social Media MarketingThe Salt of the Earth - Social Media Marketing
The Salt of the Earth - Social Media Marketing
Estrogeni
Il Sale della Terra - Social Media Marketing
Il Sale della Terra - Social Media MarketingIl Sale della Terra - Social Media Marketing
Il Sale della Terra - Social Media Marketing
Estrogeni
Sentiment Analysis - Fashion Brands
Sentiment Analysis - Fashion BrandsSentiment Analysis - Fashion Brands
Sentiment Analysis - Fashion Brands
Estrogeni
Sentiment Analysis - Settore Fashion
Sentiment Analysis - Settore FashionSentiment Analysis - Settore Fashion
Sentiment Analysis - Settore Fashion
Estrogeni
Voiceover: il social sentiment applicato alla Festa del Cinema 2014
Voiceover: il social sentiment applicato alla Festa del Cinema 2014Voiceover: il social sentiment applicato alla Festa del Cinema 2014
Voiceover: il social sentiment applicato alla Festa del Cinema 2014
Estrogeni
Voiceover: un anno di social sentiment e cinema
Voiceover: un anno di social sentiment e cinemaVoiceover: un anno di social sentiment e cinema
Voiceover: un anno di social sentiment e cinema
Estrogeni
Studio per Patrizia Pepe
Studio per Patrizia PepeStudio per Patrizia Pepe
Studio per Patrizia Pepe
Estrogeni
Il team italiano per Londra 2012
Il team italiano per Londra 2012Il team italiano per Londra 2012
Il team italiano per Londra 2012
Estrogeni
Sanremo Web Stars
Sanremo Web StarsSanremo Web Stars
Sanremo Web Stars
Estrogeni
Estrogeni per Uomini che odiano le donne
Estrogeni per Uomini che odiano le donneEstrogeni per Uomini che odiano le donne
Estrogeni per Uomini che odiano le donne
Estrogeni
Effetto shopping - Case history Estrogeni
Effetto shopping - Case history EstrogeniEffetto shopping - Case history Estrogeni
Effetto shopping - Case history Estrogeni
Estrogeni
Draquila - Case history Estrogeni
Draquila - Case history EstrogeniDraquila - Case history Estrogeni
Draquila - Case history Estrogeni
Estrogeni

Rumors e sentiment della rete

  • 1. 1 RUMORS E SENTIMENT DELLA RETE: GEOLOCALIZZARE LOPINIONE PUBBLICA SUI SOCIAL MEDIA1 Le mappe dellodio in rete Qualche settimana fa molti organi di informazione (LEspresso, il Corriere della Sera, televisioni e agenzie di stampa) hanno diffuso i risultati della ricerca Le mappe dellintolleranza, un progetto promosso da Vox Diritti sullhate speech attraverso i social media. Nei giorni immediatamente successivi, la redazione italiana di Wired, noto magazine di tecnologia, riprende la notizia sollevando alcuni dubbi sui risultati della ricerca. Le obiezioni - espresse da Alberto Longo e supportate da esperti del settore chiamano in causa i limiti metodologici dellopinion mining, soprattutto rispetto a quella che 竪 la cifra distintiva della ricerca, ossia la geolocalizzazione dei tweet sottoposti ad analisi. La ricerca di Vox, realizzata in collaborazione con le Universit di Milano, Roma e Bari, aveva lobiettivo di creare una mappa geografica dei discorsi dodio nei confronti di immigrati, omosessuali, disabili, donne ed ebrei attraverso la raccolta dei tweet discriminatori. Il problema del flaming, il linguaggio eccessivo, violento e aggressivo degli utenti,竪 uno degli aspetti pi湛 controversi delluso dei social: lanonimato e la distanza fisica dalla vittima dellaggressione spesso liberano le ultime inibizioni delle persone2 . Non 竪 quindi raro leggere sulle bacheche dei principali social network, ma anche nello spazio commenti degli articoli dei giornali online, scambi di battute razzisti, omofobi, antisemiti; ancor pi湛 di recente, come ciclicamente accade, sono stati i Rom a essere stati il bersaglio di numerose micro-aggressioni online, brevi scambi comunicativi contenenti messaggi 1 Il paper 竪 il risultato della collaborazione tra Alfredo Borrelli (Estrogeni), Davide Magini (Estrogeni), Olivier La Rocca (Europartners), Gianfranco Zucca (Europartners). Per informazioni: a.borrelli@estrogeni.net o.larocca@europartnersnetwork.eu 2. Un flame 竪 un messaggio deliberatamente ostile e provocatorio inviato da un utente alla comunit o a un altro individuo specifico, lo scambio di insulti che spesso ne consegue, paragonabile a una rissa virtuale; cfr. P. WALLACE, The psychology of the Internet, Cambridge (UK), Cambridge University Press, 1999
  • 2. 2 volti a denigrare alcuni individui a causa del loro gruppo appartenenza3 . Per i provider di servizi come Facebook e Twitter la discriminazione digitale e, pi湛 in generale, il flaming 竪 un grosso problema, al punto che di recente il CEO della societ ha dichiarato che Twitter sta lavorando a degli strumenti per contrastare questo genere di comportamenti, la dichiarazione di Dick Costolo 竪 molto onesta: we suck at dealing with abuse and trolls on the platform. Sotto laspetto sostantivo, liniziativa di Vox diritti va quindi a colmare un vuoto di conoscenza significativo Meno convincente, almeno stando alle critiche ricevute, 竪 lapproccio metodologico. Le critiche si appuntano sul fatto che la geografia dellintolleranza 竪 basata su un numero di tweet molto basso. Le discussioni che hanno seguito la pubblicazione di questa ricerca danno lopportunit di fare una riflessione sulle potenzialit di geolocalizzare lanalisi dellopinione pubblica. In questo articolo cercheremo di offrire alcune indicazioni a riguardo. Lelemento che contraddistingue il contributo 竪 dato dal fatto che non ci limiteremo a fare riflessioni di metodo, ma proporremo un confronto basato su una rilevazione realizzata ad hoc per verificare le differenze tra il metodo Vox e un metodo basato su un approccio alla localizzazione geografica che assicura basi dati pi湛 ampie e robuste. Occorre precisare che lanalisi proposta ha lobiettivo di avviare una discussione e non certo di giudicare la qualit di altre ricerche. Cosa funziona e cosa non funziona nelle hate map Le hate map sono una rappresentazione geografica dei messaggi a carattere discriminatorio rinvenuti sui social, realizzate attraverso le coordinate geografiche degli utenti (latittudine e longitudine). Su Twitter ad esempio 竪 possibile abilitare la funzione di geolocalizzazione dei tweet, permettendo cos狸 agli utenti di dare e avere informazioni sulla localit dalla quale proviene il messaggio 4 . Questa opzione apre delle grandi possibilit alla sentiment analysis, lo studio dellumore della rete attraverso lanalisi di grandi quantit di messaggi. La ricerca di Vox sulla geografia italiana dellintolleranza sfrutta questa possibilit, replicando la metodologia di unindagine realizzata nel 2013 sugli Stati Uniti5 . Sotto il profilo metodologico, lanalisi di Vox 竪 basata sulla raccolta oltre 2 milioni di tweet nel periodo gennaio-agosto 2014. Il retrieving dei dati 竪 stato realizzato usando parole chiave collegate al sentimento di intolleranza nei confronti di stranieri, omosessuali, disabili, donne ed ebrei: ad esempio, per esaminare il razzismo sono stati raccolti i tweet contenenti parole come negro, zingaro e terrone. Il passaggio successivo 竪 stato lindividuazione dei messaggi contenenti le coordinate geografiche dellutente al momento della pubblicazione: nel complesso, i tweet geolocalizzati sono circa 43.000 (il 2,3% del totale). Sulla base delle coordinate geografiche sono state realizzate delle mappe termografiche che indicano le zone dellItalia dove i tweet discriminatori sono pi湛 frequenti. La metodologia dellindagine sollecita alcune domande. Prima domanda. Di quale popolazione sono rappresentative la mappe? La risposta 竪 banale. Le mappe dellodio rappresentano una parte della popolazione che usa un linguaggio discriminatorio su Twitter, quel segmento che decide di geolocalizzare i propri messaggi. In senso stretto, il campione analizzato 竪 autoeletto, ossia contiene solo coloro che usano tag geografici quando twittano. Quindi le mappe sono inutili? No, tuttaltro. Le 3. Cfr. D.W. SUE, Micro-aggressions in Everyday Life. Race, Gender, and Sexual Orientation, John Wiley & Sons, Hoboken [N.J.] 2010. 4. In linguaggio tecnico questo tipo di dati viene definito Voluntereed Geographical Information (VGI). 5. Il progetto 竪 denominato Geography of Hate. Geotagged Hateful Tweets in the United States 竪 realizzato della Humboldt University di Arcata in California
  • 3. 3 hate map rappresentano una fonte di conoscenza preziosissima, soprattutto se collegate ad altre informazioni geografiche e socio-economiche. Di norma, nellanalisi dellopinione pubblica, si usano variabili territoriali dal potere esplicativo molto limitato: dire che nel Nord-Est le persone la pensano in un certo modo, significa poco anche perch辿 in questarea geografica rietrano sia Belluno che Riccione, due comuni tra loro molto differenti. Seconda domanda. Il 2,3% di messaggi geolocalizzati 竪 tanto o 竪 poco? In assoluto 竪 tanto, perch辿 ad oggi, almeno in Italia, la geolocalizzazione nelluso dei social non 竪 cos狸 diffusa, anzi gli user sembrano ancora avere una certa diffidenza. Daltronde 竪 pur vero che se si vogliono usare tecniche statistiche avanzate, la numerosit dei casi 竪 importante, soprattutto quando si ha lesigenza di risultati con un dettaglio territoriale molto fine. Non a caso, nel commento delle mappe i ricercatori di Vox si guardano bene dal citare comuni o province specifiche, ma si limitano a discutere le differenze tra macro-ripartizioni o tuttal pi湛 regioni. Un confronto tra due approcci di geotagging Pur con i suoi limiti, la ricerca realizzata da Vox ha lindubbio pregio di introdurre almeno nel panorama italiano un approccio nuovo. Combinare gli strumenti di opinion mining con lattenzione alla dimensione territoriale dei fenomeni, 竪 un approccio molto promettente che merita di essere approfondito e applicato in numerosi contesti di analisi. Con questo obiettivo, presentiamo i risultati di una rilevazione sperimentale che, partendo dagli stessi presupposti delle mappe dellintolleranza, introduce unimportante differenza. La sperimentazione 竪 collegata allo sviluppo di uno strumento che integra statistica territoriale e sentiment analysis, denominato DEEP (Drawing Elements for Effective Politics)6 . Cos狸 come fatto dai ricercatori di Vox, abbiamo raccolto tutti i tweet contenenti le parole: negro, zingaro, muso giallo, mangiabanane. Il periodo di riferimento della rilevazione 竪, invece, molto inferiore: le prime tre settimane di febbraio 2015. Nel complesso, la base dati a disposizione 竪 di 11.655 tweet. Per comparare i risultati ottenuti tramite DEEP con quelli delle mappe dellintolleranza, 竪 necessario esplicitare il processo di geotagging usato. Sotto questo profilo la differenza 竪 sostanziale: al posto di usare le coordinate geografiche scelta che comporta un netto restringimento della base dati disponibile DEEP lavora sulla user location (UL), un campo previsto dal modulo di registrazione su Twitter, allinterno del quale lutente pu嘆 specificare la localit nella quale risiede. I vantaggi di usare la UL sono almeno due, uno di ordine tecnico, laltro teorico. Gli utenti che rendono disponibile la propria UL sono molto pi湛 numerosi degli utenti che geolocalizzano i tweet: nella rilevazione pilota realizzata a febbraio 2015, il 61,4% dei tweet raccolti conteneva unindicazione della UL, una percentuale non confrontabile con il 2,3% di tweet geolocalizzati analizzati da Vox. Usare la UL offre anche un vantaggio di tipo teorico. Decidere di inserire una localit allinterno del proprio profilo twitter significa rivendicare unappartenenza territoriale: sono romano, sono napoletano, sono milanese. Si tratta di uninformazione allapparenza banale, ma che nellanalisi di molti fenomeni di opinione pu嘆 risultare importante. Inoltre, a differenza delle coordinate geografiche, lUL 竪 stabile: se un tweet 竪 taggato con 6. DEEP 竪 un prodotto realizzato da Europartners ed Estrogeni con la collaborazione di Aster. Su richiesta 竪 disponibile un paper di presentazione dello strumento, contenente anche unapplicazione alla regione Marche. Per informazioni contattare: Olivier La Rocca (o.larocca@europartnersnetwork.eu) o Alfredo Borrelli (a.borrelli@estrogeni.net).
  • 4. 4 coordinate geografiche ricadenti nel centro citt di Milano, non 竪 possibile sapere se la persona vive effettivamente in cittoppure se 竪 un pendolare o un turista. La scelta di usare la UL comporta per嘆 un lavoro supplementare per la preparazione della base dati. La tabella 1 illustra numericamente i tre passaggi di cleaning necessari alla creazione di una database di messaggi geolocalizzati sulla base dellUL. Tabella 1 Processo didentificazione dei tweet geolocalizzati STEP 1 STEP 2 STEP 3 Presenza della User Location (UL) N % Pertinenza del tweet N % Usabilit della UL N % Tweet con UL 7157 61.4 Tweet con UL pertinenti 3839 53.6 Tweet pertinenti con UL utilizzabile 1547 46.6 Tweet senza UL 4498 38.6 Tweet con UL non pertinenti 3318 46.4 Tweet pertinenti con UL inutilizzabile 1771 53.4 Tweet totali 11655 100.0 Totale tweet con UL 7157 100.0 Totale tweet con UL pertinenti 3318 100.0 Fonte: elaborazioni Europartners/Estrogeni su dati propri (febbraio 2015) Le operazioni di pulizia dei dati comportano una perdita dinformazione che tuttavia non arriva ai livelli che si ottengono usando le coordinate geografiche. Come detto, il primo step (eliminazione dei tweet senza UL) comporta una perditadinformazione del 38,6%. Nel secondo step, si analizza la pertinenza del contenuto del tweet, eliminando i messaggi che pur contenendo una o pi湛 keywords non rientrano tra quelli dinteresse per lanalisi: nel caso specifico si 竪 trattato soprattutto di messaggi che rimandavano a materiale pornografico e che, spesso, contenevano la parola negro. Nel secondo step, 竪 stato eliminato il 46,4% dei messaggi risultanti dalla prima operazione di cleaning dei dati. C竪 da precisare che, sebbene nella metodologia della ricerca Vox questo passaggio non sia esplicitato, 竪 probabile che sia stato realizzato. Infine, nel terzo step si 竪 provveduto a identificare i messaggi pertinenti contenenti una UL utilizzabile ai fini della geolocalizzazione. Questa passaggio 竪 necessario per eliminare i tweet di quegli utenti che non valorizzano il campo UL usando unindicazione geografica. Siccome nel form di registrazione usato da Twitter il campo UL 竪 libero, alcuni utenti inseriscono indicazioni fittizie, ironiche o semplicemente lacunose. Si precisa che il livello di geottaging usato da DEEP 竪 molto fine perch辿 si considerano solo i tweet riconducibili a uno degli oltre ottomila comuni italiani. Questo passaggio ha comportato la perdita del 53,4% dei tweet pertinenti con indicazione di UL. Nel complesso, luso della user location in luogo delle coordinate geografiche ha garantito una percentuale del 13,3% di tweet utili allanalisi (la ricerca Vox dichiara una percentuale di messaggi utile del 2,3%): in pratica da una base di partenza di oltre 11mila messaggi, si 竪 ottenuto un corpus di 1547 messaggi geolocalizzati a livello comunale.
  • 5. 5 A scopo illustrativo si riporta la distribuzione regionale dei tweet (grafico 1), corredata dalla classifica dei primi dieci comuni per numero di tweet (tabella 2). Grafico 1 N Tweet geolocalizzati Fonte: elaborazioni Europartners/Estrogeni su dati propri (febbraio 2015) Trattandosi di una rilevazione pilota, la numerosit di alcune regioni 竪 decisamente esigua. Tuttavia, emergono alcune informazioni interessanti come ad esempio il fatto che i tweet provengono da 275 diversi comuni italiani e che in testa alla classifica per regioni oltre alla Lombardia e al Lazio (indicate anche da Vox), ci sia anche la Sicilia. Tabella 2 Primi dieci comuni per numero di tweet (N comuni = 275) Comune N. Tweet % 1 Roma 304 19.7 2 Milano 169 10.9 3 Palermo 107 6.9 4 Napoli 68 4.4 5 Torino 49 3.2 6 Genova 41 2.7 7 Bologna 38 2.5 8 Firenze 24 1.6 9 Padova 22 1.4 10 Verona 22 1.4 Totale primi 10 comuni 844 54.6 Altri comuni (265) 703 45.4 Totale 1547 100.0 Fonte: elaborazioni Europartners/Estrogeni su dati propri (febbraio 2015) 312 271 180 113 99 98 93 85 75 56 44 32 19 18 16 12 11 5 4 2 1 10 50 100 150 200 250 300 350 N. Tweet
  • 6. 6 Venti giorni di antiziganismo in rete Nel periodo compreso tra il 2 e il 22 febbraio abbiamo analizzato il sentiment di Twitter nei confronti dei rom. Allinterno della rilevazione pilota,realizzata per testare lefficienza di DEEP e confrontarne le prestazioni con i dati della ricerca Vox, era presente anche la keyword zingaro. La raccolta ha originato, 317 tweet geolocalizzati sulla base della UL. Si tratta del 20,5% del totale di messaggi utili. Bench辿 la rilevazione fosse un test dello strumento, pensiamo sia utile analizzare i dati di sentiment poich辿 mettono in luce elementi interessanti sul pregiudizio e lostilit che circola su Twitter7 . Il grafico 2 rappresenta il sentiment generale nei confronti dei rom: nelle tre settimane di riferimento il dato 竪 abbastanza inequivocabile poco meno del 60% dei tweet analizzati conteneva messaggio negativi, denigratori, aggressivi o apertamente razzisti nei confronti dei rom. Un terzo dei tweet, invece, presentava un contenuto neutro. Infine, solo il 4,1% dei messaggi aveva un contenuto positivo. Grafico 2 Il sentiment di twitter verso i rom Fonte: elaborazioni Europartners/Estrogeni su dati propri (febbraio 2015) Il secondo dato dinteresse si trova nel grafico 3, nel quale si presenta il sentiment per regione. Non si usa la localizzazione comunale, pur disponibile, poich辿 lesiguit numerica 7. DEEP analizza il sentiment con un approccio qualitativo, ossia la classificazione dei tweet non avviene attraverso procedure automatiche o semi-automatiche, ma attraverso lanalisi del contenuto tweet per tweet. 4,1 36,0 59,9 0,0 10,0 20,0 30,0 40,0 50,0 60,0 70,0 Positivo Neutro Negativo Twitter SENTIMENT nei confronti dei ROM (periodo: 2-22 febbraio - N=317)
  • 7. 7 dei dati raccolti durante il test non permette statistiche robuste. Le regioni sono ordinate sulla base del numero di tweet negativi. Grafico 3 Sentiment verso i rom per regione (N) Fonte: elaborazioni Europartners/Estrogeni su dati propri (febbraio 2015) Lazio e Lombardia, pur avendo circa lo stesso numero totale di messaggi, presentano una differente composizione interna. Dal Lazio provengono soprattutto tweet negativi, mentre in Lombardia messaggi negativi e neutri quasi si equivalgono: rimane fermo lo scenario di sostanziale negativit nei confronti dei rom. Purtroppo i dati della rilevazione pilota non permettono altri approfondimenti. C竪 comunque da ricordare che il periodo analizzato 竪 coinciso con un fatto di cronaca che ha avuto una larga eco: in Veneto, il benzinaio Graziano Stacchio ha ucciso Albano Cassol, vicentino di origini rom, mentre stava tentando una rapina in una gioielleria. Nei giorni successivi, i media hanno dato spazio e amplificato i sentimenti di antiziganismo suscitati dallepisodio. Twitter non ha fatto eccezione: leggendo i tweet raccolti per questa sperimentazione (molti riferiti allhashtag #iostoconstacchio) si ha lidea di quanta violenza e ostilit ci possano essere in 140 caratteri. Molti messaggi infatti riportano commenti sprezzanti e denigratori, basati su pregiudizi e stereotipi; in alcuni casi vengono formulate vere e proprie minacce. Non di rado, infine, la molla che fa scattare le aggressioni verbali via Twitter sono i talk show televisivi: i tweet contro i rom che contengono hashtag riferiti a trasmissioni come La gabbia (La7) o Quinta colonna (Rete4) sono numerosi. Twitter diventa cos狸 la cassa di risonanza di un discorso pubblico esacerbato e polarizzato: come in quei talk show dove non ci sono argomentazioni da discutere, ma solo fazioni da sostenere o avversare. 1 1 1 2 2 3 3 3 5 6 8 8 9 10 17 20 32 59 1 3 2 3 3 4 4 5 8 10 2 2 4 10 5 11 25 12 1 1 1 1 1 7 1 0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 Valle d'Aosta Calabria Molise Trentino Alto Adige Marche Umbria Abruzzo Puglia Sardegna Sicilia Emilia Romagna Friuli Venezia Giulia Liguria Campania Toscana Piemonte Veneto Lombardia Lazio Negativo Neutro Positivo
  • 8. 8 Analizzare lopinione pubblica sulla rete: alcune riflessioni Sulla scorta delle riflessioni proposte in precedenza si possono porre tre questioni sulle quali occorre lavorare per sfruttare appieno le potenzialit della geolocalizzazione nellanalisi dellopinione pubblica sui social. o Migliorare i sistemi di geotagging: al momento gli utenti che usano le coordinate geografiche non sono abbastanza numerosi, peraltro la localizzazione latitudine- longitudine pu嘆 essere fuorviante se si vuole considerare lappartenenza territoriale di una persona come una variabile socio-culturale della quale tenere conto nel corso dellanalisi. Nel caso di Twitter la soluzione basata sulluso della user location ci sembra, al momento, soddisfacente. o Associare ai dati di opinione, informazioni socio-economiche: geolocalizzare le opinioni delle persone permette di agganciare allanalisi una serie di informazioni accessorie che possono risultare molto utili in sede di interpretazione. Le statistiche territoriali sono sempre pi湛 ricche e dettagliate. Lobiezione che si pu嘆 fare allanalisi del sentiment 竪 che le opinioni espresse su internet galleggino in un vuoto socio-economico, si pu嘆 ovviare a questo problema collegando i dati di opinione con le statistiche territoriali, anche comunali. Ad esempio, in un recente test di DEEP - lo strumento di analisi sul quale 竪 basata lanalisi presentata in questo paper abbiamo collegato, lanalisi dei tweet, con statistiche comunali e dati elettorali. Questo 竪 solo un esempio di come la combinazione tra dati di diversa fonte e origine sia una prospettiva metodologica molto promettente. o Usare tecniche quali-quantitative: lanalisi quantitativa del sentiment 竪 ormai uno standard, tuttavia pensiamo che per alcuni fenomeni specifici non sia lapproccio migliore. Le metriche quantitative in alcuni casi non sono applicabili, in altri non colgono aspetti importanti dei fenomeni. La ricchezza informativa dei social media pu嘆 essere sfruttata anche usando tecniche di analisi qualitativa, basate sullinterpretazione dei messaggi e sulla capacit di creare collegamenti tra i comportamenti online e la vita offline delle persone.