�ݺ�ߣ

INTRODUZIONE AI BIG DATA
E ALLA SCIENZA DEI DATI
Ordine degli Ingegneri di Como, 30 gennaio 2016
Ing.Vincenzo Manzoni, PhD
me@vincenzomanzoni.com

“I got kicked out of the bookshop last week,
because I moved all of the Big Data books  
into the Religion section.”

Big Data
n. Computing data of a very large size, typically to the extent that its manipulation and
management present significant logistical challenges; (also) the branch of computing
involving such data.
Oxford English Dictionary, 2013

L’ORIGINE DEL TERMINE
Usato per la prima volta nel 2008 nel
Computing Community Consortium. Italia
Stati Uniti

LE 3V
Volume
Velocità
Varietà

VOLUME
Volume
Velocità
Varietà
Informazione prodotta in un giorno 
2.5 milioni di TB
(il 20% di tutta la conoscenza umana
nel 1999!)
532.000.000 DVD
Se impilati, 640 km!
In un anno, raggiungerebbero il 60%
della distanza Terra - Luna
Fonte: Harvard Business Review,“Big Data: the management revolution”, ottobre 2012.

VELOCITÀ
Volume
Velocità
Varietà
600.000 acquisti con carte di credito
In un minuto
204.000.000 e-mail inviate
48 ore di video suYouTube
100.000 tweet
2.200.000 azioni su facebook

VARIETÀ
Volume
Velocità
Varietà
Fonte: Mobile Millennium, UC Berkeley.

LE 3V
Volume
Velocità
Varietà
MB GB TB PB
periodico
a lottiquasi tem
po
reale
tem
po
reale
tabelladatabase
foto
/ video
social
sensori

LE NUOVEV
Veracità
Visualizzazione

Migliore informazione
Nuove analisi dati
Informazioni real-time
Inﬂusso sui dati dalle nuove tecnologie
Forme non tradizionali di media
Grandi quantità di dati
L’ultima moda
Social media
0% 5% 9% 14% 18%
7%
8%
10%
13%
13%
15%
16%
18%
IN COSA CONSISTONO?
SECONDO GLI EXECUTIVE INTERVISTATI DA IBM
Fonte: IBM,“Analytics:The real-world use of big data”, 2012.

LE FONTI
SECONDO GLI EXECUTIVE INTERVISTATI DA IBM
Transazioni
Log
Eventi
E-mail
Social network
Sensori
RFID e POS
Testo libero
Geograﬁci
Audio
Fotograﬁe / video
0% 23% 45% 68% 90%
24%
38%
40%
41%
41%
42%
43%
57%
59%
73%
88%
Fonte: IBM,“Analytics:The real-world use of big data”, 2012.

L’HYPE CYCLE DEI BIG DATA
GARTNER, 2011
Fonte: Gartner.

GARTNER, 2012
Fonte: Gartner.

GARTNER, 2013
Fonte: Gartner.

GARTNER, 2014
Fonte: Gartner.

GARTNER, 2015
Fonte: Gartner.
Dove sono ﬁniti?

POSSIAMO PARLARE ANCORA DI HYPE?

LE OPPORTUNITÀ
1.I big data applicati alla sanità
possono far risparmiare agli Stati
Uniti 300 B$ in efﬁcienza.
2.L’Europa può risparmiare 149 B$
in costi di amministrazione e
governo.
3.Solo negli Stati Uniti serviranno
nel breve periodo 1.5+ M di data
scientist e data manager.

NUOVE (?) PROFESSIONI
• I bit sono inutili senza qualcuno che li sappia interpretare!

I “DATA PRODUCT”
Cose che si conoscono
Cose che non si conoscono
Domande che ci si
fanno
Domande che non ci
si fanno
Business
intelligence
Data
Discovery
Analista dati
Data Scientist

LE OPPORTUNITÀ
Per le aziende

NUOVE TECNOLOGIE
Sorgente: Forbes.com

E-COMMERCE
Sistema di raccomandazione

SANITÀ
Healthcare
SENSEable City Lab, MIT. Health Infoscape, 2011.

SENSEable City Lab, MIT. Women’s health connections, 2011.
SANITÀ
Healthcare

[…] Renzi ha spiegato di non avere in programma un aumento del prelievo fiscale e di
volere anzi combattere l’evasione “anche attraverso innovazione digitale e incrocio
dei dati”
Il Corriere della Sera Online, 21 marzo 2014

MANUFACTURING:TENARIS
FASE 1:ACQUISIZIONE
Macchina 1
Macchina 2
…
Macchina n
Database
Elaborazione
dati sintesi
Segnali
Dati sintetici
Segnali
Segnali
Valor medio
Durata
Valor massimo

FASE 1:ACQUISIZIONE
Macchina 1
Macchina 2
…
Macchina n
Database
Elaborazione
dati sintesi
Web Services .net Microsoft SQL Server

Database
Visualizzazione di
dati aggregati
Sistemi automatici di
controllo basati sulla
anomalie dei dati aggregati
FASE 2: USO DEL DATO

FASE 2: USO DEL DATO
Aumento improvviso e non
giustiﬁcato di un parametro
di qualità del prodotto
Il processo è andato
fuori controllo
… e con il parametro di
qualità ritorno in controllo.
Viene fatto un intervento e il
processo ritorna in controllo…

LE OPPORTUNITÀ
Per i professionisti e i privati

DATA JOURNALISM
Data
Selezione
Visualizzazione
Storia
Valore crescente per il pubblico

DATA JOURNALISM
Fonte:TheGuardian.

DATA JOURNALISM
The Data Journalism Handbook può essere consultato a http://datajournalismhandbook.org.

IL ROI DEI BIG DATA
0.00��€
1.00��€
2.00��€
3.00��€
4.00��€
Ritorno per 1 € investito Ritorno atteso in 3-5 anni
3.50��€
0.55��€
Fonte:Wikibon,“Enterprise struggling to derive maximum value form Big Data”, 2013.

I CASI DI INSUCCESSO
1.Assenza di ﬁgure con la professionalità necessaria
2.Uso di tecnologie grezze e immature.
3.Mancanza di un business case speciﬁco!

I CASI DI SUCCESSO
1.Progetti non sponsorizzati da IT, ma da dipartimenti di line-
of-business come marketing o logistica.
2.Focus su un caso d’uso piccolo, ma strategico.
3.Iterare e crescere sulla base dei risultati precedenti.

L’ALGORITMO PER IL SUCCESSO
Contesto di business ben deﬁnito
Giuste domande
Risposte
Sorgenti dati di valore

LA FORMAZIONE... IN ITALIA
Adnkronos, Ict: al via a Milano il nuovo centro per l’innovazione, 17 giugno 2013.

INTRODUZIONE AI BIG DATA
E ALLA SCIENZA DEI DATI
Ordine degli Ingegneri di Como, 30 gennaio 2016
Ing.Vincenzo Manzoni, PhD
me@vincenzomanzoni.com
�ݺ�ߣ disponibili qui: http://www.vincenzomanzoni.com/corsi/

�ݺ�ߣ

Introduzione ai Big Data e alla scienza dei dati

Recommended

More Related Content

What's hot (20)

Viewers also liked (20)

Similar to Introduzione ai Big Data e alla scienza dei dati (20)

More from Vincenzo Manzoni (7)

Introduzione ai Big Data e alla scienza dei dati