際際滷

際際滷Share a Scribd company logo
BIG DATA
2014
Marketing
& Social Media

Autore: Valerio Torriero
Big Data & Social Media
BIG DATA 竪 la sempre pi湛 grande e complessa crescita dei dati che sta sfidando
i tradizionali sistemi di database
video di YouTube
messaggi di Facebook
tweet di Twitter
transazioni con carta di credito
RFID (Radio Frequency Identification)
etc.
Google elabora ogni giorno petabyte di dati:
testi, blog, video, foto, nomi, indirizzi, 
Trilioni di informazioni vengono
raccolte, registrate e analizzate
quotidianamente in maniera
sempre pi湛 veloce
Big Data affronta uno dei problemi pi湛 critici nel business di oggi:
come ottenere valore dalle crescenti risme di dati complessi
Valore dei Dati

Community Data

Organizational Data

Personal Data

World Data
Volume, Variet, Velocit
IDC (International Data Corporation) stima che luniverso digitale arriver
a livello gobale entro il 2020 fino a 35 zettabytes (35 trillioni di terabytes)

La variet di dati 竪 in aumento. Viene tutto sempre conservato e quasi
l85% dei nuovi dati sono dati non strutturati

La velocit dei dati sta accelerando il ritmo del business. L'acquisizione
dei dati 竪 diventata istantanea grazie a nuovi punti di interazione tra
cliente e tecnologie. Lanalisi in tempo reale 竪 pi湛 importante che mai
Un foto vale pi湛 di mille numeri
I software rendono la manipolazione di grandi quantitativi di dati relativamente
facile e poco costosa
Utenti che cercano insights nei big data hanno nuovi strumenti che consentono di
capire, esplorare, condividere e applicare i dati in modo efficiente e collaborativo,
spesso senza professionisti di analisi
Gli strumenti visivi possono quindi rappresentare concetti come fossero storie
Losservazione di tendenze e modelli 竪 pi湛 veloce
Migliore memorizzazione: per alcune persone la
visualizzazione rende pi湛 facile capire e ricordare i dati
I live feeds consentono agli utenti di sistemare
i dati e generare visualizzazioni personalizzate
da esplorare insieme in tempo reale
Big Data 2014: Marketing & Social Media
Visualizzare Trends e Patterns
Bubble Chart

BoxPlot

Bar e Line
Chart

Area e Line
Chart

3D Bar Chart

Histogram

Gnatt Chart

Line Chart

Radar Chart

Waterfall Chart
Numeri Vs Immagini
Le Analytics visuali non sempre migliorano ogni decisione in quanto alcune
immagini non aggiungono chiarezza ai dati
A volte una storia complessa risulta troppo semplice, altre volte fatti semplici
sembrano troppo complessi
I computer non si preoccupano dellanalisi visiva, se le decisioni sono
automatizzate senza la supervisione umana o il suo intervento,
conviene non perdere tempo con lo sviluppo di immagini
Pi湛 Dati Vs Meno Cretivit: per raggiungere il massimo potenziale l'analisi ha
bisogno di sostegno (Advocacy) e super-visione (Oversight).
Dati Vs Istinto
Le decisioni chiave per le migliorare le vendite derivano da un mix di dati
disponibili e di intuizioni maturate attraverso esperienze precedenti
I dati possono essere fuorvianti quando sono incompleti o presi fuori contesto
Lesperienza nella gestione dei dati continua a svolgere un ruolo significativo
quando i dati sono incompleti o imprecisi
Molti senior sales executive si affidano maggiormente alla situazione attuale
e ai dati storici rispetto a quelli previsionali
Il miglior risultato 竪 una combinazione di informazioni tempestive, previsioni
perspicaci e dati di supporto

(TheEconomist)
Gestire virtualmente qualsiasi dato
Dati strutturati
Transactional Data, Machine Generated Data, RDBM

Dati non strutturati
Social, Video, Text, Customer Service, Imagery, Scientific data

Dati streaming
Web Searches, Network Traffic, Sensor Data, NoSQL
Data Flow nel Business
Supply Chain
Risorse
Umane

Sviluppo del Prodotto

IT

Servizio
Clienti

Vendite

Finanza e
Controllo
Marketing
Data Flow nei Social Media

Emergere

Convertire

Analizzare
Misurare i Social Media
Analisi Social e Web
Cosa dicono sulle marche, prodotti o servizi
Analisi Avanzate
Come si possono predire meglio i risultati futuri

Interest

Interaction

Advocacy

Feeds di dati in tempo reale
Ottimizzare la flotta in base a previsioni
e modelli di traffico
insights della visita
-Gestire, arricchire, e di ottenere - Durata da tutti i dati.
Numero utenti
- Frequenza delle visite

- Pagine visitate

- Interazione tra utenti
- Creare un sistema scoring
Big Data Value Chain
Analisi
Predittive

Valore

Analisi
Prescrittive
Analisi
Diagnostiche
Analisi
Descrittive

Difficolt
Analisi Predittive
Osservare

Agire
Obiettivi desiderati

Capire

Configurazione
DB

Log
Collection

Extract
Transform
Loading

Integrazione
Dati

Business
Intelligence

Analisi
Predittive

Decision
Making

Esecuzione
Soluzione open
Il progetto Apache Hadoop 竪 formato da tre componenti:
-

HDFS (Hadoop Distributed File System), per lo storage
MapReduce, l'infrastruttura di elaborazione distribuita che si occupa del lavoro
di analisi sui dati
Common, un gruppo di infrastrutture condivise necessario sia per HDFS sia per
MapReduce

Hadoop 竪 sviluppato da una comunit globale di programmatori, 竪 100% open
source. Nessuna societ ne ha la propriet, viene sponsorizzato dalla Apache
Software Foundation ed 竪 finalizzato alla memorizzazione e l'elaborazione dei dati
in nuovi modi rispetto al RDBMS
MICROSOFT & BIG DATA
Power Pivot di Microsoft Excel e Power View di SharePoint per una visione nei dati strutturati
Hive Add-in per Excel e Hive ODBC Driver permettono laccesso ai dati non strutturati Hadoop
APPS

Big Data Landscape 2014

(Dave Feinleib)
INFRASTRUTTURA

(bigdatalandscape)
Big Data Players
- Splunk, Loggly, Sumo Logic
- Predictive Policing, BloomReach, Atigeo, Myrrix
- Media Science, Bluefin Labs, CollectiveI, Recorded Future, LuckySort, DataXu,
RocketFuel, Turn
- Gnip, Datasift, Space Curve, Factual, Windows Azure Marketplace, LexisNexis,
Loqate, Kaggle, Knoema, Inrix
- Oracle Hyperion, SAP BusinessObjects, Microsoft Business Intelligence, IBM
Cognos, SAS, MicroStrategy, GoodData, Autonomy, QlikView, Chart.io, Domo,
Bime, RJMetrics
- Tableau Software, Palantir, MetaMarkets, Teradata Aster, Visual.ly, KarmaSphere,
EMC Greenplum, Platfora, ClearStory Data, Dataspora, Centrifuge, Cirro, Ayata,
Alteryx, Datameer, Panopticon, SAS, Tibco, Opera, Metalayer, Pentaho
- HortonWorks, Cloudera, MapR, Vertica, MapR, ParAccel, InfoBright, Kognitio,
Calpont, Exasol, Datastax, Informatica
- Couchbase, Teradata, 10gen, Hadapt, Terracotta, MarkLogic, VoltDB,
- Amazon Web Services Elastic MapReduce, Infochimps, Microsoft Windows Azure,
Google BigQuery, Klout
- Oracle, Microsoft SQL Server, MySQL, PostgreSQL, memsql, Sybase, IBM DB2
- Hadoop, MapReduce, Hbase, Cassandra, Mahout
Storia & Futuro
Informazioni
Utenti
Valori
Tecnologie
Leaders
Dati

(practicalanalytic)
CONVERGENZA

SOCIAL
MEDIA

CODE
Python

BIG
DATA
D o

i

n g
B i g
D a t a

S o c

i

a

l

M e d

i

a
Per maggiori info visita il sito www.socialmediaexperience.it
Contatti:

Valerio Torriero
Twitter: @nicephore
Twitter: @SMEXPERIENCE
Email: info@socialmediaexperience.it

Cover Art: Sunflower Seeds by Ai Weiwei
References:
Oracle.com/social
Deloitte Analytics Trends 2014
Microsoft Big Data Booklet
Mike Olson: youtu.be/S9xnYBVqLws
TheEconomist Data Vs Instinct
bigdatalandscape.com
logianalytics.com/vision
slideshare.net/kevincody/3d-engagement-formula
practicalanalytics.wordpress.com/predictive-analytics-101

More Related Content

Big Data 2014: Marketing & Social Media

  • 1. BIG DATA 2014 Marketing & Social Media Autore: Valerio Torriero
  • 2. Big Data & Social Media BIG DATA 竪 la sempre pi湛 grande e complessa crescita dei dati che sta sfidando i tradizionali sistemi di database video di YouTube messaggi di Facebook tweet di Twitter transazioni con carta di credito RFID (Radio Frequency Identification) etc. Google elabora ogni giorno petabyte di dati: testi, blog, video, foto, nomi, indirizzi, Trilioni di informazioni vengono raccolte, registrate e analizzate quotidianamente in maniera sempre pi湛 veloce Big Data affronta uno dei problemi pi湛 critici nel business di oggi: come ottenere valore dalle crescenti risme di dati complessi
  • 3. Valore dei Dati Community Data Organizational Data Personal Data World Data
  • 4. Volume, Variet, Velocit IDC (International Data Corporation) stima che luniverso digitale arriver a livello gobale entro il 2020 fino a 35 zettabytes (35 trillioni di terabytes) La variet di dati 竪 in aumento. Viene tutto sempre conservato e quasi l85% dei nuovi dati sono dati non strutturati La velocit dei dati sta accelerando il ritmo del business. L'acquisizione dei dati 竪 diventata istantanea grazie a nuovi punti di interazione tra cliente e tecnologie. Lanalisi in tempo reale 竪 pi湛 importante che mai
  • 5. Un foto vale pi湛 di mille numeri I software rendono la manipolazione di grandi quantitativi di dati relativamente facile e poco costosa Utenti che cercano insights nei big data hanno nuovi strumenti che consentono di capire, esplorare, condividere e applicare i dati in modo efficiente e collaborativo, spesso senza professionisti di analisi Gli strumenti visivi possono quindi rappresentare concetti come fossero storie Losservazione di tendenze e modelli 竪 pi湛 veloce Migliore memorizzazione: per alcune persone la visualizzazione rende pi湛 facile capire e ricordare i dati I live feeds consentono agli utenti di sistemare i dati e generare visualizzazioni personalizzate da esplorare insieme in tempo reale
  • 7. Visualizzare Trends e Patterns Bubble Chart BoxPlot Bar e Line Chart Area e Line Chart 3D Bar Chart Histogram Gnatt Chart Line Chart Radar Chart Waterfall Chart
  • 8. Numeri Vs Immagini Le Analytics visuali non sempre migliorano ogni decisione in quanto alcune immagini non aggiungono chiarezza ai dati A volte una storia complessa risulta troppo semplice, altre volte fatti semplici sembrano troppo complessi I computer non si preoccupano dellanalisi visiva, se le decisioni sono automatizzate senza la supervisione umana o il suo intervento, conviene non perdere tempo con lo sviluppo di immagini Pi湛 Dati Vs Meno Cretivit: per raggiungere il massimo potenziale l'analisi ha bisogno di sostegno (Advocacy) e super-visione (Oversight).
  • 9. Dati Vs Istinto Le decisioni chiave per le migliorare le vendite derivano da un mix di dati disponibili e di intuizioni maturate attraverso esperienze precedenti I dati possono essere fuorvianti quando sono incompleti o presi fuori contesto Lesperienza nella gestione dei dati continua a svolgere un ruolo significativo quando i dati sono incompleti o imprecisi Molti senior sales executive si affidano maggiormente alla situazione attuale e ai dati storici rispetto a quelli previsionali Il miglior risultato 竪 una combinazione di informazioni tempestive, previsioni perspicaci e dati di supporto (TheEconomist)
  • 10. Gestire virtualmente qualsiasi dato Dati strutturati Transactional Data, Machine Generated Data, RDBM Dati non strutturati Social, Video, Text, Customer Service, Imagery, Scientific data Dati streaming Web Searches, Network Traffic, Sensor Data, NoSQL
  • 11. Data Flow nel Business Supply Chain Risorse Umane Sviluppo del Prodotto IT Servizio Clienti Vendite Finanza e Controllo Marketing
  • 12. Data Flow nei Social Media Emergere Convertire Analizzare
  • 13. Misurare i Social Media Analisi Social e Web Cosa dicono sulle marche, prodotti o servizi Analisi Avanzate Come si possono predire meglio i risultati futuri Interest Interaction Advocacy Feeds di dati in tempo reale Ottimizzare la flotta in base a previsioni e modelli di traffico insights della visita -Gestire, arricchire, e di ottenere - Durata da tutti i dati. Numero utenti - Frequenza delle visite - Pagine visitate - Interazione tra utenti - Creare un sistema scoring
  • 14. Big Data Value Chain Analisi Predittive Valore Analisi Prescrittive Analisi Diagnostiche Analisi Descrittive Difficolt
  • 16. Soluzione open Il progetto Apache Hadoop 竪 formato da tre componenti: - HDFS (Hadoop Distributed File System), per lo storage MapReduce, l'infrastruttura di elaborazione distribuita che si occupa del lavoro di analisi sui dati Common, un gruppo di infrastrutture condivise necessario sia per HDFS sia per MapReduce Hadoop 竪 sviluppato da una comunit globale di programmatori, 竪 100% open source. Nessuna societ ne ha la propriet, viene sponsorizzato dalla Apache Software Foundation ed 竪 finalizzato alla memorizzazione e l'elaborazione dei dati in nuovi modi rispetto al RDBMS
  • 17. MICROSOFT & BIG DATA Power Pivot di Microsoft Excel e Power View di SharePoint per una visione nei dati strutturati Hive Add-in per Excel e Hive ODBC Driver permettono laccesso ai dati non strutturati Hadoop
  • 18. APPS Big Data Landscape 2014 (Dave Feinleib)
  • 20. Big Data Players - Splunk, Loggly, Sumo Logic - Predictive Policing, BloomReach, Atigeo, Myrrix - Media Science, Bluefin Labs, CollectiveI, Recorded Future, LuckySort, DataXu, RocketFuel, Turn - Gnip, Datasift, Space Curve, Factual, Windows Azure Marketplace, LexisNexis, Loqate, Kaggle, Knoema, Inrix - Oracle Hyperion, SAP BusinessObjects, Microsoft Business Intelligence, IBM Cognos, SAS, MicroStrategy, GoodData, Autonomy, QlikView, Chart.io, Domo, Bime, RJMetrics - Tableau Software, Palantir, MetaMarkets, Teradata Aster, Visual.ly, KarmaSphere, EMC Greenplum, Platfora, ClearStory Data, Dataspora, Centrifuge, Cirro, Ayata, Alteryx, Datameer, Panopticon, SAS, Tibco, Opera, Metalayer, Pentaho - HortonWorks, Cloudera, MapR, Vertica, MapR, ParAccel, InfoBright, Kognitio, Calpont, Exasol, Datastax, Informatica - Couchbase, Teradata, 10gen, Hadapt, Terracotta, MarkLogic, VoltDB, - Amazon Web Services Elastic MapReduce, Infochimps, Microsoft Windows Azure, Google BigQuery, Klout - Oracle, Microsoft SQL Server, MySQL, PostgreSQL, memsql, Sybase, IBM DB2 - Hadoop, MapReduce, Hbase, Cassandra, Mahout
  • 23. D o i n g B i g D a t a S o c i a l M e d i a
  • 24. Per maggiori info visita il sito www.socialmediaexperience.it Contatti: Valerio Torriero Twitter: @nicephore Twitter: @SMEXPERIENCE Email: info@socialmediaexperience.it Cover Art: Sunflower Seeds by Ai Weiwei References: Oracle.com/social Deloitte Analytics Trends 2014 Microsoft Big Data Booklet Mike Olson: youtu.be/S9xnYBVqLws TheEconomist Data Vs Instinct bigdatalandscape.com logianalytics.com/vision slideshare.net/kevincody/3d-engagement-formula practicalanalytics.wordpress.com/predictive-analytics-101