際際滷

際際滷Share a Scribd company logo
Presentazione  Database VERTICA
Introduzione a Vertica COSE VERTICA: E linnovativo database DBMS che garantisce elevate performance  sullanalisi di grandi volumi di dati (unit di Terabyte) PERCHE VERTICA: E veloce, 竪 semplice, e costa poco!
Per chi 竪 pensato La grande esperienza del nostro gruppo ci  ha portati ad individuare alcune aree critiche nei progetti dedicati ad aziende che hanno necessit di gestire  grandi volumi di dati  con  tempi di risposta  molto rapidi. Vertica nasce specificamente per soddisfare questo tipo di esigenze : Progetto a  basso impatto   sullazienda Possibilit di analisi fino alla  singola riga  di dettaglio Ottenere rapidi  tempi di risposta  gestendo grandi volumi di dati Gestione di base dati delle dimensioni di  TeraByte
Posizionamento sul mercato Kx KDB Sybase IQ Teradata  RAM DBMSs Postgres/EnterpriseDB MySQL Oracle IBM DB2 Sybase ASE Greenplum(Postgres) Datallegro (Ingres) Netezza (Postgres) Microsoft SQLServer TCO (Costo di Possesso) Adatto allo scopo APPLICAZIONI TRANSAZIONALI ALTO BASSO APPLICAZIONI ANALITICHE
Caratteristiche Value Value TECNOLOGIA  COLUMN-ORIENTED RISPOSTE 10-100 VOLTE MAGGIORI ELEVATA COMPRESSIONE DATI NECESSITA DI POCO SPAZIO INSTALLABILE SU  HARDWARE LINUX GIA ESISTENTE IN AZIENDA PIATTAFORMA HARDWARE  A BASSO IMPATTO ECONOMICO CARICAMENTO DATI CONTINUO REPORT SEMPRE AGGIORNATI INTERFACCIA SQL STANDARD RAPIDA INTEGRAZIONE E IMPLEMENTAZIONE DESIGN DEL DATABASE SEMPLICE ED EFFICIENTE BASSO COSTO DI MANUTENZIONE
Architettura Nuvola  竪 lottimizzazione dell interfaccia per  Vertica , il database 竪 comunque aperto allinterrogazione di altri strumenti di reportistica. Strumenti di Reporting Apps OLTP EDW Files Sistemi Sorgenti Extraction Transformation Loading ETL
Analisi comparativa TCO Comparazione Costo Totale di Possesso (TCO) VS principali Competitors espresso in % 100 0 60 40 20 80 TCO % Oracle NTS IBM Teradata
Alcune referenze di Vertica
1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 0000001 0000001 0000003 0000003 0000005 0000011 0000011 0000020 0000026 0000050 0000051 0000052 0000053 0000068 0000069 0000071 Data ID CLiente Trade  Run-length Encoding (Pochi Valori, ordinati) 100.99 75.66 36.93 146.88 283.39 93.40 23.21 344.44 21.30 23.92 50.22 38.22 21.92 74.26 152.49 89.23 Delta Encoding (Molti Valori, ordinati) Float Compression (Molti Valori, disordinati) PERCHE E VELOCE  Perch辿 usare Vertica
1/17/2007, 16 Data ID CLiente Trade  Run-length Encoding (Pochi Valori, ordinati) Delta Encoding (Molti Valori, ordinati) Float Compression (Molti Valori, disordinati) PERCHE E VELOCE ? 0000001 0 2 2 4 10 10 19 25 49 50 51 52 67 68 70 100.99 75.66 36.93 146.88 283.39 93.40 23.21 344.44 21.30 23.92 50.22 38.22 21.92 74.26 152.49 89.23 perch竪  sfrutta algoritmi di compressione molto performanti perch辿  ogni dato viene letto  una sola volta per ogni occorrenza perch辿  i dati organizzati secondo colonne mantengono lo stesso formato Perch辿 usare Vertica
Test: Dimensioni DB: 600GB 14 interrogazioni 1 tabella, 200 colonne Risultati di Vertica: Tempo di caricamento  3 volte pi湛 veloce Interrogazioni  214 volte pi湛 veloci Immagazzina 1.5 anni  nello stesso spazio in cui un normale sistema immagazzinerebbe 90 giorni di dati di vendita. LHardware costa meno della met Sommario Benchmark Telecom Datawarehouse proprietario Caricamento 2.4 ore 8 ore Dimensione DB 56 GB 948 GB Tempi di risposta 8.7 secondi 30 minuti e 57.0 secondi Costi Hardware $20,000 $48,000 $$  ??
Analisi su Record di dettaglio telefonate Customer Benchmark Mobile Communications co 21TB di dettaglio telefonate Cluster di 5 nodi ognuno con: 2x4-core CPUs 8GB RAM 7x146 GB HDDs Risultati tempo medio query: 3m 41s tempo di caricamento: 58 ore DIMENSIONE DB: 21TB
Comparazione Vertica vs OLTP Comparazione: 1.5TB Record Dettaglio Telefonate Vertica : 3- node cluster vs. OLTP DBMS on 24-vie server + SAN Queries 60 volte pi湛 veloci Compressione migliorata di 4 volte 25 volte pi湛 veloce in fase di caricamento 470.000贈 in meno di Hardware
Contatti Per ulteriori informazioni rivolgersi a:  Ing. Enrico Gasparoni  E-mail:  [email_address] Mobile: 348-8863011

More Related Content

Similar to Presentazione Nuvola Vertica Light (20)

Presentazione Nuvola Vertica Full New
Presentazione Nuvola Vertica Full NewPresentazione Nuvola Vertica Full New
Presentazione Nuvola Vertica Full New
Alberto.F
Virtualizzare Nanosoft
Virtualizzare   NanosoftVirtualizzare   Nanosoft
Virtualizzare Nanosoft
Dario Vemagi
Design Patterns - Enterprise Patterns (part 2)
Design Patterns - Enterprise Patterns (part 2)Design Patterns - Enterprise Patterns (part 2)
Design Patterns - Enterprise Patterns (part 2)
Fabio Armani
Quanto mi costa SQL Pool Serverless Synapse
Quanto mi costa SQL Pool Serverless SynapseQuanto mi costa SQL Pool Serverless Synapse
Quanto mi costa SQL Pool Serverless Synapse
Marco Pozzan
IBM FlashSystem 820 e 720
IBM FlashSystem 820 e 720IBM FlashSystem 820 e 720
IBM FlashSystem 820 e 720
PRAGMA PROGETTI
"Sistemi managed in alta affidabilit e in open source" by Andrea Di Marco
"Sistemi managed in alta affidabilit e in open source" by Andrea Di Marco"Sistemi managed in alta affidabilit e in open source" by Andrea Di Marco
"Sistemi managed in alta affidabilit e in open source" by Andrea Di Marco
ThinkOpen
Partner Day Milano - dicembre 2015 - Software Difined Storage. Disaster recov...
Partner Day Milano - dicembre 2015 - Software Difined Storage. Disaster recov...Partner Day Milano - dicembre 2015 - Software Difined Storage. Disaster recov...
Partner Day Milano - dicembre 2015 - Software Difined Storage. Disaster recov...
Clouditalia Telecomunicazioni
IBM FlashSystem 810 e 710
IBM FlashSystem 810 e 710IBM FlashSystem 810 e 710
IBM FlashSystem 810 e 710
PRAGMA PROGETTI
Sogesi PowerEdge VRTX
Sogesi PowerEdge VRTXSogesi PowerEdge VRTX
Sogesi PowerEdge VRTX
Sogesi
Lezioni 2009
Lezioni 2009Lezioni 2009
Lezioni 2009
Giuseppe Levi
Trovare ci嘆 che serve nella confusione: comprendere i Big Data con l'analisi AWS
Trovare ci嘆 che serve nella confusione: comprendere i Big Data con l'analisi AWSTrovare ci嘆 che serve nella confusione: comprendere i Big Data con l'analisi AWS
Trovare ci嘆 che serve nella confusione: comprendere i Big Data con l'analisi AWS
Amazon Web Services
Dalla Unified Communication & Collaboration alla Virtualizzazione: le opportu...
Dalla Unified Communication & Collaboration alla Virtualizzazione: le opportu...Dalla Unified Communication & Collaboration alla Virtualizzazione: le opportu...
Dalla Unified Communication & Collaboration alla Virtualizzazione: le opportu...
festival ICT 2016
Azure PaaS databases
Azure PaaS databasesAzure PaaS databases
Azure PaaS databases
Gianluca Hotz
CCI 2019 - Exchange 2019 da 0 ad HA in 1 ora
CCI 2019 - Exchange 2019 da 0 ad HA in 1 oraCCI 2019 - Exchange 2019 da 0 ad HA in 1 ora
CCI 2019 - Exchange 2019 da 0 ad HA in 1 ora
walk2talk srl
Metadata Driven Pipeline with Microsoft Fabric
Metadata Driven Pipeline  with Microsoft FabricMetadata Driven Pipeline  with Microsoft Fabric
Metadata Driven Pipeline with Microsoft Fabric
Marco Pozzan
Design Patterns - enterprise patterns (part I)
Design Patterns - enterprise patterns (part I)Design Patterns - enterprise patterns (part I)
Design Patterns - enterprise patterns (part I)
Fabio Armani
Big data stack tecnologico
Big data stack tecnologicoBig data stack tecnologico
Big data stack tecnologico
Massimo Romano
Modernizzare i data Center con le soluzioni Fibre Channel Gen 6 di Brocade
Modernizzare i data Center con le soluzioni Fibre Channel Gen 6 di BrocadeModernizzare i data Center con le soluzioni Fibre Channel Gen 6 di Brocade
Modernizzare i data Center con le soluzioni Fibre Channel Gen 6 di Brocade
Antonio Palumbo
Open Source Day 2015 - DBaaS con Docker: un caso di studio
Open Source Day 2015 - DBaaS con Docker: un caso di studioOpen Source Day 2015 - DBaaS con Docker: un caso di studio
Open Source Day 2015 - DBaaS con Docker: un caso di studio
Par-Tec S.p.A.
Webinar Emerasoft presenta yellowfin
Webinar Emerasoft presenta yellowfinWebinar Emerasoft presenta yellowfin
Webinar Emerasoft presenta yellowfin
Emerasoft, solutions to collaborate
Presentazione Nuvola Vertica Full New
Presentazione Nuvola Vertica Full NewPresentazione Nuvola Vertica Full New
Presentazione Nuvola Vertica Full New
Alberto.F
Virtualizzare Nanosoft
Virtualizzare   NanosoftVirtualizzare   Nanosoft
Virtualizzare Nanosoft
Dario Vemagi
Design Patterns - Enterprise Patterns (part 2)
Design Patterns - Enterprise Patterns (part 2)Design Patterns - Enterprise Patterns (part 2)
Design Patterns - Enterprise Patterns (part 2)
Fabio Armani
Quanto mi costa SQL Pool Serverless Synapse
Quanto mi costa SQL Pool Serverless SynapseQuanto mi costa SQL Pool Serverless Synapse
Quanto mi costa SQL Pool Serverless Synapse
Marco Pozzan
IBM FlashSystem 820 e 720
IBM FlashSystem 820 e 720IBM FlashSystem 820 e 720
IBM FlashSystem 820 e 720
PRAGMA PROGETTI
"Sistemi managed in alta affidabilit e in open source" by Andrea Di Marco
"Sistemi managed in alta affidabilit e in open source" by Andrea Di Marco"Sistemi managed in alta affidabilit e in open source" by Andrea Di Marco
"Sistemi managed in alta affidabilit e in open source" by Andrea Di Marco
ThinkOpen
Partner Day Milano - dicembre 2015 - Software Difined Storage. Disaster recov...
Partner Day Milano - dicembre 2015 - Software Difined Storage. Disaster recov...Partner Day Milano - dicembre 2015 - Software Difined Storage. Disaster recov...
Partner Day Milano - dicembre 2015 - Software Difined Storage. Disaster recov...
Clouditalia Telecomunicazioni
IBM FlashSystem 810 e 710
IBM FlashSystem 810 e 710IBM FlashSystem 810 e 710
IBM FlashSystem 810 e 710
PRAGMA PROGETTI
Sogesi PowerEdge VRTX
Sogesi PowerEdge VRTXSogesi PowerEdge VRTX
Sogesi PowerEdge VRTX
Sogesi
Trovare ci嘆 che serve nella confusione: comprendere i Big Data con l'analisi AWS
Trovare ci嘆 che serve nella confusione: comprendere i Big Data con l'analisi AWSTrovare ci嘆 che serve nella confusione: comprendere i Big Data con l'analisi AWS
Trovare ci嘆 che serve nella confusione: comprendere i Big Data con l'analisi AWS
Amazon Web Services
Dalla Unified Communication & Collaboration alla Virtualizzazione: le opportu...
Dalla Unified Communication & Collaboration alla Virtualizzazione: le opportu...Dalla Unified Communication & Collaboration alla Virtualizzazione: le opportu...
Dalla Unified Communication & Collaboration alla Virtualizzazione: le opportu...
festival ICT 2016
Azure PaaS databases
Azure PaaS databasesAzure PaaS databases
Azure PaaS databases
Gianluca Hotz
CCI 2019 - Exchange 2019 da 0 ad HA in 1 ora
CCI 2019 - Exchange 2019 da 0 ad HA in 1 oraCCI 2019 - Exchange 2019 da 0 ad HA in 1 ora
CCI 2019 - Exchange 2019 da 0 ad HA in 1 ora
walk2talk srl
Metadata Driven Pipeline with Microsoft Fabric
Metadata Driven Pipeline  with Microsoft FabricMetadata Driven Pipeline  with Microsoft Fabric
Metadata Driven Pipeline with Microsoft Fabric
Marco Pozzan
Design Patterns - enterprise patterns (part I)
Design Patterns - enterprise patterns (part I)Design Patterns - enterprise patterns (part I)
Design Patterns - enterprise patterns (part I)
Fabio Armani
Big data stack tecnologico
Big data stack tecnologicoBig data stack tecnologico
Big data stack tecnologico
Massimo Romano
Modernizzare i data Center con le soluzioni Fibre Channel Gen 6 di Brocade
Modernizzare i data Center con le soluzioni Fibre Channel Gen 6 di BrocadeModernizzare i data Center con le soluzioni Fibre Channel Gen 6 di Brocade
Modernizzare i data Center con le soluzioni Fibre Channel Gen 6 di Brocade
Antonio Palumbo
Open Source Day 2015 - DBaaS con Docker: un caso di studio
Open Source Day 2015 - DBaaS con Docker: un caso di studioOpen Source Day 2015 - DBaaS con Docker: un caso di studio
Open Source Day 2015 - DBaaS con Docker: un caso di studio
Par-Tec S.p.A.

More from Alberto.F (8)

Cruscotto Auto Dealer
Cruscotto Auto DealerCruscotto Auto Dealer
Cruscotto Auto Dealer
Alberto.F
Front End Nuvola New
Front End Nuvola NewFront End Nuvola New
Front End Nuvola New
Alberto.F
Front End Nuvola
Front End NuvolaFront End Nuvola
Front End Nuvola
Alberto.F
Report Master Final
Report Master FinalReport Master Final
Report Master Final
Alberto.F
Report Master New
Report Master NewReport Master New
Report Master New
Alberto.F
Report Master New
Report Master NewReport Master New
Report Master New
Alberto.F
Cruscotto Auto Dealer
Cruscotto Auto DealerCruscotto Auto Dealer
Cruscotto Auto Dealer
Alberto.F
Front End Nuvola New
Front End Nuvola NewFront End Nuvola New
Front End Nuvola New
Alberto.F
Front End Nuvola
Front End NuvolaFront End Nuvola
Front End Nuvola
Alberto.F
Report Master Final
Report Master FinalReport Master Final
Report Master Final
Alberto.F
Report Master New
Report Master NewReport Master New
Report Master New
Alberto.F
Report Master New
Report Master NewReport Master New
Report Master New
Alberto.F

Presentazione Nuvola Vertica Light

  • 2. Introduzione a Vertica COSE VERTICA: E linnovativo database DBMS che garantisce elevate performance sullanalisi di grandi volumi di dati (unit di Terabyte) PERCHE VERTICA: E veloce, 竪 semplice, e costa poco!
  • 3. Per chi 竪 pensato La grande esperienza del nostro gruppo ci ha portati ad individuare alcune aree critiche nei progetti dedicati ad aziende che hanno necessit di gestire grandi volumi di dati con tempi di risposta molto rapidi. Vertica nasce specificamente per soddisfare questo tipo di esigenze : Progetto a basso impatto sullazienda Possibilit di analisi fino alla singola riga di dettaglio Ottenere rapidi tempi di risposta gestendo grandi volumi di dati Gestione di base dati delle dimensioni di TeraByte
  • 4. Posizionamento sul mercato Kx KDB Sybase IQ Teradata RAM DBMSs Postgres/EnterpriseDB MySQL Oracle IBM DB2 Sybase ASE Greenplum(Postgres) Datallegro (Ingres) Netezza (Postgres) Microsoft SQLServer TCO (Costo di Possesso) Adatto allo scopo APPLICAZIONI TRANSAZIONALI ALTO BASSO APPLICAZIONI ANALITICHE
  • 5. Caratteristiche Value Value TECNOLOGIA COLUMN-ORIENTED RISPOSTE 10-100 VOLTE MAGGIORI ELEVATA COMPRESSIONE DATI NECESSITA DI POCO SPAZIO INSTALLABILE SU HARDWARE LINUX GIA ESISTENTE IN AZIENDA PIATTAFORMA HARDWARE A BASSO IMPATTO ECONOMICO CARICAMENTO DATI CONTINUO REPORT SEMPRE AGGIORNATI INTERFACCIA SQL STANDARD RAPIDA INTEGRAZIONE E IMPLEMENTAZIONE DESIGN DEL DATABASE SEMPLICE ED EFFICIENTE BASSO COSTO DI MANUTENZIONE
  • 6. Architettura Nuvola 竪 lottimizzazione dell interfaccia per Vertica , il database 竪 comunque aperto allinterrogazione di altri strumenti di reportistica. Strumenti di Reporting Apps OLTP EDW Files Sistemi Sorgenti Extraction Transformation Loading ETL
  • 7. Analisi comparativa TCO Comparazione Costo Totale di Possesso (TCO) VS principali Competitors espresso in % 100 0 60 40 20 80 TCO % Oracle NTS IBM Teradata
  • 9. 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 0000001 0000001 0000003 0000003 0000005 0000011 0000011 0000020 0000026 0000050 0000051 0000052 0000053 0000068 0000069 0000071 Data ID CLiente Trade Run-length Encoding (Pochi Valori, ordinati) 100.99 75.66 36.93 146.88 283.39 93.40 23.21 344.44 21.30 23.92 50.22 38.22 21.92 74.26 152.49 89.23 Delta Encoding (Molti Valori, ordinati) Float Compression (Molti Valori, disordinati) PERCHE E VELOCE Perch辿 usare Vertica
  • 10. 1/17/2007, 16 Data ID CLiente Trade Run-length Encoding (Pochi Valori, ordinati) Delta Encoding (Molti Valori, ordinati) Float Compression (Molti Valori, disordinati) PERCHE E VELOCE ? 0000001 0 2 2 4 10 10 19 25 49 50 51 52 67 68 70 100.99 75.66 36.93 146.88 283.39 93.40 23.21 344.44 21.30 23.92 50.22 38.22 21.92 74.26 152.49 89.23 perch竪 sfrutta algoritmi di compressione molto performanti perch辿 ogni dato viene letto una sola volta per ogni occorrenza perch辿 i dati organizzati secondo colonne mantengono lo stesso formato Perch辿 usare Vertica
  • 11. Test: Dimensioni DB: 600GB 14 interrogazioni 1 tabella, 200 colonne Risultati di Vertica: Tempo di caricamento 3 volte pi湛 veloce Interrogazioni 214 volte pi湛 veloci Immagazzina 1.5 anni nello stesso spazio in cui un normale sistema immagazzinerebbe 90 giorni di dati di vendita. LHardware costa meno della met Sommario Benchmark Telecom Datawarehouse proprietario Caricamento 2.4 ore 8 ore Dimensione DB 56 GB 948 GB Tempi di risposta 8.7 secondi 30 minuti e 57.0 secondi Costi Hardware $20,000 $48,000 $$ ??
  • 12. Analisi su Record di dettaglio telefonate Customer Benchmark Mobile Communications co 21TB di dettaglio telefonate Cluster di 5 nodi ognuno con: 2x4-core CPUs 8GB RAM 7x146 GB HDDs Risultati tempo medio query: 3m 41s tempo di caricamento: 58 ore DIMENSIONE DB: 21TB
  • 13. Comparazione Vertica vs OLTP Comparazione: 1.5TB Record Dettaglio Telefonate Vertica : 3- node cluster vs. OLTP DBMS on 24-vie server + SAN Queries 60 volte pi湛 veloci Compressione migliorata di 4 volte 25 volte pi湛 veloce in fase di caricamento 470.000贈 in meno di Hardware
  • 14. Contatti Per ulteriori informazioni rivolgersi a: Ing. Enrico Gasparoni E-mail: [email_address] Mobile: 348-8863011