際際滷

際際滷Share a Scribd company logo
Presentazione  Database VERTICA
Introduzione a Vertica COSE VERTICA: E linnovativo database DBMS che garantisce elevate performance  sullanalisi di grandi volumi di dati (unit di Terabyte) PERCHE VERTICA: E veloce, 竪 semplice, e costa poco!
Per chi 竪 pensato La grande esperienza del nostro gruppo ci  ha portati ad individuare alcune aree critiche nei progetti dedicati ad aziende che hanno necessit di gestire  grandi volumi di dati  con  tempi di risposta  molto rapidi. Vertica nasce specificamente per soddisfare questo tipo di esigenze : Progetto a  basso impatto   sullazienda Possibilit di analisi fino alla  singola riga  di dettaglio Ottenere rapidi  tempi di risposta  gestendo grandi volumi di dati Gestione di base dati delle dimensioni di  TeraByte
Posizionamento sul mercato Kx KDB Sybase IQ Teradata  RAM DBMSs Postgres/EnterpriseDB MySQL Oracle IBM DB2 Sybase ASE Greenplum(Postgres) Datallegro (Ingres) Netezza (Postgres) Microsoft SQLServer TCO (Costo di Possesso) Adatto allo scopo APPLICAZIONI TRANSAZIONALI ALTO BASSO APPLICAZIONI ANALITICHE
Caratteristiche Value Value TECNOLOGIA  COLUMN-ORIENTED RISPOSTE 10-100 VOLTE MAGGIORI ELEVATA COMPRESSIONE DATI NECESSITA DI POCO SPAZIO INSTALLABILE SU  HARDWARE LINUX GIA ESISTENTE IN AZIENDA PIATTAFORMA HARDWARE  A BASSO IMPATTO ECONOMICO CARICAMENTO DATI CONTINUO REPORT SEMPRE AGGIORNATI INTERFACCIA SQL STANDARD RAPIDA INTEGRAZIONE E IMPLEMENTAZIONE DESIGN DEL DATABASE SEMPLICE ED EFFICIENTE BASSO COSTO DI MANUTENZIONE
Architettura Nuvola  竪 lottimizzazione dell interfaccia per  Vertica , il database 竪 comunque aperto allinterrogazione di altri strumenti di reportistica. Strumenti di Reporting Apps OLTP EDW Files Sistemi Sorgenti Extraction Transformation Loading ETL
Analisi comparativa TCO Comparazione Costo Totale di Possesso (TCO) VS principali Competitors espresso in % 100 0 60 40 20 80 TCO % Oracle NTS IBM Teradata
Alcune referenze di Vertica
VERTICA PERFORMANCES
1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 0000001 0000001 0000003 0000003 0000005 0000011 0000011 0000020 0000026 0000050 0000051 0000052 0000053 0000068 0000069 0000071 Data ID CLiente Trade  Run-length Encoding (Pochi Valori, ordinati) 100.99 75.66 36.93 146.88 283.39 93.40 23.21 344.44 21.30 23.92 50.22 38.22 21.92 74.26 152.49 89.23 Delta Encoding (Molti Valori, ordinati) Float Compression (Molti Valori, disordinati) PERCHE E VELOCE  Perch辿 usare Vertica
1/17/2007, 16 Data ID CLiente Trade  Run-length Encoding (Pochi Valori, ordinati) Delta Encoding (Molti Valori, ordinati) Float Compression (Molti Valori, disordinati) PERCHE E VELOCE ? 0000001 0 2 2 4 10 10 19 25 49 50 51 52 67 68 70 100.99 75.66 36.93 146.88 283.39 93.40 23.21 344.44 21.30 23.92 50.22 38.22 21.92 74.26 152.49 89.23 perch竪  sfrutta algoritmi di compressione molto performanti perch辿  ogni dato viene letto  una sola volta per ogni occorrenza perch辿  i dati organizzati secondo colonne mantengono lo stesso formato Perch辿 usare Vertica
Test: Dimensioni DB: 600GB 14 interrogazioni 1 tabella, 200 colonne Risultati di Vertica: Tempo di caricamento  3 volte pi湛 veloce Interrogazioni  214 volte pi湛 veloci Immagazzina 1.5 anni  nello stesso spazio in cui un normale sistema immagazzinerebbe 90 giorni di dati di vendita. LHardware costa meno della met Sommario Benchmark Telecom Datawarehouse proprietario Caricamento 2.4 ore 8 ore Dimensione DB 56 GB 948 GB Tempi di risposta 8.7 secondi 30 minuti e 57.0 secondi Costi Hardware $20,000 $48,000 $$  ??
Analisi su Record di dettaglio telefonate Customer Benchmark Mobile Communications co 21TB di dettaglio telefonate Cluster di 5 nodi ognuno con: 2x4-core CPUs 8GB RAM 7x146 GB HDDs Risultati tempo medio query: 3m 41s tempo di caricamento: 58 ore DIMENSIONE DB: 21TB
Comparazione Vertica vs OLTP Comparazione: 1.5TB Record Dettaglio Telefonate Vertica : 3- node cluster vs. OLTP DBMS on 24-vie server + SAN Queries 60 volte pi湛 veloci Compressione migliorata di 4 volte 25 volte pi湛 veloce in fase di caricamento 470.000贈 in meno di Hardware
VERTICA:  OVERVIEW DI PRODOTTO
Architettura Column-Oriented Elevata compressione dei dati Ottimizzato per lanalisi Sistema ibrido di lettura/scrittura dati Design semplice ed efficace Caratteristiche
Caratteristiche Tecniche Ideale per intensi carichi di lavoro in lettura di dati Riduce la I/O Bandwidth dei dischi E.g.:  SELECT avg(price) FROM tickstore  WHERE symbol = GM and date = 1/17/2008 GM   NYASE  NYAASE  NYSE  NYASE  NGGYSE  NYGGGSE  NYSE  NYSE  NYSE  30.77   NYSE  NYSE  NYSE  1/17/08 GM   NYASE  NYAASE  NYSE  NYASE  NGGYSE  NYGGGSE  NYSE  NYSE  NYSE  30.79   NYSE  NYSE  NYSE  1/17/08 AAPL   NYASE  NYAASE  NYSE  NYASE  NGGYSE  NYGGGSE  NYSE  NYSE  NYSE  93.24   NYSE  NYSE  NYSE  1/17/08 GM   NYASE  NYAASE  NYSE  NYASE  NGGYSE  NYGGGSE  NYSE  NYSE  NYSE  30.77   NYSE  NYSE  NYSE   1/17/08 Lettura per Righe Legge tutte le colonne 1/17/08 1/17/08 1/17/08 1/17/08 Lettura per Colonne Legge 3 colonne GM GM GM AAPL 30.77 30.77 30.79 93.24 NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS  NYSE  NYSE  NYSE  NQDS
Caratteristiche Tecniche Relazione R: LOGICA FISICA  . . . A B C D E Immagazzina dati come Proiezioni Viste specifiche Includono colonne ridondanti ordinate differentemente = colonne  ordinate (A B C | A) A B C (B A C | B A) B A C (B D E | B) B D E
Caratteristiche Tecniche (A B C | A) = colonne ordinate (B A C | B A) Le proiezioni vengono suddivise in segmenti Il numero di segmenti dipende dal numero di nodi; viene creato un segmento per ogni nodo A 3 B 3 C 3 A 1 B 1 C 1 A 2 B 2 C 2 A B C B 3 A 3 C 3 B 2 A 2 C 2 B 1 A 1 C 1 B A C
Caratteristiche Tecniche I segmenti vengono mappati in nodi per mantenere un livello ottimale di K-Safety  I segmenti ottimizzano ogni nodo per differenti carichi di lavoro in lettura Ottimizzazione delle performances attraverso la ridondanza E possibile mantenere pi湛 copie perch竪 i dati sono compressi A 3 B 3 C 3 A 2 B 2 C 2 A 1 B 1 C 1 B 1 A 1 C 1 B 2 A 2 C 2 B 3 A 3 C 3
Caratteristiche Tecniche Le colonne sono duplicate, in questo modo se una macchina smette di funzionare si ha sempre una copia disponibile Immagazzina sufficienti proiezioni per la K-Safety Ricostruisce gli oggetti perduti prelevandoli da altri nodi A 2 B 2 C 2 B 2 A 2 C 2 B 1 A 1 C 1 A 3 B 3 C 3 A 3 B 3 C 3 B 1 A 1 C 1 A 1 B 1 C 1 B 3 A 3 C 3
Caratteristiche Tecniche Trickle Load:   Query executor legge da WOS come anche da ROS Architettura ibrida di storage (A B C | A) Trasferimento dati Asincrono TUPLE   MOVER Read-optimized Column Store (ROS) Disco: il dato 竪 ordinato e compresso Memoria: proiezioni riflesse in ordine di inserimento (non compresse) Write-optimized Column Store (WOS) A B C
Basta aggiungere server Blade per scalare le performance Fault-tolerance mantenuta automaticamente Flessibilit <= 5 TB <= 15TB 40 TB 6. Scale Out on Industry-Standard Hardware
Come viene disegnato lo schema fisico? Semplice  DBDesigner viene strutturato sul numero di nodi presenti nella configurazione Database Design > DBA FORNISCE Schema Logico Crea la tabella  Training set di: Query tipiche Dati di esempio Livello K-Safety Load constraints > DBDesigner GENERA Uno schema fisico che: Esegue query molto veloci E compatibile con i requisiti del trickle load Si assicura che tutte le query SQL vengano soddisfatte A B A (A B C | A) (B A C | B A) B C C
Accesso a Vertica JDBC/ODBC caricamento e analisi dalle soluzioni pi湛 conosciute Vertica include drivers e guide integrate Supporto a scripting e CLI vsql cli, Perl, Python, PHP, C/++ API Caricamento continuo 2mb/s per flussi per nodi trickle load 10mb/s per flussi per nodi bulk load Front-end nativo per analisi dati: NUVOLA
Amministrare Vertica Facile da implementare Fully scriptable rpm install Progettato per una rappresentazione a griglie Manutenzione Semplice DBDesigner Integrato Non necessita di indicizzazioni, partizioni o strutture ausiliarie Utilizza il 13% di spazio su disco rispetto ad un normale RDBMS Sistema di monitoraggio integrato Tabelle virtuali e file di log controllabili AquaData Studio, Toad, Visualizzatore di DB
SOMMARIO
Vertica Vertica E: Vertica NON E Un DBMS completamente relazionale Un motore di database transazionale Un motore di database che supporta lo standard SQL su Terabyte di dati Un file system proprietario o motore OLAP con dimensioni limitate Progettato per leggere dati dalla maggior parte degli strumenti presenti sul mercato Progettato per imputare o modificare molto frequentemente records come le soluzioni (OLTP) Orientato a colonne con elevata compressione dei dati Orientato a righe  Rispetta gli standard ODBC/JDBC per essere integrato con strumenti di Business Intelligence Un database con stored procedures proprietarie scritte in linguaggio proprietario La ridondanza 竪 ottenuta attraverso logiche software Dipendente dalla configurazione RAID
Vertica Database : Una soluzione Completa Performance Eccezionali Motore di database analitico  10-100x+ traditional DBMS Sistema di calcolo a griglia Facile Amministrazione DB Designer  iterative learning Enterprise ready Piattaforma Cost-Effective Elevata Scalabilit Richiede meno spazio Utilizzo sapiente delle risorse disponibili
Contatti Per ulteriori informazioni rivolgersi a:  Ing. Enrico Gasparoni  E-mail:  [email_address] Mobile: 348-8863011

More Related Content

Viewers also liked (18)

Mendokumentasikan Budaya di Sulbar
Mendokumentasikan Budaya di SulbarMendokumentasikan Budaya di Sulbar
Mendokumentasikan Budaya di Sulbar
Muhammad Ridwan Alimuddin
Travelin
TravelinTravelin
Travelin
hheyrman
Texas S Ta R Chart
Texas S Ta R ChartTexas S Ta R Chart
Texas S Ta R Chart
jkearley
Jabalpur 2010
Jabalpur 2010Jabalpur 2010
Jabalpur 2010
Ashish Samdariya
Forex markets
Forex marketsForex markets
Forex markets
StudsPlanet.com
4 road to mef 2012 - ver rontoknya kapitalisme
4 road to mef 2012 - ver rontoknya kapitalisme4 road to mef 2012 - ver rontoknya kapitalisme
4 road to mef 2012 - ver rontoknya kapitalisme
Tiga Rezki Utama
Seruling kebijaksanaan
Seruling kebijaksanaanSeruling kebijaksanaan
Seruling kebijaksanaan
Dr. Maman SW
Having A Bad Day
Having A Bad DayHaving A Bad Day
Having A Bad Day
Tony DeLiso
M62 elegance
M62 eleganceM62 elegance
M62 elegance
Irviana Rozi
La hormigafeliz mauLa hormigafeliz mau
La hormigafeliz mau
Junior Almenar
Modul biologi-smp-sesuai-skl-2013
Modul biologi-smp-sesuai-skl-2013Modul biologi-smp-sesuai-skl-2013
Modul biologi-smp-sesuai-skl-2013
Irviana Rozi
Aktiviti-Kematian
Aktiviti-KematianAktiviti-Kematian
Aktiviti-Kematian
IzahAziz
Keistimewaan al quran
Keistimewaan al quranKeistimewaan al quran
Keistimewaan al quran
惶悋 悖悖悽惷惘
Video search engine optimization most effective way to drive serp rank
Video search engine optimization   most effective way to drive serp rankVideo search engine optimization   most effective way to drive serp rank
Video search engine optimization most effective way to drive serp rank
Ralph Paglia
Buletin jumat al furqon tahun 06 volume 06 nomor 02 orang tua rosululloh musl...
Buletin jumat al furqon tahun 06 volume 06 nomor 02 orang tua rosululloh musl...Buletin jumat al furqon tahun 06 volume 06 nomor 02 orang tua rosululloh musl...
Buletin jumat al furqon tahun 06 volume 06 nomor 02 orang tua rosululloh musl...
muslimdocuments
Buku panduan-MUI-mengenal-mewaspadai-penyimpangan-syi-ah-di-indonesia
Buku panduan-MUI-mengenal-mewaspadai-penyimpangan-syi-ah-di-indonesiaBuku panduan-MUI-mengenal-mewaspadai-penyimpangan-syi-ah-di-indonesia
Buku panduan-MUI-mengenal-mewaspadai-penyimpangan-syi-ah-di-indonesia
Edi Awaludin
Embrace your complexity (and no one else's)
Embrace your complexity (and no one else's)Embrace your complexity (and no one else's)
Embrace your complexity (and no one else's)
MisterNadav
Travelin
TravelinTravelin
Travelin
hheyrman
Texas S Ta R Chart
Texas S Ta R ChartTexas S Ta R Chart
Texas S Ta R Chart
jkearley
4 road to mef 2012 - ver rontoknya kapitalisme
4 road to mef 2012 - ver rontoknya kapitalisme4 road to mef 2012 - ver rontoknya kapitalisme
4 road to mef 2012 - ver rontoknya kapitalisme
Tiga Rezki Utama
Seruling kebijaksanaan
Seruling kebijaksanaanSeruling kebijaksanaan
Seruling kebijaksanaan
Dr. Maman SW
Having A Bad Day
Having A Bad DayHaving A Bad Day
Having A Bad Day
Tony DeLiso
La hormigafeliz mauLa hormigafeliz mau
La hormigafeliz mau
Junior Almenar
Modul biologi-smp-sesuai-skl-2013
Modul biologi-smp-sesuai-skl-2013Modul biologi-smp-sesuai-skl-2013
Modul biologi-smp-sesuai-skl-2013
Irviana Rozi
Aktiviti-Kematian
Aktiviti-KematianAktiviti-Kematian
Aktiviti-Kematian
IzahAziz
Video search engine optimization most effective way to drive serp rank
Video search engine optimization   most effective way to drive serp rankVideo search engine optimization   most effective way to drive serp rank
Video search engine optimization most effective way to drive serp rank
Ralph Paglia
Buletin jumat al furqon tahun 06 volume 06 nomor 02 orang tua rosululloh musl...
Buletin jumat al furqon tahun 06 volume 06 nomor 02 orang tua rosululloh musl...Buletin jumat al furqon tahun 06 volume 06 nomor 02 orang tua rosululloh musl...
Buletin jumat al furqon tahun 06 volume 06 nomor 02 orang tua rosululloh musl...
muslimdocuments
Buku panduan-MUI-mengenal-mewaspadai-penyimpangan-syi-ah-di-indonesia
Buku panduan-MUI-mengenal-mewaspadai-penyimpangan-syi-ah-di-indonesiaBuku panduan-MUI-mengenal-mewaspadai-penyimpangan-syi-ah-di-indonesia
Buku panduan-MUI-mengenal-mewaspadai-penyimpangan-syi-ah-di-indonesia
Edi Awaludin
Embrace your complexity (and no one else's)
Embrace your complexity (and no one else's)Embrace your complexity (and no one else's)
Embrace your complexity (and no one else's)
MisterNadav

Similar to Presentazione Nuvola Vertica Full New1 (20)

Presentazione Nuvola Vertica Light
Presentazione Nuvola Vertica LightPresentazione Nuvola Vertica Light
Presentazione Nuvola Vertica Light
Alberto.F
Partner Day Milano - dicembre 2015 - Software Difined Storage. Disaster recov...
Partner Day Milano - dicembre 2015 - Software Difined Storage. Disaster recov...Partner Day Milano - dicembre 2015 - Software Difined Storage. Disaster recov...
Partner Day Milano - dicembre 2015 - Software Difined Storage. Disaster recov...
Clouditalia Telecomunicazioni
Virtualizzare Nanosoft
Virtualizzare   NanosoftVirtualizzare   Nanosoft
Virtualizzare Nanosoft
Dario Vemagi
Lezioni 2009
Lezioni 2009Lezioni 2009
Lezioni 2009
Giuseppe Levi
Cesvip 20110127
Cesvip 20110127Cesvip 20110127
Cesvip 20110127
Alessandro Grandi
Smau Padova - Enrico Tasquier
Smau Padova -  Enrico TasquierSmau Padova -  Enrico Tasquier
Smau Padova - Enrico Tasquier
SMAU
"Sistemi managed in alta affidabilit e in open source" by Andrea Di Marco
"Sistemi managed in alta affidabilit e in open source" by Andrea Di Marco"Sistemi managed in alta affidabilit e in open source" by Andrea Di Marco
"Sistemi managed in alta affidabilit e in open source" by Andrea Di Marco
ThinkOpen
Cassandra DB - Linux Day 2019 - Catania - Italy
Cassandra DB - Linux Day 2019 - Catania - ItalyCassandra DB - Linux Day 2019 - Catania - Italy
Cassandra DB - Linux Day 2019 - Catania - Italy
Fabrizio Spataro
2014.11.14 Implementare e mantenere un progetto Azure SQL Database
2014.11.14 Implementare e mantenere un progetto Azure SQL Database2014.11.14 Implementare e mantenere un progetto Azure SQL Database
2014.11.14 Implementare e mantenere un progetto Azure SQL Database
Emanuele Zanchettin
Real Time Monitoring and Analitycs : Customer Experience in Production
Real Time Monitoring and Analitycs : Customer Experience in ProductionReal Time Monitoring and Analitycs : Customer Experience in Production
Real Time Monitoring and Analitycs : Customer Experience in Production
Codemotion
MongoDB Atlas: il modo migliore per eseguire MongoDB in ambiente cloud 2
MongoDB Atlas: il modo migliore per eseguire MongoDB in ambiente cloud 2MongoDB Atlas: il modo migliore per eseguire MongoDB in ambiente cloud 2
MongoDB Atlas: il modo migliore per eseguire MongoDB in ambiente cloud 2
MongoDB
CCI 2019 - Exchange 2019 da 0 ad HA in 1 ora
CCI 2019 - Exchange 2019 da 0 ad HA in 1 oraCCI 2019 - Exchange 2019 da 0 ad HA in 1 ora
CCI 2019 - Exchange 2019 da 0 ad HA in 1 ora
walk2talk srl
IBM FlashSystem 810 e 710
IBM FlashSystem 810 e 710IBM FlashSystem 810 e 710
IBM FlashSystem 810 e 710
PRAGMA PROGETTI
Dalla Unified Communication & Collaboration alla Virtualizzazione: le opportu...
Dalla Unified Communication & Collaboration alla Virtualizzazione: le opportu...Dalla Unified Communication & Collaboration alla Virtualizzazione: le opportu...
Dalla Unified Communication & Collaboration alla Virtualizzazione: le opportu...
festival ICT 2016
2014.11.14 Implementare e mantenere un progetto Azure SQL Database
2014.11.14 Implementare e mantenere un progetto Azure SQL Database2014.11.14 Implementare e mantenere un progetto Azure SQL Database
2014.11.14 Implementare e mantenere un progetto Azure SQL Database
Emanuele Zanchettin
Introduzione al framework dl4j Antonio berti
Introduzione al framework dl4j Antonio bertiIntroduzione al framework dl4j Antonio berti
Introduzione al framework dl4j Antonio berti
Deep Learning Italia
Safe check up - cos'竪? - 22feb2012
Safe check up - cos'竪? - 22feb2012 Safe check up - cos'竪? - 22feb2012
Safe check up - cos'竪? - 22feb2012
M.Ela International Srl
Polyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDB
Polyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDBPolyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDB
Polyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDB
Steve Maraspin
Le novita di MongoDB 3.6
Le novita di MongoDB 3.6Le novita di MongoDB 3.6
Le novita di MongoDB 3.6
MongoDB
IBM FlashSystem 820 e 720
IBM FlashSystem 820 e 720IBM FlashSystem 820 e 720
IBM FlashSystem 820 e 720
PRAGMA PROGETTI
Presentazione Nuvola Vertica Light
Presentazione Nuvola Vertica LightPresentazione Nuvola Vertica Light
Presentazione Nuvola Vertica Light
Alberto.F
Partner Day Milano - dicembre 2015 - Software Difined Storage. Disaster recov...
Partner Day Milano - dicembre 2015 - Software Difined Storage. Disaster recov...Partner Day Milano - dicembre 2015 - Software Difined Storage. Disaster recov...
Partner Day Milano - dicembre 2015 - Software Difined Storage. Disaster recov...
Clouditalia Telecomunicazioni
Virtualizzare Nanosoft
Virtualizzare   NanosoftVirtualizzare   Nanosoft
Virtualizzare Nanosoft
Dario Vemagi
Smau Padova - Enrico Tasquier
Smau Padova -  Enrico TasquierSmau Padova -  Enrico Tasquier
Smau Padova - Enrico Tasquier
SMAU
"Sistemi managed in alta affidabilit e in open source" by Andrea Di Marco
"Sistemi managed in alta affidabilit e in open source" by Andrea Di Marco"Sistemi managed in alta affidabilit e in open source" by Andrea Di Marco
"Sistemi managed in alta affidabilit e in open source" by Andrea Di Marco
ThinkOpen
Cassandra DB - Linux Day 2019 - Catania - Italy
Cassandra DB - Linux Day 2019 - Catania - ItalyCassandra DB - Linux Day 2019 - Catania - Italy
Cassandra DB - Linux Day 2019 - Catania - Italy
Fabrizio Spataro
2014.11.14 Implementare e mantenere un progetto Azure SQL Database
2014.11.14 Implementare e mantenere un progetto Azure SQL Database2014.11.14 Implementare e mantenere un progetto Azure SQL Database
2014.11.14 Implementare e mantenere un progetto Azure SQL Database
Emanuele Zanchettin
Real Time Monitoring and Analitycs : Customer Experience in Production
Real Time Monitoring and Analitycs : Customer Experience in ProductionReal Time Monitoring and Analitycs : Customer Experience in Production
Real Time Monitoring and Analitycs : Customer Experience in Production
Codemotion
MongoDB Atlas: il modo migliore per eseguire MongoDB in ambiente cloud 2
MongoDB Atlas: il modo migliore per eseguire MongoDB in ambiente cloud 2MongoDB Atlas: il modo migliore per eseguire MongoDB in ambiente cloud 2
MongoDB Atlas: il modo migliore per eseguire MongoDB in ambiente cloud 2
MongoDB
CCI 2019 - Exchange 2019 da 0 ad HA in 1 ora
CCI 2019 - Exchange 2019 da 0 ad HA in 1 oraCCI 2019 - Exchange 2019 da 0 ad HA in 1 ora
CCI 2019 - Exchange 2019 da 0 ad HA in 1 ora
walk2talk srl
IBM FlashSystem 810 e 710
IBM FlashSystem 810 e 710IBM FlashSystem 810 e 710
IBM FlashSystem 810 e 710
PRAGMA PROGETTI
Dalla Unified Communication & Collaboration alla Virtualizzazione: le opportu...
Dalla Unified Communication & Collaboration alla Virtualizzazione: le opportu...Dalla Unified Communication & Collaboration alla Virtualizzazione: le opportu...
Dalla Unified Communication & Collaboration alla Virtualizzazione: le opportu...
festival ICT 2016
2014.11.14 Implementare e mantenere un progetto Azure SQL Database
2014.11.14 Implementare e mantenere un progetto Azure SQL Database2014.11.14 Implementare e mantenere un progetto Azure SQL Database
2014.11.14 Implementare e mantenere un progetto Azure SQL Database
Emanuele Zanchettin
Introduzione al framework dl4j Antonio berti
Introduzione al framework dl4j Antonio bertiIntroduzione al framework dl4j Antonio berti
Introduzione al framework dl4j Antonio berti
Deep Learning Italia
Safe check up - cos'竪? - 22feb2012
Safe check up - cos'竪? - 22feb2012 Safe check up - cos'竪? - 22feb2012
Safe check up - cos'竪? - 22feb2012
M.Ela International Srl
Polyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDB
Polyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDBPolyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDB
Polyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDB
Steve Maraspin
Le novita di MongoDB 3.6
Le novita di MongoDB 3.6Le novita di MongoDB 3.6
Le novita di MongoDB 3.6
MongoDB
IBM FlashSystem 820 e 720
IBM FlashSystem 820 e 720IBM FlashSystem 820 e 720
IBM FlashSystem 820 e 720
PRAGMA PROGETTI

Presentazione Nuvola Vertica Full New1

  • 2. Introduzione a Vertica COSE VERTICA: E linnovativo database DBMS che garantisce elevate performance sullanalisi di grandi volumi di dati (unit di Terabyte) PERCHE VERTICA: E veloce, 竪 semplice, e costa poco!
  • 3. Per chi 竪 pensato La grande esperienza del nostro gruppo ci ha portati ad individuare alcune aree critiche nei progetti dedicati ad aziende che hanno necessit di gestire grandi volumi di dati con tempi di risposta molto rapidi. Vertica nasce specificamente per soddisfare questo tipo di esigenze : Progetto a basso impatto sullazienda Possibilit di analisi fino alla singola riga di dettaglio Ottenere rapidi tempi di risposta gestendo grandi volumi di dati Gestione di base dati delle dimensioni di TeraByte
  • 4. Posizionamento sul mercato Kx KDB Sybase IQ Teradata RAM DBMSs Postgres/EnterpriseDB MySQL Oracle IBM DB2 Sybase ASE Greenplum(Postgres) Datallegro (Ingres) Netezza (Postgres) Microsoft SQLServer TCO (Costo di Possesso) Adatto allo scopo APPLICAZIONI TRANSAZIONALI ALTO BASSO APPLICAZIONI ANALITICHE
  • 5. Caratteristiche Value Value TECNOLOGIA COLUMN-ORIENTED RISPOSTE 10-100 VOLTE MAGGIORI ELEVATA COMPRESSIONE DATI NECESSITA DI POCO SPAZIO INSTALLABILE SU HARDWARE LINUX GIA ESISTENTE IN AZIENDA PIATTAFORMA HARDWARE A BASSO IMPATTO ECONOMICO CARICAMENTO DATI CONTINUO REPORT SEMPRE AGGIORNATI INTERFACCIA SQL STANDARD RAPIDA INTEGRAZIONE E IMPLEMENTAZIONE DESIGN DEL DATABASE SEMPLICE ED EFFICIENTE BASSO COSTO DI MANUTENZIONE
  • 6. Architettura Nuvola 竪 lottimizzazione dell interfaccia per Vertica , il database 竪 comunque aperto allinterrogazione di altri strumenti di reportistica. Strumenti di Reporting Apps OLTP EDW Files Sistemi Sorgenti Extraction Transformation Loading ETL
  • 7. Analisi comparativa TCO Comparazione Costo Totale di Possesso (TCO) VS principali Competitors espresso in % 100 0 60 40 20 80 TCO % Oracle NTS IBM Teradata
  • 10. 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 1/17/2007 0000001 0000001 0000003 0000003 0000005 0000011 0000011 0000020 0000026 0000050 0000051 0000052 0000053 0000068 0000069 0000071 Data ID CLiente Trade Run-length Encoding (Pochi Valori, ordinati) 100.99 75.66 36.93 146.88 283.39 93.40 23.21 344.44 21.30 23.92 50.22 38.22 21.92 74.26 152.49 89.23 Delta Encoding (Molti Valori, ordinati) Float Compression (Molti Valori, disordinati) PERCHE E VELOCE Perch辿 usare Vertica
  • 11. 1/17/2007, 16 Data ID CLiente Trade Run-length Encoding (Pochi Valori, ordinati) Delta Encoding (Molti Valori, ordinati) Float Compression (Molti Valori, disordinati) PERCHE E VELOCE ? 0000001 0 2 2 4 10 10 19 25 49 50 51 52 67 68 70 100.99 75.66 36.93 146.88 283.39 93.40 23.21 344.44 21.30 23.92 50.22 38.22 21.92 74.26 152.49 89.23 perch竪 sfrutta algoritmi di compressione molto performanti perch辿 ogni dato viene letto una sola volta per ogni occorrenza perch辿 i dati organizzati secondo colonne mantengono lo stesso formato Perch辿 usare Vertica
  • 12. Test: Dimensioni DB: 600GB 14 interrogazioni 1 tabella, 200 colonne Risultati di Vertica: Tempo di caricamento 3 volte pi湛 veloce Interrogazioni 214 volte pi湛 veloci Immagazzina 1.5 anni nello stesso spazio in cui un normale sistema immagazzinerebbe 90 giorni di dati di vendita. LHardware costa meno della met Sommario Benchmark Telecom Datawarehouse proprietario Caricamento 2.4 ore 8 ore Dimensione DB 56 GB 948 GB Tempi di risposta 8.7 secondi 30 minuti e 57.0 secondi Costi Hardware $20,000 $48,000 $$ ??
  • 13. Analisi su Record di dettaglio telefonate Customer Benchmark Mobile Communications co 21TB di dettaglio telefonate Cluster di 5 nodi ognuno con: 2x4-core CPUs 8GB RAM 7x146 GB HDDs Risultati tempo medio query: 3m 41s tempo di caricamento: 58 ore DIMENSIONE DB: 21TB
  • 14. Comparazione Vertica vs OLTP Comparazione: 1.5TB Record Dettaglio Telefonate Vertica : 3- node cluster vs. OLTP DBMS on 24-vie server + SAN Queries 60 volte pi湛 veloci Compressione migliorata di 4 volte 25 volte pi湛 veloce in fase di caricamento 470.000贈 in meno di Hardware
  • 15. VERTICA: OVERVIEW DI PRODOTTO
  • 16. Architettura Column-Oriented Elevata compressione dei dati Ottimizzato per lanalisi Sistema ibrido di lettura/scrittura dati Design semplice ed efficace Caratteristiche
  • 17. Caratteristiche Tecniche Ideale per intensi carichi di lavoro in lettura di dati Riduce la I/O Bandwidth dei dischi E.g.: SELECT avg(price) FROM tickstore WHERE symbol = GM and date = 1/17/2008 GM NYASE NYAASE NYSE NYASE NGGYSE NYGGGSE NYSE NYSE NYSE 30.77 NYSE NYSE NYSE 1/17/08 GM NYASE NYAASE NYSE NYASE NGGYSE NYGGGSE NYSE NYSE NYSE 30.79 NYSE NYSE NYSE 1/17/08 AAPL NYASE NYAASE NYSE NYASE NGGYSE NYGGGSE NYSE NYSE NYSE 93.24 NYSE NYSE NYSE 1/17/08 GM NYASE NYAASE NYSE NYASE NGGYSE NYGGGSE NYSE NYSE NYSE 30.77 NYSE NYSE NYSE 1/17/08 Lettura per Righe Legge tutte le colonne 1/17/08 1/17/08 1/17/08 1/17/08 Lettura per Colonne Legge 3 colonne GM GM GM AAPL 30.77 30.77 30.79 93.24 NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS NYSE NYSE NYSE NQDS
  • 18. Caratteristiche Tecniche Relazione R: LOGICA FISICA . . . A B C D E Immagazzina dati come Proiezioni Viste specifiche Includono colonne ridondanti ordinate differentemente = colonne ordinate (A B C | A) A B C (B A C | B A) B A C (B D E | B) B D E
  • 19. Caratteristiche Tecniche (A B C | A) = colonne ordinate (B A C | B A) Le proiezioni vengono suddivise in segmenti Il numero di segmenti dipende dal numero di nodi; viene creato un segmento per ogni nodo A 3 B 3 C 3 A 1 B 1 C 1 A 2 B 2 C 2 A B C B 3 A 3 C 3 B 2 A 2 C 2 B 1 A 1 C 1 B A C
  • 20. Caratteristiche Tecniche I segmenti vengono mappati in nodi per mantenere un livello ottimale di K-Safety I segmenti ottimizzano ogni nodo per differenti carichi di lavoro in lettura Ottimizzazione delle performances attraverso la ridondanza E possibile mantenere pi湛 copie perch竪 i dati sono compressi A 3 B 3 C 3 A 2 B 2 C 2 A 1 B 1 C 1 B 1 A 1 C 1 B 2 A 2 C 2 B 3 A 3 C 3
  • 21. Caratteristiche Tecniche Le colonne sono duplicate, in questo modo se una macchina smette di funzionare si ha sempre una copia disponibile Immagazzina sufficienti proiezioni per la K-Safety Ricostruisce gli oggetti perduti prelevandoli da altri nodi A 2 B 2 C 2 B 2 A 2 C 2 B 1 A 1 C 1 A 3 B 3 C 3 A 3 B 3 C 3 B 1 A 1 C 1 A 1 B 1 C 1 B 3 A 3 C 3
  • 22. Caratteristiche Tecniche Trickle Load: Query executor legge da WOS come anche da ROS Architettura ibrida di storage (A B C | A) Trasferimento dati Asincrono TUPLE MOVER Read-optimized Column Store (ROS) Disco: il dato 竪 ordinato e compresso Memoria: proiezioni riflesse in ordine di inserimento (non compresse) Write-optimized Column Store (WOS) A B C
  • 23. Basta aggiungere server Blade per scalare le performance Fault-tolerance mantenuta automaticamente Flessibilit <= 5 TB <= 15TB 40 TB 6. Scale Out on Industry-Standard Hardware
  • 24. Come viene disegnato lo schema fisico? Semplice DBDesigner viene strutturato sul numero di nodi presenti nella configurazione Database Design > DBA FORNISCE Schema Logico Crea la tabella Training set di: Query tipiche Dati di esempio Livello K-Safety Load constraints > DBDesigner GENERA Uno schema fisico che: Esegue query molto veloci E compatibile con i requisiti del trickle load Si assicura che tutte le query SQL vengano soddisfatte A B A (A B C | A) (B A C | B A) B C C
  • 25. Accesso a Vertica JDBC/ODBC caricamento e analisi dalle soluzioni pi湛 conosciute Vertica include drivers e guide integrate Supporto a scripting e CLI vsql cli, Perl, Python, PHP, C/++ API Caricamento continuo 2mb/s per flussi per nodi trickle load 10mb/s per flussi per nodi bulk load Front-end nativo per analisi dati: NUVOLA
  • 26. Amministrare Vertica Facile da implementare Fully scriptable rpm install Progettato per una rappresentazione a griglie Manutenzione Semplice DBDesigner Integrato Non necessita di indicizzazioni, partizioni o strutture ausiliarie Utilizza il 13% di spazio su disco rispetto ad un normale RDBMS Sistema di monitoraggio integrato Tabelle virtuali e file di log controllabili AquaData Studio, Toad, Visualizzatore di DB
  • 28. Vertica Vertica E: Vertica NON E Un DBMS completamente relazionale Un motore di database transazionale Un motore di database che supporta lo standard SQL su Terabyte di dati Un file system proprietario o motore OLAP con dimensioni limitate Progettato per leggere dati dalla maggior parte degli strumenti presenti sul mercato Progettato per imputare o modificare molto frequentemente records come le soluzioni (OLTP) Orientato a colonne con elevata compressione dei dati Orientato a righe Rispetta gli standard ODBC/JDBC per essere integrato con strumenti di Business Intelligence Un database con stored procedures proprietarie scritte in linguaggio proprietario La ridondanza 竪 ottenuta attraverso logiche software Dipendente dalla configurazione RAID
  • 29. Vertica Database : Una soluzione Completa Performance Eccezionali Motore di database analitico 10-100x+ traditional DBMS Sistema di calcolo a griglia Facile Amministrazione DB Designer iterative learning Enterprise ready Piattaforma Cost-Effective Elevata Scalabilit Richiede meno spazio Utilizzo sapiente delle risorse disponibili
  • 30. Contatti Per ulteriori informazioni rivolgersi a: Ing. Enrico Gasparoni E-mail: [email_address] Mobile: 348-8863011