際際滷

際際滷Share a Scribd company logo
Talend Open Studio DQ
Tutorial pro kurz 4IZ562
Ing. David Pejoch
KIZI / FIS VE Praha
david@pejcoch.com
2013-05-26
P鱈klady pou転鱈vaj鱈
Common Data
Model pro
vertik叩lu
Insurance
publikovan箪 na
www.dataquality.
cz/kbase/
Instalace a spu邸tn鱈
1. St叩hnte zip soubor z webu Talend.com (velikost cca 240 MB)
2. Rozzipujte na disk
3. Spus泥te TOS_DQ-win32-x86.exe
4. Pi spu邸tn鱈 m哲転ete peskoit registraci kliknut鱈m na Register Later
Talend Open Studio DQ
Sem se budou
otev鱈rat jednotliv辿
z叩lo転ky
Sem se budou ukl叩dat jednotliv辿
anal箪zy
Knihovna jednotliv箪ch komponent.
Exchange slo転ka pedstavuje sd鱈len辿
komponenty v r叩mci komunity
Nadefinovan辿 datov辿 zdroje
Integrovan箪 help for Dummies
Help se zobrazuje v z叩lo転ce v prav辿 叩sti 炭vodn鱈ho
okna. Neumo転uje p鱈m辿 spou邸tn鱈 wizard哲,
pouze odkazuje na jednotliv辿 kroky.
Vytvoen鱈 pipojen鱈 k 糸温岳温恢叩噛庄
Pipojen鱈 k MySQL
Vyplte p鱈slu邸n箪 login, heslo, adresu serveru a
n叩zev datab叩ze.
Talend Open Studio DQ
Vytvoen鱈 nov辿ho validan鱈ho pravidla
Talend Open Studio DQ
Talend Open Studio DQ
Talend Open Studio DQ
Talend Open Studio DQ
Validace pomoc鱈 regex
Talend Open Studio DQ
Talend Open Studio DQ
Talend Open Studio DQ
Talend Open Studio DQ
Anal箪za frekvenc鱈 vzor哲
Talend Open Studio DQ
Talend Open Studio DQ
Dotaz nad tabulkou
Talend Open Studio DQ
Definice ulo転en辿ho dotazu
Talend Open Studio DQ
Popis z叩kladn鱈ch funkn鱈ch prvk哲
 Rules = pouze WHERE klauzule
 Patterns = vzory pro validaci
 pomoc鱈 regul叩rn鱈ch v箪raz哲 (n叩stroj obsahuje pedpipraven辿 regul叩rn鱈 v箪razy v
r哲zn箪ch slo転k叩ch podle dom辿n)
 pomoc鱈 SQL LIKE klauzule specifick辿 pro r哲zn叩 RDBMS
 Source files = SQL p鱈kazy, kter辿 lze spustit pomoc鱈 Data Expoloreru (v r叩mci
existuj鱈c鱈ho pipojen鱈 na 糸温岳温恢叩噛庄)
 Indicators = SQL p鱈kazy s vyu転it鱈m sady peddefinovan箪ch templat哲
 Pattern Matching: poet z叩znam哲, kter辿 vyhovuj鱈 regul叩rn鱈mu v箪razu; poet
z叩znam哲, kter辿 vyhovuj鱈 SQL LIKE klauzuli
 Pattern Finder = hled叩n鱈 etnost鱈 vzor哲
 Soundex: tabulka etnost鱈 Soundex hodnot
 ...
Popis funkcionalit v r叩mci DB Connection
 Na 炭rovni pipojen鱈: porovn叩n鱈 datab叩z鱈, overview anal箪za (poty tabulek, 叩dk哲,
index哲 v tabulk叩ch)
 Na 炭rovni datab叩ze: overview anal箪za
 Na 炭rovni seznamu tabulek: porovn叩n鱈 tabulek
 Na 炭rovni tabulek:
 anal箪za tabulky pomoc鱈 SQL rules,
 column analysis (na z叩klad v箪bru datov辿ho typu, vzoru, indik叩toru, sloupc哲
a where podm鱈nky provede anal箪zu s grafick箪m v箪stupem),
 pattern frequency analysis (viz. pedchoz鱈, ale zkoum叩 etnosti vzor哲; z
v箪sledk哲 lze vidt z叩znamy odpov鱈daj鱈c鱈 jednotliv箪m vzor哲m, generovat ze
vzor哲 regul叩rn鱈 v箪razy)
 preview table (pehod鱈 do m坦du s konzol鱈 pro SQL)
Popis funkcionalit v r叩mci DB Connection
 Na 炭rovni sloupce:
 Anal箪za hodnot z mno転iny sloupc哲
 Anal箪za korelace mezi sloupci
 Anal箪za kategori鱈 nomin叩ln鱈 promnn辿
 Pattern frequency analysis + dal邸鱈 viz na 炭rovni tabulek
Ad

Recommended

ADO.NET
ADO.NET
Jan H鱈del
INPTP Rekapitulace
INPTP Rekapitulace
Jan H鱈del
C# - V鱈cevl叩knov辿 aplikace
C# - V鱈cevl叩knov辿 aplikace
Jan H鱈del
Aplikan鱈 nastaven鱈 v .NET
Aplikan鱈 nastaven鱈 v .NET
Jan H鱈del
ASP.NET MVC
ASP.NET MVC
Jan H鱈del
Novinky v releasech Mergada a co chyst叩me d叩l
Novinky v releasech Mergada a co chyst叩me d叩l
Mergado technologies s. r. o.
Talend Open Studio MDM
Talend Open Studio MDM
dpejcoch
Odborn叩 sn鱈dan: Datov箪 sklad jako Perpetuum Mobile
Odborn叩 sn鱈dan: Datov箪 sklad jako Perpetuum Mobile
Profinit
Novinky v PostgreSQL 9.4 a JSONB
Novinky v PostgreSQL 9.4 a JSONB
Tomas Vondra
Prague data management meetup 2017-05-16
Prague data management meetup 2017-05-16
Martin B辿m
NoSQL datab叩ze, MongoDB
NoSQL datab叩ze, MongoDB
Lukas Korous
Databazove systemy1
Databazove systemy1
olc_user
Databazove systemy7
Databazove systemy7
olc_user
NoSQL datab叩ze, MongoDB
NoSQL datab叩ze, MongoDB
Luk叩邸 Korous
Dotazov叩n鱈 nad proudy dat
Dotazov叩n鱈 nad proudy dat
Jan Drozen
Prague data management meetup 2016-09-22
Prague data management meetup 2016-09-22
Martin B辿m
.NET v SQL Serveru
.NET v SQL Serveru
Jan Drozen
Analytik Mlad叩 Boleslav
Analytik Mlad叩 Boleslav
ZuzanaPacourkova
Doctrine: co dlat, kdy転 entity nesta鱈
Doctrine: co dlat, kdy転 entity nesta鱈
Filip Proch叩zka
OKbase - modern鱈 IT n叩stroj pro HR
OKbase - modern鱈 IT n叩stroj pro HR
OKsystem
Linq
Linq
Adam Abonyi
BI Forum 2012 - Oracle Exalytics zrychluje eskou veejnou spr叩vu
BI Forum 2012 - Oracle Exalytics zrychluje eskou veejnou spr叩vu
OKsystem
Zonky QA Meetup
Zonky QA Meetup
damovsky
BPTX_2014_1_11320_0_378624_0_158202
BPTX_2014_1_11320_0_378624_0_158202
Petr Hude?ek
Od atributu k reportu
Od atributu k reportu
OKsystem

More Related Content

Similar to Talend Open Studio DQ (17)

Novinky v PostgreSQL 9.4 a JSONB
Novinky v PostgreSQL 9.4 a JSONB
Tomas Vondra
Prague data management meetup 2017-05-16
Prague data management meetup 2017-05-16
Martin B辿m
NoSQL datab叩ze, MongoDB
NoSQL datab叩ze, MongoDB
Lukas Korous
Databazove systemy1
Databazove systemy1
olc_user
Databazove systemy7
Databazove systemy7
olc_user
NoSQL datab叩ze, MongoDB
NoSQL datab叩ze, MongoDB
Luk叩邸 Korous
Dotazov叩n鱈 nad proudy dat
Dotazov叩n鱈 nad proudy dat
Jan Drozen
Prague data management meetup 2016-09-22
Prague data management meetup 2016-09-22
Martin B辿m
.NET v SQL Serveru
.NET v SQL Serveru
Jan Drozen
Analytik Mlad叩 Boleslav
Analytik Mlad叩 Boleslav
ZuzanaPacourkova
Doctrine: co dlat, kdy転 entity nesta鱈
Doctrine: co dlat, kdy転 entity nesta鱈
Filip Proch叩zka
OKbase - modern鱈 IT n叩stroj pro HR
OKbase - modern鱈 IT n叩stroj pro HR
OKsystem
Linq
Linq
Adam Abonyi
BI Forum 2012 - Oracle Exalytics zrychluje eskou veejnou spr叩vu
BI Forum 2012 - Oracle Exalytics zrychluje eskou veejnou spr叩vu
OKsystem
Zonky QA Meetup
Zonky QA Meetup
damovsky
BPTX_2014_1_11320_0_378624_0_158202
BPTX_2014_1_11320_0_378624_0_158202
Petr Hude?ek
Od atributu k reportu
Od atributu k reportu
OKsystem
Novinky v PostgreSQL 9.4 a JSONB
Novinky v PostgreSQL 9.4 a JSONB
Tomas Vondra
Prague data management meetup 2017-05-16
Prague data management meetup 2017-05-16
Martin B辿m
NoSQL datab叩ze, MongoDB
NoSQL datab叩ze, MongoDB
Lukas Korous
Databazove systemy1
Databazove systemy1
olc_user
Databazove systemy7
Databazove systemy7
olc_user
NoSQL datab叩ze, MongoDB
NoSQL datab叩ze, MongoDB
Luk叩邸 Korous
Dotazov叩n鱈 nad proudy dat
Dotazov叩n鱈 nad proudy dat
Jan Drozen
Prague data management meetup 2016-09-22
Prague data management meetup 2016-09-22
Martin B辿m
.NET v SQL Serveru
.NET v SQL Serveru
Jan Drozen
Analytik Mlad叩 Boleslav
Analytik Mlad叩 Boleslav
ZuzanaPacourkova
Doctrine: co dlat, kdy転 entity nesta鱈
Doctrine: co dlat, kdy転 entity nesta鱈
Filip Proch叩zka
OKbase - modern鱈 IT n叩stroj pro HR
OKbase - modern鱈 IT n叩stroj pro HR
OKsystem
BI Forum 2012 - Oracle Exalytics zrychluje eskou veejnou spr叩vu
BI Forum 2012 - Oracle Exalytics zrychluje eskou veejnou spr叩vu
OKsystem
Zonky QA Meetup
Zonky QA Meetup
damovsky
BPTX_2014_1_11320_0_378624_0_158202
BPTX_2014_1_11320_0_378624_0_158202
Petr Hude?ek
Od atributu k reportu
Od atributu k reportu
OKsystem

Talend Open Studio DQ

  • 1. Talend Open Studio DQ Tutorial pro kurz 4IZ562 Ing. David Pejoch KIZI / FIS VE Praha david@pejcoch.com 2013-05-26
  • 2. P鱈klady pou転鱈vaj鱈 Common Data Model pro vertik叩lu Insurance publikovan箪 na www.dataquality. cz/kbase/
  • 3. Instalace a spu邸tn鱈 1. St叩hnte zip soubor z webu Talend.com (velikost cca 240 MB) 2. Rozzipujte na disk 3. Spus泥te TOS_DQ-win32-x86.exe 4. Pi spu邸tn鱈 m哲転ete peskoit registraci kliknut鱈m na Register Later
  • 5. Sem se budou otev鱈rat jednotliv辿 z叩lo転ky Sem se budou ukl叩dat jednotliv辿 anal箪zy Knihovna jednotliv箪ch komponent. Exchange slo転ka pedstavuje sd鱈len辿 komponenty v r叩mci komunity Nadefinovan辿 datov辿 zdroje
  • 6. Integrovan箪 help for Dummies Help se zobrazuje v z叩lo転ce v prav辿 叩sti 炭vodn鱈ho okna. Neumo転uje p鱈m辿 spou邸tn鱈 wizard哲, pouze odkazuje na jednotliv辿 kroky.
  • 7. Vytvoen鱈 pipojen鱈 k 糸温岳温恢叩噛庄
  • 8. Pipojen鱈 k MySQL Vyplte p鱈slu邸n箪 login, heslo, adresu serveru a n叩zev datab叩ze.
  • 27. Popis z叩kladn鱈ch funkn鱈ch prvk哲 Rules = pouze WHERE klauzule Patterns = vzory pro validaci pomoc鱈 regul叩rn鱈ch v箪raz哲 (n叩stroj obsahuje pedpipraven辿 regul叩rn鱈 v箪razy v r哲zn箪ch slo転k叩ch podle dom辿n) pomoc鱈 SQL LIKE klauzule specifick辿 pro r哲zn叩 RDBMS Source files = SQL p鱈kazy, kter辿 lze spustit pomoc鱈 Data Expoloreru (v r叩mci existuj鱈c鱈ho pipojen鱈 na 糸温岳温恢叩噛庄) Indicators = SQL p鱈kazy s vyu転it鱈m sady peddefinovan箪ch templat哲 Pattern Matching: poet z叩znam哲, kter辿 vyhovuj鱈 regul叩rn鱈mu v箪razu; poet z叩znam哲, kter辿 vyhovuj鱈 SQL LIKE klauzuli Pattern Finder = hled叩n鱈 etnost鱈 vzor哲 Soundex: tabulka etnost鱈 Soundex hodnot ...
  • 28. Popis funkcionalit v r叩mci DB Connection Na 炭rovni pipojen鱈: porovn叩n鱈 datab叩z鱈, overview anal箪za (poty tabulek, 叩dk哲, index哲 v tabulk叩ch) Na 炭rovni datab叩ze: overview anal箪za Na 炭rovni seznamu tabulek: porovn叩n鱈 tabulek Na 炭rovni tabulek: anal箪za tabulky pomoc鱈 SQL rules, column analysis (na z叩klad v箪bru datov辿ho typu, vzoru, indik叩toru, sloupc哲 a where podm鱈nky provede anal箪zu s grafick箪m v箪stupem), pattern frequency analysis (viz. pedchoz鱈, ale zkoum叩 etnosti vzor哲; z v箪sledk哲 lze vidt z叩znamy odpov鱈daj鱈c鱈 jednotliv箪m vzor哲m, generovat ze vzor哲 regul叩rn鱈 v箪razy) preview table (pehod鱈 do m坦du s konzol鱈 pro SQL)
  • 29. Popis funkcionalit v r叩mci DB Connection Na 炭rovni sloupce: Anal箪za hodnot z mno転iny sloupc哲 Anal箪za korelace mezi sloupci Anal箪za kategori鱈 nomin叩ln鱈 promnn辿 Pattern frequency analysis + dal邸鱈 viz na 炭rovni tabulek