Talend Data Quality は、Talend StudioのProfilingパースペクティブから、さまざまなデータソースで利用できるデータを検証し、そのデータに関する統計と情報を収集できます。
対象データのデータ品質を多角的に分析。プロファイリング結果をグラフ化します。単純統計だけでなく、テキストやパターン頻度など、データ分布を把握するための統計インジケーターが多数用意されています。
さらに、アルゴリズムを活用して、ソースデータに含まれる重複データの特定を行い、マッチンググループを作成することも可能です。
本セッションでは、Talend Data Quality の設定方法、データプロファイリングの実施方法、そしてデータクレンジングの例を解説いたします。