狠狠撸

狠狠撸Share a Scribd company logo
1	
 ? Talend 2014	
? Talend 2014	
TalendとTalend5.4のご紹介
Talend株式会社
マーケティングディレクター
寺澤慎祐
2	
 ? Talend 2014	
Vision /Mission
Talendは、場所、時間、方法に関係なく、データに価値を与えユーザ企業の成長を支援します。
3	
 ? Talend 2014	
2005	
フランスにて二人のエンジニアが創業	
Bertrand Diard
ベルトランド?ディアド
Co-Founder and CSO	
Fabrice Bonan
ファビルス?ボナン
Co-Founder and CTO
4	
 ? Talend 2014	
128%	
前年度比売上成長率	
2007	
 2008	
 2009	
 2010	
 2011	
 2012
5	
 ? Talend 2014	
20,000,000	
ダウンロード数
6	
 ? Talend 2014	
1,000,000	
ユーザ数
7	
 ? Talend 2014	
4,000	
導入企業数
8	
 ? Talend 2014	
OPEN	
ソースコード、ビジネス
9	
 ? Talend 2014	
45,000	
コミュニティメンバー
10	
 ? Talend 2014	
1,500	
品質テスター
11	
 ? Talend 2014	
500+	
アダプター
12	
 ? Talend 2014	
導入企業例
金融サービス
保険
通信
サービス
製造業
流通小売り
公共機関
教育
13	
 ? Talend 2014	
I DATA
設?立立以来データにフォーカスしたビジネス
I BIGDATA
14	
 ? Talend 2014	
ビッグデータのビッグウェーブ
ビッグデータにフォーカス
15	
 ? Talend 2014	
ビッグデータとは?
16	
 ? Talend 2014	
IT Leaders 2012年4月25日の記事から抜粋
テラデータのステファン?ブロブストCTOへのインタビュー
記者 最近のビッグデータを巡る議論には、やや疑問を感じます。大量
のデータを扱うだけなら手段はこれまでも存在しています。
ブロブスト その指摘は正しい。ビッグデータは“インタラクションデータ”と言
い換えられる。トランザクションデータが生まれる過程で発生す
る詳細なデータのことだ。オンラインショップを想像してほしい。
これまで企業が注目してきたのは、商品名や個数、金額や割引
率などの購入データ。しかし、アプリケーションのログには消費
者が購入に至るまでの経緯が、クリック1つひとつのレベルで記
録されている。そうした粒度の細かいデータを有効活用すること
がビッグデータの本質だ。
記者 「質」が重要、「量」ではない?
ブロブスト その通り。ビッグデータ活用の真の課題はインタラクションデー
タの大部分が非リレーショナルデータだという点にある。従来と
異なる多様なデータ構造を扱う技術が必要になる。
記者 BIの活用すらままならない状況で今度はビッグデータだという。
困惑するユーザーも少なくない。
ブロブスト 流行り言葉に惑わされず、獲得できるビジネス的な価値に注目
すべきだ。コストとバリューなどの観点から施策を優先順位付け
し、上位のものから取り組むと良いだろう。
記者とブロブストのインタビュー
ビッグデータは
インタラクションデータ
ビッグデータ活用の真の課題
はデータの大部分が
非構造化データである
ビッグデータは質が重要
17	
 ? Talend 2014	
データドリブンのデータはビックも(が)必要
社会活動から発生(主に社外に蓄積)
これまでは得られなかったデータ
非構造化データ
構造化データ
ビッグデータ
?? 動画/画像データ
?? ドキュメントデータ
?? 音声データ
?? ゲノムデータ
?? テキストデータ
?? SNSデータ
?? クリックストリーム
?? センサーデータ
?? GPS、ETC、生体
?? 株価、為替、他
?? 財務データ
?? 販売データ
?? 物流データ
?? 顧客データ、他
業務プロセス
から発生
(主に社内に蓄積)
質の良い
質の良い
18	
 ? Talend 2014	
ビッグデータの本質
事? 実
?大きなデータ
?高速
正確
安く
誰にでも
本? 質
量量は必要
量量より質
19	
 ? Talend 2014	
データが経営を変える
20	
 ? Talend 2014	
ユーザーに聞けばわかる
(理理論論+経験)
+
(科学+洞洞察)
勝つ?方法
? お願いランキング
視聴者に受けるコーナーは?
顧客指向
データ指向
理理論論+経験
従来?方法
?月9?方式
トレンド俳優なら視聴率率率とれる
ベンダー指向
経験指向
21	
 ? Talend 2014	
成功した理由(KKDからKKDへ)
従来?方法
K
K
D
勘
経験
度度胸
勝つ?方法
K
K
D
仮説
検証
データ分析
22	
 ? Talend 2014	
データドリブン経営の仕組み
情報
ソース
アクションアウトプット仮説
【勘】
【経験】
既知の
ナレッジ
分析
レポート
データ統合
データ処理理
ダッシュボード
プランニング
アクション
トラッキング
モニタリング
指標
分析ツール
ERP
RDBMS
SNS
HADOOP
OPEN
DATA
新発?見見
?人による
意思決定
?自動判定
イベント処理理
インサイト ?
by ?データ
? サイエンティスト
フィードバック
何が起きたか?
いつ、だれが
どこで、いくら?
何が起きるか?
どんなインパクトが?
ポテンシャルシナリオ
ベストチョイス
23	
 ? Talend 2014	
Talendはビッグデータを活用する
データドリブン経営を支援します
勘と経験だけで競争に勝てるか?
従来の統合技術で勝てるか?
データに基づいた方が勝てる
新しい技術が必要
勘と経験に
頼った意志決定
INTELLIGENCE
社内データ
による分析
に頼った
意思決定
ビッグデータ
も含めた社内外の
データに基づいた
意思決定
もっとも売れている商品(現在の実力)
今後売り上げが伸びる商品(将来性)
何かがあると必ず売れる商品(確実性)
いつも一定して売れる商品(着実性、安定性)
ときどきよく売れる商品(一過性、断続性)
24	
 ? Talend 2014	
ビッグデータインテグレーション(活用)における5つの課題
量と
処理速度
ソース
の拡大
複雑性
適時性
整合性
BIG
DATA
急激に増加する粒度の小さいデー
タ(販売情報、電話記録、銀行取引、
クリックストリーム、気象情報等)を
大量に瞬時に処理する必要がある
?? 構造化データ、準構造化データ、非
構造化データなど統合すべきデー
タソースが拡大
?? 拡大する情報ソースと接続する手
段が必要
?? 情報ソースは自社?他社、政府、オ
ンプレミス?クラウドと多岐にわたる
場所に存在
?? データは、集約、解析、計算、
統計的処理等が行なわれ
たり、行なわれなかったりす
るため複雑性が増加
?? データは非構造化データ、
構造化データが入り交じり
複雑に
?? ERPのデータ、Webサーバのレスポンスタ
イム、SNSのデータなど、統合すべきデー
タが反映されるリードタイムが違う
?? データには適時なタイミングが必要
?? 氏名などで使われる漢字の新旧変換、
住所、半角と全角など、日本語ならで
はのデータ整合性が課題
?? 日付の型の違い
?? 統計解析する上でもデータの量よりも
品質が重要
ビッグデータインテグレーションの
課題を解決する
25	
 ? Talend 2014	
5.4
26	
 ? Talend 2014	
Talend製品のポートフォリオ
【Platform】
会社、グループ
レベル
 ?【TOS】
検証、個人
レベル
【Enterprise】
部門、プロジェクト
レベル
データの
整備
データの
統合
アプリケーション
の統合
マスターデータ
の整備
ビッグデータ
の統合
Data
Quality	
Big
Data	
Data
Integration	
MDM	
ESB	
Big
Data	
Data
Integration	
ESB	
Big Data	
Data Management	
Data Service	
With Big Data
With Big Data
Enterprise Integration	
With Big Data
プロセス
の統合
Bonita
Soft	
スケジューラ、共同開発、負荷分散、配置方法など
商用版でしかできない機能を装備
MDM
27	
 ? Talend 2014	
Talendプラットフォーム
6つのモジュールは一つのプラットホームに統合されているため、企業における
データ統合の取り組みの深度に関わらず同じインターフェース、同じスキルで対応が可能
28	
 ? Talend 2014	
ビッグデータベンダーと技術(2012.9)
29	
 ? Talend 2014	
他社が真似できないTalendの優位性
オープン性	
?? オープンソースであるが故に情報ソースへのコン
ポーネントが豊富(500以上)
?? ソースコード生成型モデルであるためコードに透明性
があり信頼性がある
?? 多くのデータ活用ベンダー(技術)でも接続可能
?? オープンソースモデルであるため、先進技術への対
応が早い(先進性)
先進性	
?? YARNなどの先進技術への対応
?? 先進的な情報ソース(Hadoop、No ?SQL、DWH、インメ
モリーコンピューティングなど)へのアクセス
?? オープンソースをベースとした開発者コミュニティに
支えられているため、最新技術への対応が早い
?? コミュニティの支持によりコードの信頼性(製品の信頼
性)が高い ?
ビジネスモデル	
?? 利用者単位でのライセンス
?? 顧客は最小限のライセンスを支払えば良く、投
資対効果が高い
?? サブスクリプションライセンス
?? 顧客は年単位でプロジェクトを見直してライセ
ンスコストの最適化を図れる
?? ソースコード生成型で分散処理環境に迅速に対応
30	
 ? Talend 2014	
組織の内外にあるデータ資産をコネクトするのがDI/BDI
31	
 ? Talend 2014	
高い開発生産性を発揮する開発作業環境:
Talend Studio
共有リポジトリビュー	
500以上のコンポーネント	
ワークスペースにグラフィカルに処理をデザイン	
コンポーネントプロパティを設定
32	
 ? Talend 2014	
高い開発生産性を発揮する開発作業環境:
Talend Studio
?Talend 2013 32	
ビッグデータ統合処理の開発:データ変換とマッピングに高い柔軟性を提供	
入力項目	
 出力項目と変換定義入出力項目の関係は
ビジュアルに表現
33	
 ? Talend 2014	
Big Dataへのコミット
" ? Hadoop(MapReduce、YARN)へのコミット
" ? No SQLへのコミット
Easy ?to ?Use SimulationHadoop ?Power
34	
 ? Talend 2014	
ビッグデータプラットフォームの課題を解決する
Talend5.4の新機能
" MapReduce(Hadoop)の取
り扱いを容易にする
" ビッグデータの収集が容
易になる
" Hadoop性能を充分に引き
出せる
お客様の課題 Talend5.4による解決
" MapReduce(Hadoop)の取
り扱いが難しい
" データ(ビッグデータ含む)
の収集が難しい
" 大量データの高速処理が
難しい(Hadoopの性能を
充分に引き出せない)
35	
 ? Talend 2014	
Hadoopを
取り扱い易くしました
36	
 ? Talend 2014	
ビッグデータプラットフォームをサポートすることで開発者
は一つのインターフェースでビッグデータプラットフォーム
にアクセスできます
" ? No SQL、Hadoop、分散処理技術へのアクセスは簡単ではありません
" ? Hadoop処理への期待は高まりつつありますが、Hadpp/MapReduceを使えるエンジ
ニアが不足している
" ? Talendは先進技術へのAPIを用意することで、No SQL DB、Hadoop、分散処理技術
を容易に活用できる環境を提供します。
API
API
API
開発者
37	
 ? Talend 2014	
Talendがコネクトできるデータを処理?保存する技術
38	
 ? Talend 2014	
Hadoopパワーを存分に使えます
39	
 ? Talend 2014	
YARN(Yet Another Resource Negotiator)
" ? Apacheのプロジェクトで、MapReduce2.0とも言われるが、
MapReduceのサポートだけではないのでYARNと呼ばれる
" ? 任意の分散処理フレームワークやアプリケーションの作成を
容易にする新しいフレームワークである
" ? YARNの実行モデルは、以前のMapReduceの実装よりも汎用
的である
" ? YARNはオリジナルのApache HadoopのMapReduceとは異な
り、MapReduceのモデルに従っていないアプリケーションを実
行可能
" ? YARNは、分散ファイルシステムとMapReduceの間に入る汎用
的なフレームワークである
" ? MapReduceのようなフレームワークやプログラムに類似した、
あるいは全く違う新しいプログラムやアーキテクチャがHDFS
を活用できるようになり、圧倒的な処理性能を得られる
" ? 物理的な分散ファイルシステムとは違ったシステムインフラを
使える可能性がある
" ? MapReduce1.0がサポートするノード数は4000程度だが、
YARNは10000程度までサポート
分散ファイルシステム(HDFS)	
MapReduce1.0
大量データの一括処理をする
フレームワーク	
YARN	
分散ファイルシステム(HDFS)	
MapReduce
大量データの一括処理をするフ
レームワーク	
memory	
App
40	
 ? Talend 2014	
TalendはYARNの上でもネイティブに動作します
" ? Talendのツールで生成されるプログラムがjarファイルで生成されるため、JRE、MapReduce、
YARN上でネイティブに動作させることが可能
" ? DIエンジン、データクレンジングが圧倒的なパフォーマンスを発揮します
" ? パフォーマンスが、分散環境のパフォーマンスに依存することになるため、高いパフォーマンスを
発揮可能
" ? 競合他社は、プログラムをOS上で稼働させるためハードウェアリソース(CPUやメモリー)の性能
特性に依存してしまう
jar File	
Java SE	
CPU	
5.2	
競合他社
プログラム
OS	
CPU	
YARN	
jar
File	
Map
Reduce	
Java
SE	
分散環境 CPU	
5.4	
jar File	
jar
File	
jar File	
Map
Reduce	
Java
SE	
分散
環境
CPU	
5.3	
jar
File
41	
 ? Talend 2014	
データ処理が飛躍的に速くなることで何が変わるのか? 
" ? 流通業では
n?? POSで集まる販売情報、販売情報に連動する配送システムや調達システム、最近では明日
の販売を予測するために気象情報なども想定して配送時間、配送商品の決定などを行ない
ますが、これまではバッチ処理が多いため、タイムラグが発生していました。
n?? Talendを使えば、ほぼリアルタイムにデータを集め、瞬時にデータ処理して、配送システムや
調達システムにデータを渡すことができます。
" ? 製造業では
n?? 製品を作る工場において、ラインの場所単位や製造機器単位で測定する湿度や温度などに
欠品率が左右される場合に、温度湿度情報を得て自動制御するには多くの投資が必要
n?? Talendを使えば、自動制御するよりも、温度湿度情報から得た欠品率を想定した部材の購入
量を瞬時に計算して調達量を変更することができる。
" ? 公共では
n?? 橋梁や高速道路などにつけられた歪み計などの無線センサーから送信される分単位の差分
データを送る
n?? Talendを使えば、差分データではなく、生データをリアルタイムに送ることで、通常データのト
レンドと、異常データの差分が瞬時に判断して障害の予兆検知をすることができる
42	
 ? Talend 2014	
Map処理、Reduce処理の実行を想定
43	
 ? Talend 2014	
MapReduce Jobをビジュアル化して
インフラの最適化をはかりコスト削減
" ? Talend製品(BigData)の開発ツール(Studio)の拡張で、開発者は設計したMap処理、
Reduce処理の実行想定をビジュアルで見ることができます
" ? 並列度を設定できるので、パフォーマンスの最適化を図ることができます。
44	
 ? Talend 2014	
オンプレミス環境とクラウド環境の橋渡し
オンプレミス環境
クラウド環境
45	
 ? Talend 2014	
配置とスケジュールは柔軟に
クラウド環境でも、オンプレミス環境でも
北米	
日本	
ヨーロッパ	
オーストラリア	
シンガポール	
中国
46	
 ? Talend 2014	
親和性が高いビジネスモデル
" Talend(DI/Big Data)のサブスクリプション
ライセンスは、データ量、CPU数コア数等の
システム規模に依存しない
" 課金対象は、使用ユーザー数と使用年数
" サブスクリプションには、年間保守料金を
含む
" 伸縮自在なクラウド上のシステム環境とし
て最適なライセンスモデル
47	
 ? Talend 2014	
Talend5.4の卓越した特長
YARN/Hadoop
数千ノード対応
No Batch
リアルタイムバッチ
高速処理	
500+
多様なデータソース
業界最大
サポートプラットフォーム
多様性	
Talend Studio
コードジェネレート
ハイブリッド環境
クラウド、オンプレミス
ライセンスモデル
利用者単位
	
シンプル	
オープン(ソースソフトウェア+ビジネス)
48	
 ? Talend 2014	
http://jp.talend.com https://www.facebook.com/TalendKK
https://www.talend-bc.jp
http://www.slideshare.net/talendkk/
https://twitter.com/talendKK http://www.youtube.com/user/TalendChannel
様々なメディアで情報提供開始予定
49	
 ? Talend 2014	
Talendがコネクトできるデータを処理?保存する技術
Redshift	
No SQL DB	
 Hadoop	
 Technology	
インメモリーDB、DWH

More Related Content

罢补濒别苍诲と迟补濒别苍诲5.4のご绍介

  • 1. 1 ? Talend 2014 ? Talend 2014 TalendとTalend5.4のご紹介 Talend株式会社 マーケティングディレクター 寺澤慎祐
  • 2. 2 ? Talend 2014 Vision /Mission Talendは、場所、時間、方法に関係なく、データに価値を与えユーザ企業の成長を支援します。
  • 3. 3 ? Talend 2014 2005 フランスにて二人のエンジニアが創業 Bertrand Diard ベルトランド?ディアド Co-Founder and CSO Fabrice Bonan ファビルス?ボナン Co-Founder and CTO
  • 4. 4 ? Talend 2014 128% 前年度比売上成長率 2007 2008 2009 2010 2011 2012
  • 5. 5 ? Talend 2014 20,000,000 ダウンロード数
  • 6. 6 ? Talend 2014 1,000,000 ユーザ数
  • 7. 7 ? Talend 2014 4,000 導入企業数
  • 8. 8 ? Talend 2014 OPEN ソースコード、ビジネス
  • 9. 9 ? Talend 2014 45,000 コミュニティメンバー
  • 10. 10 ? Talend 2014 1,500 品質テスター
  • 11. 11 ? Talend 2014 500+ アダプター
  • 12. 12 ? Talend 2014 導入企業例 金融サービス 保険 通信 サービス 製造業 流通小売り 公共機関 教育
  • 13. 13 ? Talend 2014 I DATA 設?立立以来データにフォーカスしたビジネス I BIGDATA
  • 14. 14 ? Talend 2014 ビッグデータのビッグウェーブ ビッグデータにフォーカス
  • 15. 15 ? Talend 2014 ビッグデータとは?
  • 16. 16 ? Talend 2014 IT Leaders 2012年4月25日の記事から抜粋 テラデータのステファン?ブロブストCTOへのインタビュー 記者 最近のビッグデータを巡る議論には、やや疑問を感じます。大量 のデータを扱うだけなら手段はこれまでも存在しています。 ブロブスト その指摘は正しい。ビッグデータは“インタラクションデータ”と言 い換えられる。トランザクションデータが生まれる過程で発生す る詳細なデータのことだ。オンラインショップを想像してほしい。 これまで企業が注目してきたのは、商品名や個数、金額や割引 率などの購入データ。しかし、アプリケーションのログには消費 者が購入に至るまでの経緯が、クリック1つひとつのレベルで記 録されている。そうした粒度の細かいデータを有効活用すること がビッグデータの本質だ。 記者 「質」が重要、「量」ではない? ブロブスト その通り。ビッグデータ活用の真の課題はインタラクションデー タの大部分が非リレーショナルデータだという点にある。従来と 異なる多様なデータ構造を扱う技術が必要になる。 記者 BIの活用すらままならない状況で今度はビッグデータだという。 困惑するユーザーも少なくない。 ブロブスト 流行り言葉に惑わされず、獲得できるビジネス的な価値に注目 すべきだ。コストとバリューなどの観点から施策を優先順位付け し、上位のものから取り組むと良いだろう。 記者とブロブストのインタビュー ビッグデータは インタラクションデータ ビッグデータ活用の真の課題 はデータの大部分が 非構造化データである ビッグデータは質が重要
  • 17. 17 ? Talend 2014 データドリブンのデータはビックも(が)必要 社会活動から発生(主に社外に蓄積) これまでは得られなかったデータ 非構造化データ 構造化データ ビッグデータ ?? 動画/画像データ ?? ドキュメントデータ ?? 音声データ ?? ゲノムデータ ?? テキストデータ ?? SNSデータ ?? クリックストリーム ?? センサーデータ ?? GPS、ETC、生体 ?? 株価、為替、他 ?? 財務データ ?? 販売データ ?? 物流データ ?? 顧客データ、他 業務プロセス から発生 (主に社内に蓄積) 質の良い 質の良い
  • 18. 18 ? Talend 2014 ビッグデータの本質 事? 実 ?大きなデータ ?高速 正確 安く 誰にでも 本? 質 量量は必要 量量より質
  • 19. 19 ? Talend 2014 データが経営を変える
  • 20. 20 ? Talend 2014 ユーザーに聞けばわかる (理理論論+経験) + (科学+洞洞察) 勝つ?方法 ? お願いランキング 視聴者に受けるコーナーは? 顧客指向 データ指向 理理論論+経験 従来?方法 ?月9?方式 トレンド俳優なら視聴率率率とれる ベンダー指向 経験指向
  • 21. 21 ? Talend 2014 成功した理由(KKDからKKDへ) 従来?方法 K K D 勘 経験 度度胸 勝つ?方法 K K D 仮説 検証 データ分析
  • 22. 22 ? Talend 2014 データドリブン経営の仕組み 情報 ソース アクションアウトプット仮説 【勘】 【経験】 既知の ナレッジ 分析 レポート データ統合 データ処理理 ダッシュボード プランニング アクション トラッキング モニタリング 指標 分析ツール ERP RDBMS SNS HADOOP OPEN DATA 新発?見見 ?人による 意思決定 ?自動判定 イベント処理理 インサイト ? by ?データ ? サイエンティスト フィードバック 何が起きたか? いつ、だれが どこで、いくら? 何が起きるか? どんなインパクトが? ポテンシャルシナリオ ベストチョイス
  • 23. 23 ? Talend 2014 Talendはビッグデータを活用する データドリブン経営を支援します 勘と経験だけで競争に勝てるか? 従来の統合技術で勝てるか? データに基づいた方が勝てる 新しい技術が必要 勘と経験に 頼った意志決定 INTELLIGENCE 社内データ による分析 に頼った 意思決定 ビッグデータ も含めた社内外の データに基づいた 意思決定 もっとも売れている商品(現在の実力) 今後売り上げが伸びる商品(将来性) 何かがあると必ず売れる商品(確実性) いつも一定して売れる商品(着実性、安定性) ときどきよく売れる商品(一過性、断続性)
  • 24. 24 ? Talend 2014 ビッグデータインテグレーション(活用)における5つの課題 量と 処理速度 ソース の拡大 複雑性 適時性 整合性 BIG DATA 急激に増加する粒度の小さいデー タ(販売情報、電話記録、銀行取引、 クリックストリーム、気象情報等)を 大量に瞬時に処理する必要がある ?? 構造化データ、準構造化データ、非 構造化データなど統合すべきデー タソースが拡大 ?? 拡大する情報ソースと接続する手 段が必要 ?? 情報ソースは自社?他社、政府、オ ンプレミス?クラウドと多岐にわたる 場所に存在 ?? データは、集約、解析、計算、 統計的処理等が行なわれ たり、行なわれなかったりす るため複雑性が増加 ?? データは非構造化データ、 構造化データが入り交じり 複雑に ?? ERPのデータ、Webサーバのレスポンスタ イム、SNSのデータなど、統合すべきデー タが反映されるリードタイムが違う ?? データには適時なタイミングが必要 ?? 氏名などで使われる漢字の新旧変換、 住所、半角と全角など、日本語ならで はのデータ整合性が課題 ?? 日付の型の違い ?? 統計解析する上でもデータの量よりも 品質が重要 ビッグデータインテグレーションの 課題を解決する
  • 25. 25 ? Talend 2014 5.4
  • 26. 26 ? Talend 2014 Talend製品のポートフォリオ 【Platform】 会社、グループ レベル ?【TOS】 検証、個人 レベル 【Enterprise】 部門、プロジェクト レベル データの 整備 データの 統合 アプリケーション の統合 マスターデータ の整備 ビッグデータ の統合 Data Quality Big Data Data Integration MDM ESB Big Data Data Integration ESB Big Data Data Management Data Service With Big Data With Big Data Enterprise Integration With Big Data プロセス の統合 Bonita Soft スケジューラ、共同開発、負荷分散、配置方法など 商用版でしかできない機能を装備 MDM
  • 27. 27 ? Talend 2014 Talendプラットフォーム 6つのモジュールは一つのプラットホームに統合されているため、企業における データ統合の取り組みの深度に関わらず同じインターフェース、同じスキルで対応が可能
  • 28. 28 ? Talend 2014 ビッグデータベンダーと技術(2012.9)
  • 29. 29 ? Talend 2014 他社が真似できないTalendの優位性 オープン性 ?? オープンソースであるが故に情報ソースへのコン ポーネントが豊富(500以上) ?? ソースコード生成型モデルであるためコードに透明性 があり信頼性がある ?? 多くのデータ活用ベンダー(技術)でも接続可能 ?? オープンソースモデルであるため、先進技術への対 応が早い(先進性) 先進性 ?? YARNなどの先進技術への対応 ?? 先進的な情報ソース(Hadoop、No ?SQL、DWH、インメ モリーコンピューティングなど)へのアクセス ?? オープンソースをベースとした開発者コミュニティに 支えられているため、最新技術への対応が早い ?? コミュニティの支持によりコードの信頼性(製品の信頼 性)が高い ? ビジネスモデル ?? 利用者単位でのライセンス ?? 顧客は最小限のライセンスを支払えば良く、投 資対効果が高い ?? サブスクリプションライセンス ?? 顧客は年単位でプロジェクトを見直してライセ ンスコストの最適化を図れる ?? ソースコード生成型で分散処理環境に迅速に対応
  • 30. 30 ? Talend 2014 組織の内外にあるデータ資産をコネクトするのがDI/BDI
  • 31. 31 ? Talend 2014 高い開発生産性を発揮する開発作業環境: Talend Studio 共有リポジトリビュー 500以上のコンポーネント ワークスペースにグラフィカルに処理をデザイン コンポーネントプロパティを設定
  • 32. 32 ? Talend 2014 高い開発生産性を発揮する開発作業環境: Talend Studio ?Talend 2013 32 ビッグデータ統合処理の開発:データ変換とマッピングに高い柔軟性を提供 入力項目 出力項目と変換定義入出力項目の関係は ビジュアルに表現
  • 33. 33 ? Talend 2014 Big Dataへのコミット " ? Hadoop(MapReduce、YARN)へのコミット " ? No SQLへのコミット Easy ?to ?Use SimulationHadoop ?Power
  • 34. 34 ? Talend 2014 ビッグデータプラットフォームの課題を解決する Talend5.4の新機能 " MapReduce(Hadoop)の取 り扱いを容易にする " ビッグデータの収集が容 易になる " Hadoop性能を充分に引き 出せる お客様の課題 Talend5.4による解決 " MapReduce(Hadoop)の取 り扱いが難しい " データ(ビッグデータ含む) の収集が難しい " 大量データの高速処理が 難しい(Hadoopの性能を 充分に引き出せない)
  • 35. 35 ? Talend 2014 Hadoopを 取り扱い易くしました
  • 36. 36 ? Talend 2014 ビッグデータプラットフォームをサポートすることで開発者 は一つのインターフェースでビッグデータプラットフォーム にアクセスできます " ? No SQL、Hadoop、分散処理技術へのアクセスは簡単ではありません " ? Hadoop処理への期待は高まりつつありますが、Hadpp/MapReduceを使えるエンジ ニアが不足している " ? Talendは先進技術へのAPIを用意することで、No SQL DB、Hadoop、分散処理技術 を容易に活用できる環境を提供します。 API API API 開発者
  • 37. 37 ? Talend 2014 Talendがコネクトできるデータを処理?保存する技術
  • 38. 38 ? Talend 2014 Hadoopパワーを存分に使えます
  • 39. 39 ? Talend 2014 YARN(Yet Another Resource Negotiator) " ? Apacheのプロジェクトで、MapReduce2.0とも言われるが、 MapReduceのサポートだけではないのでYARNと呼ばれる " ? 任意の分散処理フレームワークやアプリケーションの作成を 容易にする新しいフレームワークである " ? YARNの実行モデルは、以前のMapReduceの実装よりも汎用 的である " ? YARNはオリジナルのApache HadoopのMapReduceとは異な り、MapReduceのモデルに従っていないアプリケーションを実 行可能 " ? YARNは、分散ファイルシステムとMapReduceの間に入る汎用 的なフレームワークである " ? MapReduceのようなフレームワークやプログラムに類似した、 あるいは全く違う新しいプログラムやアーキテクチャがHDFS を活用できるようになり、圧倒的な処理性能を得られる " ? 物理的な分散ファイルシステムとは違ったシステムインフラを 使える可能性がある " ? MapReduce1.0がサポートするノード数は4000程度だが、 YARNは10000程度までサポート 分散ファイルシステム(HDFS) MapReduce1.0 大量データの一括処理をする フレームワーク YARN 分散ファイルシステム(HDFS) MapReduce 大量データの一括処理をするフ レームワーク memory App
  • 40. 40 ? Talend 2014 TalendはYARNの上でもネイティブに動作します " ? Talendのツールで生成されるプログラムがjarファイルで生成されるため、JRE、MapReduce、 YARN上でネイティブに動作させることが可能 " ? DIエンジン、データクレンジングが圧倒的なパフォーマンスを発揮します " ? パフォーマンスが、分散環境のパフォーマンスに依存することになるため、高いパフォーマンスを 発揮可能 " ? 競合他社は、プログラムをOS上で稼働させるためハードウェアリソース(CPUやメモリー)の性能 特性に依存してしまう jar File Java SE CPU 5.2 競合他社 プログラム OS CPU YARN jar File Map Reduce Java SE 分散環境 CPU 5.4 jar File jar File jar File Map Reduce Java SE 分散 環境 CPU 5.3 jar File
  • 41. 41 ? Talend 2014 データ処理が飛躍的に速くなることで何が変わるのか?  " ? 流通業では n?? POSで集まる販売情報、販売情報に連動する配送システムや調達システム、最近では明日 の販売を予測するために気象情報なども想定して配送時間、配送商品の決定などを行ない ますが、これまではバッチ処理が多いため、タイムラグが発生していました。 n?? Talendを使えば、ほぼリアルタイムにデータを集め、瞬時にデータ処理して、配送システムや 調達システムにデータを渡すことができます。 " ? 製造業では n?? 製品を作る工場において、ラインの場所単位や製造機器単位で測定する湿度や温度などに 欠品率が左右される場合に、温度湿度情報を得て自動制御するには多くの投資が必要 n?? Talendを使えば、自動制御するよりも、温度湿度情報から得た欠品率を想定した部材の購入 量を瞬時に計算して調達量を変更することができる。 " ? 公共では n?? 橋梁や高速道路などにつけられた歪み計などの無線センサーから送信される分単位の差分 データを送る n?? Talendを使えば、差分データではなく、生データをリアルタイムに送ることで、通常データのト レンドと、異常データの差分が瞬時に判断して障害の予兆検知をすることができる
  • 42. 42 ? Talend 2014 Map処理、Reduce処理の実行を想定
  • 43. 43 ? Talend 2014 MapReduce Jobをビジュアル化して インフラの最適化をはかりコスト削減 " ? Talend製品(BigData)の開発ツール(Studio)の拡張で、開発者は設計したMap処理、 Reduce処理の実行想定をビジュアルで見ることができます " ? 並列度を設定できるので、パフォーマンスの最適化を図ることができます。
  • 44. 44 ? Talend 2014 オンプレミス環境とクラウド環境の橋渡し オンプレミス環境 クラウド環境
  • 45. 45 ? Talend 2014 配置とスケジュールは柔軟に クラウド環境でも、オンプレミス環境でも 北米 日本 ヨーロッパ オーストラリア シンガポール 中国
  • 46. 46 ? Talend 2014 親和性が高いビジネスモデル " Talend(DI/Big Data)のサブスクリプション ライセンスは、データ量、CPU数コア数等の システム規模に依存しない " 課金対象は、使用ユーザー数と使用年数 " サブスクリプションには、年間保守料金を 含む " 伸縮自在なクラウド上のシステム環境とし て最適なライセンスモデル
  • 47. 47 ? Talend 2014 Talend5.4の卓越した特長 YARN/Hadoop 数千ノード対応 No Batch リアルタイムバッチ 高速処理 500+ 多様なデータソース 業界最大 サポートプラットフォーム 多様性 Talend Studio コードジェネレート ハイブリッド環境 クラウド、オンプレミス ライセンスモデル 利用者単位 シンプル オープン(ソースソフトウェア+ビジネス)
  • 48. 48 ? Talend 2014 http://jp.talend.com https://www.facebook.com/TalendKK https://www.talend-bc.jp http://www.slideshare.net/talendkk/ https://twitter.com/talendKK http://www.youtube.com/user/TalendChannel 様々なメディアで情報提供開始予定
  • 49. 49 ? Talend 2014 Talendがコネクトできるデータを処理?保存する技術 Redshift No SQL DB Hadoop Technology インメモリーDB、DWH