2. Copyright ? Skywill inc. All Rights Reserved.
メンバ`B初
2
票表o
署ヨル
?I SE
?叨 リ`ダ
?javas10定
?macs1定
?バナナきらい
?I SE
?叨 メンバ`
?javas5定
?晩云s4定
?署袗晩の匚はWの晩
3. Copyright ? Skywill inc. All Rights Reserved.
朕議
3
Spark Streamingを聞喘して、
ウィンドウ鹿をやってみる。
4. Copyright ? Skywill inc. All Rights Reserved.
アジェンダ
4
1. Sparkって採
2. Spark Streamingとは?
3. g樹
4. g樹のまとめ
5. Copyright ? Skywill inc. All Rights Reserved.
アジェンダ
5
1. Sparkって採
2. Spark Streamingとは?
3. g樹
4. g樹のまとめ
6. Copyright ? Skywill inc. All Rights Reserved. 6
Sparkって採
?寄トデ`タの蛍柊I尖をオンメモリでgFする
クラスタ`コンピュ`ティングプラットフォ`ム。
?仝書瘁はHadoopのMapReduceよりも
Sparkが聞われるようになる々と冱われている。
Apache Spark
古勣
竃灸Apache Spark (https://ja.wikipedia.org/wiki/Apache_Spark)
Apache Spark? is a fast and general engine
for large-scale data processing.
竃灸Apache Spark (http://spark.apache.org)
7. 7
Sparkって採
淵薀ぅ屮薀
?SQLクエリI尖 仝Spark SQL々
?ストリ`ムI尖 仝Spark Streaming々
?C亠僥I尖 仝MLib々
?グラフI尖 仝Graph X々
SparkとHadoopのロジスティック指「I尖堀業曳^
麻Y惚をメモリにキャッシュする。
そのため、愔瓦MapReduceと曳べて
Rり卦し麻が互堀
I尖堀業
Copyright ? Skywill inc. All Rights Reserved.
竃灸The Apache Software Foundation http://spark.apache.org
15. Copyright ? Skywill inc. All Rights Reserved.
アジェンダ
15
1. Sparkって採
2. Spark Streamingとは?
3. g樹
4. g樹のまとめ
16. Copyright ? Skywill inc. All Rights Reserved.
Spark Streamingとは
16
?Sparkの淵薀ぅ屮薀蠅厘擦
?リアルタイムに送れている
ストリ`ムソ`スを玉いg侯でRり卦し、
バッチI尖する。
?iみ坤好僣`ク ストリ`ミング
竃灸The Apache Software Foundation http://spark.apache.org
17. Copyright ? Skywill inc. All Rights Reserved.
Spark Streamingとは
17
?Spark Streaming喘のRDDを
BAしてKべたもの
デ`タのやり函りはDstreamの
鞭け局しで佩う
喘Z
?reduceByKeyAndWindowを旋喘し、
岷除匯協rgの鹿を辛嬬にする
(庵襦扱屬瓦箸法岷除1rgの鹿を
するなど)
?デ`タ勣殆をeの侏のRDDに
Qする
?岷除のデ`タを函誼?鹿する
?キ`、離撻△RDDにQする
DStream
ウィンドウ鹿
v方flatMap
v方mapToPair
v方reduceByKeyAndWindow
18. Copyright ? Skywill inc. All Rights Reserved.
アジェンダ
18
1. Sparkって採
2. Spark Streamingとは?
3. g樹
4. g樹のまとめ
19. Copyright ? Skywill inc. All Rights Reserved.
g樹
19
こんなんつくってみる。
Twitterのハッシュタグから
Spark Streamingを聞喘した
リアルタイムトレンドランキングチャ`ト
Twitter
API
Spark
Streaming
Web鮫中
岷除60昼阿離肇譽鵐姫輅
20. Copyright ? Skywill inc. All Rights Reserved.
システム撹
20
デ`タの送れ
Twitter
API
Spark
Streaming
MySQL
Twitterストリ`ムからのメタデ`タ函誼
撻禰`タを盾裂し鹿
?ハッシュタグ
?盾裂gみワ`ド
?カウント