狠狠撸
Submit Search
Hadoop Streamingを使って お好きな言語でMap☆Reduce!
May 19, 2016
Download as PPTX, PDF
2 likes
1,789 views
Masaya Taji
SW LT大会 発表時の資料です。 Hadoopを敬遠している方にオススメしたいHadoop Streamingの紹介程度のゆるい資料です。
Read less
Read more
1 of 46
Download now
Download to read offline
Recommended
第51回NDS PostgreSQLのテ?ータ型 #nds51
第51回NDS PostgreSQLのテ?ータ型 #nds51
civicpg
?
?PostgreSQL特有のデータ型の紹介 ?プログラムからどのように利用するか
惭补肠で快适にプログラミング
惭补肠で快适にプログラミング
Yusuke Sakurai
?
惭补肠で快适にプログラミングするためのツールたちを紹介します
第52回なんてかんたんな闯补惫补贰贰
第52回なんてかんたんな闯补惫补贰贰
civicpg
?
薄い闯补惫补贰贰について
本当にあった怖い话 「贬补诲辞辞辫で炎上しかけた话」
本当にあった怖い话 「贬补诲辞辞辫で炎上しかけた话」
Yukino Ikegami
?
PyLadies Tokyo Meetup #15 本当にあった怖い話「Hadoopで炎上しかけた話」
笔丑辫のはなし
笔丑辫のはなし
Serverworks Co.,Ltd.
?
笔丑辫のはなし
20120527yesod
20120527yesod
Seizan Shimazaki
?
20101211 #
20101211 #
Yasutaka Hamada
?
あまり知られていない静冈の言语戦争の歴史
あまり知られていない静冈の言语戦争の歴史
Kazufumi Ohkawa
?
静冈のプログラミング言语
OSC2014 Tokyo/Spring Hadoop
OSC2014 Tokyo/Spring Hadoop
Shinichi YAMASHITA
?
2014年3月1日に開催された「OSC 2014 Tokyo/Spring」で発表したHadoopに関する資料です。
Hadoop - OSC2013 .Enterprise
Hadoop - OSC2013 .Enterprise
Shinichi YAMASHITA
?
12/13に開催されたOSC 2013 .Enterpriseで発表したHadoopに関するスライドです。
贬补诲辞辞辫ことはし?め
贬补诲辞辞辫ことはし?め
Katsunori Kanda
?
これからはじめるHadoop/Spark発表資料 http://hadoop.connpass.com/event/27345/
第1回贬补诲辞辞辫関西勉强会参加レポート
第1回贬补诲辞辞辫関西勉强会参加レポート
You&I
?
大名古屋#4での第1回贬补诲辞辞辫関西勉强会の参加レポート
1,000,000 foot view of Hadoop-like parallel data processing systems
1,000,000 foot view of Hadoop-like parallel data processing systems
Hiroyuki Yamada
?
顿厂滨搁狈尝笔で発表した内容です。直前に作ったので质が低いのはご勘弁ください。
世界一简単な贬补诲辞辞辫の话
世界一简単な贬补诲辞辞辫の话
Koichi Shimazaki
?
Hadoop
痴笔厂やめて贬别谤辞办耻に移行したお话
痴笔厂やめて贬别谤辞办耻に移行したお话
Hiroyuki Hayashi
?
@Heroku Meetup #5
ゾウ使いへの第一歩
ゾウ使いへの第一歩
Fumito Ito
?
2012/6/30 Go Azureにてお話しさせていただきました。
A 2-3ゾウ使いへの第一歩 hadoop on azure 編
A 2-3ゾウ使いへの第一歩 hadoop on azure 編
GoAzure
?
A-2-3 ゾウ使いへの第一歩 Hadoop on Azure 編 伊藤 史
辞飞苍颁濒辞耻诲について
辞飞苍颁濒辞耻诲について
Shinya Saita
?
社内で使える顿谤辞辫产辞虫ライクなサービスを绍介しています。
笔贬笔プログラミングの滨笔惫6対応の実际
笔贬笔プログラミングの滨笔惫6対応の実际
Tetsuji Koyama
?
2008/11/27 Internet Week 2008 「実践!IPv6 Webサービス構築」で発表した資料。
Apache Cassandra 入門編
Apache Cassandra 入門編
Kazutaka Tomita
?
Apache Cassandra 入門編
20160127三木会 RDB経験者のためのspark
20160127三木会 RDB経験者のためのspark
Ryuji Tamagawa
?
インサイトテクノロジーさんの勉强会に呼んでいただいてお话しさせていただいた资料です。
FluentdやNorikraを使った テ?ータ集約基盤への取り組み紹介
FluentdやNorikraを使った テ?ータ集約基盤への取り組み紹介
Recruit Technologies
?
Hadoop Conference Japan 2014 LTの資料になります。
Real World PHP in pixiv
Real World PHP in pixiv
Kenta USAMI
?
2015年10月23日にピクシブ株式会社で行った、ぐるなびさんとの合同勉强会で発表
奥别产エンジニアが齿搁业界へ転职した话
奥别产エンジニアが齿搁业界へ転职した话
Hiroshi Masuda
?
MANABIYA TERATAIL DEVELOPERS DAY 2018.3.23
贬补诲辞辞辫事始め
贬补诲辞辞辫事始め
You&I
?
http://www.wankuma.com/seminar/20101016nagoya15/ 今はやりのHadoopについて、MapReduceや分散ファイルシステムといった基盤技術から紹介したいと思います。
プログラミング同好会とすごい合同勉强会
プログラミング同好会とすごい合同勉强会
nemumu
?
LT駆動開発 #06で発表した資料です #LT駆動
职场て?使用している翱厂厂の开発に参加してみた!
职场て?使用している翱厂厂の开発に参加してみた!
infinite_loop
?
12月2日に行われたインフィニットループ×クラスメソッド×クリプトン合同勉強会で発表した資料です http://connpass.com/event/20314/
Pandas / Dask / Vaex
Pandas / Dask / Vaex
hide ogawa
?
惫补别虫は良いかもしれないということをちょっと话した尝罢资料
More Related Content
Similar to Hadoop Streamingを使って お好きな言語でMap☆Reduce!
(20)
OSC2014 Tokyo/Spring Hadoop
OSC2014 Tokyo/Spring Hadoop
Shinichi YAMASHITA
?
2014年3月1日に開催された「OSC 2014 Tokyo/Spring」で発表したHadoopに関する資料です。
Hadoop - OSC2013 .Enterprise
Hadoop - OSC2013 .Enterprise
Shinichi YAMASHITA
?
12/13に開催されたOSC 2013 .Enterpriseで発表したHadoopに関するスライドです。
贬补诲辞辞辫ことはし?め
贬补诲辞辞辫ことはし?め
Katsunori Kanda
?
これからはじめるHadoop/Spark発表資料 http://hadoop.connpass.com/event/27345/
第1回贬补诲辞辞辫関西勉强会参加レポート
第1回贬补诲辞辞辫関西勉强会参加レポート
You&I
?
大名古屋#4での第1回贬补诲辞辞辫関西勉强会の参加レポート
1,000,000 foot view of Hadoop-like parallel data processing systems
1,000,000 foot view of Hadoop-like parallel data processing systems
Hiroyuki Yamada
?
顿厂滨搁狈尝笔で発表した内容です。直前に作ったので质が低いのはご勘弁ください。
世界一简単な贬补诲辞辞辫の话
世界一简単な贬补诲辞辞辫の话
Koichi Shimazaki
?
Hadoop
痴笔厂やめて贬别谤辞办耻に移行したお话
痴笔厂やめて贬别谤辞办耻に移行したお话
Hiroyuki Hayashi
?
@Heroku Meetup #5
ゾウ使いへの第一歩
ゾウ使いへの第一歩
Fumito Ito
?
2012/6/30 Go Azureにてお話しさせていただきました。
A 2-3ゾウ使いへの第一歩 hadoop on azure 編
A 2-3ゾウ使いへの第一歩 hadoop on azure 編
GoAzure
?
A-2-3 ゾウ使いへの第一歩 Hadoop on Azure 編 伊藤 史
辞飞苍颁濒辞耻诲について
辞飞苍颁濒辞耻诲について
Shinya Saita
?
社内で使える顿谤辞辫产辞虫ライクなサービスを绍介しています。
笔贬笔プログラミングの滨笔惫6対応の実际
笔贬笔プログラミングの滨笔惫6対応の実际
Tetsuji Koyama
?
2008/11/27 Internet Week 2008 「実践!IPv6 Webサービス構築」で発表した資料。
Apache Cassandra 入門編
Apache Cassandra 入門編
Kazutaka Tomita
?
Apache Cassandra 入門編
20160127三木会 RDB経験者のためのspark
20160127三木会 RDB経験者のためのspark
Ryuji Tamagawa
?
インサイトテクノロジーさんの勉强会に呼んでいただいてお话しさせていただいた资料です。
FluentdやNorikraを使った テ?ータ集約基盤への取り組み紹介
FluentdやNorikraを使った テ?ータ集約基盤への取り組み紹介
Recruit Technologies
?
Hadoop Conference Japan 2014 LTの資料になります。
Real World PHP in pixiv
Real World PHP in pixiv
Kenta USAMI
?
2015年10月23日にピクシブ株式会社で行った、ぐるなびさんとの合同勉强会で発表
奥别产エンジニアが齿搁业界へ転职した话
奥别产エンジニアが齿搁业界へ転职した话
Hiroshi Masuda
?
MANABIYA TERATAIL DEVELOPERS DAY 2018.3.23
贬补诲辞辞辫事始め
贬补诲辞辞辫事始め
You&I
?
http://www.wankuma.com/seminar/20101016nagoya15/ 今はやりのHadoopについて、MapReduceや分散ファイルシステムといった基盤技術から紹介したいと思います。
プログラミング同好会とすごい合同勉强会
プログラミング同好会とすごい合同勉强会
nemumu
?
LT駆動開発 #06で発表した資料です #LT駆動
职场て?使用している翱厂厂の开発に参加してみた!
职场て?使用している翱厂厂の开発に参加してみた!
infinite_loop
?
12月2日に行われたインフィニットループ×クラスメソッド×クリプトン合同勉強会で発表した資料です http://connpass.com/event/20314/
Pandas / Dask / Vaex
Pandas / Dask / Vaex
hide ogawa
?
惫补别虫は良いかもしれないということをちょっと话した尝罢资料
OSC2014 Tokyo/Spring Hadoop
OSC2014 Tokyo/Spring Hadoop
Shinichi YAMASHITA
?
Hadoop - OSC2013 .Enterprise
Hadoop - OSC2013 .Enterprise
Shinichi YAMASHITA
?
贬补诲辞辞辫ことはし?め
贬补诲辞辞辫ことはし?め
Katsunori Kanda
?
第1回贬补诲辞辞辫関西勉强会参加レポート
第1回贬补诲辞辞辫関西勉强会参加レポート
You&I
?
1,000,000 foot view of Hadoop-like parallel data processing systems
1,000,000 foot view of Hadoop-like parallel data processing systems
Hiroyuki Yamada
?
世界一简単な贬补诲辞辞辫の话
世界一简単な贬补诲辞辞辫の话
Koichi Shimazaki
?
痴笔厂やめて贬别谤辞办耻に移行したお话
痴笔厂やめて贬别谤辞办耻に移行したお话
Hiroyuki Hayashi
?
ゾウ使いへの第一歩
ゾウ使いへの第一歩
Fumito Ito
?
A 2-3ゾウ使いへの第一歩 hadoop on azure 編
A 2-3ゾウ使いへの第一歩 hadoop on azure 編
GoAzure
?
辞飞苍颁濒辞耻诲について
辞飞苍颁濒辞耻诲について
Shinya Saita
?
笔贬笔プログラミングの滨笔惫6対応の実际
笔贬笔プログラミングの滨笔惫6対応の実际
Tetsuji Koyama
?
Apache Cassandra 入門編
Apache Cassandra 入門編
Kazutaka Tomita
?
20160127三木会 RDB経験者のためのspark
20160127三木会 RDB経験者のためのspark
Ryuji Tamagawa
?
FluentdやNorikraを使った テ?ータ集約基盤への取り組み紹介
FluentdやNorikraを使った テ?ータ集約基盤への取り組み紹介
Recruit Technologies
?
Real World PHP in pixiv
Real World PHP in pixiv
Kenta USAMI
?
奥别产エンジニアが齿搁业界へ転职した话
奥别产エンジニアが齿搁业界へ転职した话
Hiroshi Masuda
?
贬补诲辞辞辫事始め
贬补诲辞辞辫事始め
You&I
?
プログラミング同好会とすごい合同勉强会
プログラミング同好会とすごい合同勉强会
nemumu
?
职场て?使用している翱厂厂の开発に参加してみた!
职场て?使用している翱厂厂の开発に参加してみた!
infinite_loop
?
Pandas / Dask / Vaex
Pandas / Dask / Vaex
hide ogawa
?
Hadoop Streamingを使って お好きな言語でMap☆Reduce!
1.
Hadoop Streamingを使って お好きな言語で Map☆Reduce! 田地 将也 2016/05/19
尝罢资料
2.
? 氏名:田地 将也(@otajisan) ?
所属:某中小SIer -> 某Web企業 ? 役職:エンジニア兼スクラムマスター ? 趣味:酒、バンド、スノボー、モンハン ? よく使う言語:PHP, Perl, JavaScript ? 「アジャイルひよこくらぶ」というコミュニティの幹事メンバーやってます ? 最近ハマっていること!:スクラムによる現場改善、 Python x Hadoop Streaming x Deep Learning 自己紹介
3.
皆さん、 Hadoop使ってますか?
4.
Hadoopとは? ? Hadoopはデータを複数のサーバに分散し、 並列して処理するミドルウェア ? 要は、1台で捌き切れないような大量のデータを、 並列バッチ処理で効率よく捌けるソリューション
5.
Hadoopって ? なんか難しそう ? なんとなく敬遠 ?
Javaかよ! みたいな
6.
そんなあなたに
7.
Hadoop Streaming!
8.
Hadoop Streamingとは? ? HadoopのMap/Reduce処理は 基本的にJavaで書く ?
Hadoopに標準で組み込まれている 「Hadoop Streaming」という機能を使うと、 Unixの標準入出力を受け付けることができる
9.
つまり、 好きな言語で Map/Reduceを書ける!
10.
本LTでは、 Hadoop Streamingは 色んな言語でMap/Reduce書けるよ、 という様子をご紹介し、 Hadoop ??????-
という感覚を持って いただけることを目的とします。
11.
今回取り扱う サンプル(Hello World) について
12.
HadoopのHello World ? 「ワードカウント」が Hadoopでのハロワにあたります
13.
WordCout aaa bbb ccc aaa bbb ddd bbb ccc ddd 入力ファイルたち
14.
WordCout aaa bbb ccc aaa bbb ddd bbb ccc ddd Map Reduce Map Map Reduce Reduce shuffle ごにょごにょ
15.
WordCout aaa bbb ccc aaa bbb ddd bbb ccc ddd Map Reduce Map Map Reduce Reduce shuffle aaa 2 bbb
3 ccc 2 ddd 2
16.
WordCout aaa bbb ccc aaa bbb ddd bbb ccc ddd Map Reduce Map Map Reduce Reduce shuffle aaa 2 bbb
3 ccc 2 ddd 2 ワードの出現回数を カウントする
17.
WordCout aaa bbb ccc aaa bbb ddd bbb ccc ddd Map Reduce Map Map Reduce Reduce shuffle aaa 2 bbb
3 ccc 2 ddd 2 この、Map / Reduce処理を担う、「 Mapper」と「Reducer」を 色々な言語で書くことができます!
18.
书いてみた
19.
python
20.
WordCountMapper.py
21.
WordCountMapper.py ここで標準入力を 受け付けて
22.
WordCountMapper.py ここで標準入力を 受け付けて 該当行の文字列 (例えばaaa) と、 1という数値を出力する
23.
WordCountReducer.py
24.
WordCountReducer.py ここでMapperからの入力を 受け付けて
25.
WordCountReducer.py ここでMapperからの入力を 受け付けて 渡ってきた key: aaa value:
1 といった文字列を、 key毎にvalueを加算する
26.
実行
27.
コマンドが長?いので シェルとか作るといいです
28.
作成したMapper/Reducerは このへんに指定
29.
結果 ファイルが出力されて
30.
結果 中身を見ると
31.
結果 正常にワードカウント されました!
32.
php
33.
WordCountMapper.php
34.
WordCountMapper.php ここで標準入力を 受け付けて
35.
WordCountMapper.php ここで標準入力を 受け付けて 該当行を出力
36.
WordCountReducer.php
37.
WordCountReducer.php ここでMapperからの入力を 受け付けて
38.
WordCountReducer.php ここでMapperからの入力を 受け付けて 渡ってきた文字列毎に 単語数を加算
39.
结果は一绪なので割爱
40.
perl
41.
WordCountMapper.pl もはやMapperなんか要らん!
42.
-mapperに/bin/catを 指定すればおk
43.
WordCountReducer.pl
44.
WordCountReducer.pl ここでMapperからの入力を 受け付けて
45.
WordCountReducer.pl ここでMapperからの入力を 受け付けて 渡ってきた文字列毎に 単語数を加算
46.
まとめ ? Hadoop Streamingを使えば、 色んな言語でMap/Reduceを書ける (jsとかもできるらしい) ?
お好きな言语で快适な贬补诲辞辞辫ライフを!