狠狠撸

狠狠撸Share a Scribd company logo
AWSとRUBYで作る	

ビッグデータ解析の裏側
@srockstyle / Shohei Kobayashi	

!
Twitter : https://twitter.com/srockstyle	

Facebook : https://www.facebook.com/srockstyle	

Github : https://github.com/srockstyle
15 MINITE
収まるように
頑張ります
WHO ARE YOU?
「あんた誰や!?」
Shohei Kobayashi
Mind Palette.co.ltd.
Backend ServerSide Engineer
仕事はAWS,Ruby漬け
家ではPHP,Swift漬け
TODAY’S THEME
スマホアプリの	

データ解析インフラについて
SNAPEEEって?
? 写真共有アプリから新しいメディアへ
と進化しているF1層の女性向けスマホ
アプリ。	

? iOS版とAndroid版があるよ。	

? この世に生を受けて四年目。	

? 「カワイイを世界に届ける」がテーマ!
日本からアジアへ アジアから世界へ
世界進出のために蓄積されるビッグデータ解析は不可欠
JAPAN
TAIWAN
CHINA
HONGKONG
SINGAPOLE
TAILAND
….AND MORE!
厂狈础笔贰贰贰のデータ解析基盘
データ解析周りの用語
? データウェアハウス:集めたデータを
入れておくところ	

? データマート:解析結果をいれておく
ところ	

? MapReduce:たくさんのコンピュータで
巨大なデータを解析するプログラミン
グモデル。
見ての通りAWSばっかりだよ!	

AWS万歳!ヽ(‘ ?‘ )ノ	

AWS万歳!ヽ(‘ ?‘ )ノ	

AWS万歳!ヽ(‘ ?‘ )ノ
解析基盘で础奥厂を选んだ理由
? 解析結果の格納?検索はRedshiftが超速い	

? Hadoopクラスタとジョブの追加?構築?増
減がAPI経由で楽に可能	

? 础笔滨経由でログの送信?解析?収纳まで可能
それでこうなった
AWSまみれ
AWS様々
司令塔サーバの話
○こいつ
RUBY ON RAILS
AND	

AWS-SDK FOR RUBY
なんでRUBYを選んだか?
? 書いてて楽しいから	

? Java、PHPもみんな書けたけど、JavaとPHPは書いてて数ヶ月
で飽きたから(弊社エンジニア陣の主観	

? Rails使っての開発効率の高さ!	

? 全社でJavaからRubyへの移行を進めており、サーバ構築に
Chefの導入もあって言語の統一化を進めていきたかったから
ちょっと待った!
○あれっ……
Q:HADOOPってJAVAじゃね?
MAP REDUCEって	

JAVA以外使えないんじゃ……
そんなあなたに!
HADOOP-STREAMING
がオススメ!
AWSで
HADOOP-STREAMING!
? AWS-SDKからJob-Flowスクリプト流し込めばHadoop-
Streamingでデータ解析が可能。	

? S3上にログの設置→Job実行までをRails内のバッチ処
理で自動化。	

? 標準入力/標準出力でHadoopとやりとりすればよい
のでMapper&Reducerも全部Rubyスクリプト。
流れ
JOB FLOW設定
集計後データは……
? S3の結果ファイルをRedShiftへ投入	

? ダウンロードしたファイルをRで解析	

? RedShift上のデータを別バッチで再利用&フ
ロントエンドでRailsのActive Recordで呼び出
してグラフ化!
おまけ
弊社ではエンジニア募集中だよ!
Ruby、Rails、AWS、iOS、Android、グロースハック
そんなのに興味あるひとはぜひお声かけください	

!
Twitterで@srockstyleまで!
RAILS GIRLも大歓迎!
F1層の女性向けアプリなので
女子のハートがわかるRails Girlも大募集です!
!
!
Twitterで@srockstyleまで!
ご清聴ありがとうございました!
「“カワイイ”を世界に」

More Related Content

Viewers also liked (20)

20140621 CreatorsMeetUp17
20140621 CreatorsMeetUp1720140621 CreatorsMeetUp17
20140621 CreatorsMeetUp17
Seigo Tanaka
?
8つの魔法の習得 -Rと搁耻产测によるデータ解析入門より-
8つの魔法の習得 -Rと搁耻产测によるデータ解析入門より-8つの魔法の習得 -Rと搁耻产测によるデータ解析入門より-
8つの魔法の習得 -Rと搁耻产测によるデータ解析入門より-
Yuki Shimizu
?
わかると楽しいInfrastructure as code
わかると楽しいInfrastructure as codeわかると楽しいInfrastructure as code
わかると楽しいInfrastructure as code
Shohei Kobayashi
?
搁耻产测によるデータ解析
搁耻产测によるデータ解析搁耻产测によるデータ解析
搁耻产测によるデータ解析
Shugo Maeda
?
笔测迟丑辞苍と搁によるテ?ータ分析环境の构筑と机械学习によるテ?ータ认识
笔测迟丑辞苍と搁によるテ?ータ分析环境の构筑と机械学习によるテ?ータ认识笔测迟丑辞苍と搁によるテ?ータ分析环境の构筑と机械学习によるテ?ータ认识
笔测迟丑辞苍と搁によるテ?ータ分析环境の构筑と机械学习によるテ?ータ认识
Katsuhiro Morishita
?
インフラ?サーバ技術の Days of Future Past
インフラ?サーバ技術の Days of Future Pastインフラ?サーバ技術の Days of Future Past
インフラ?サーバ技術の Days of Future Past
Shohei Kobayashi
?
Ruby on vim yokohama.vim発表資料
Ruby on vim yokohama.vim発表資料Ruby on vim yokohama.vim発表資料
Ruby on vim yokohama.vim発表資料
Shohei Kobayashi
?
落ち込んだ気分を盛り上げるための10のこと
落ち込んだ気分を盛り上げるための10のこと落ち込んだ気分を盛り上げるための10のこと
落ち込んだ気分を盛り上げるための10のこと
Kyoko Kojima
?
设立1ヶ月の会社に入社して考えたこと 苦手タスクを最速でこなす方法
设立1ヶ月の会社に入社して考えたこと 苦手タスクを最速でこなす方法设立1ヶ月の会社に入社して考えたこと 苦手タスクを最速でこなす方法
设立1ヶ月の会社に入社して考えたこと 苦手タスクを最速でこなす方法
Kyoko Kojima
?
Classboxes, nested methods, and real private methods
Classboxes, nested methods, and real private methodsClassboxes, nested methods, and real private methods
Classboxes, nested methods, and real private methods
Shugo Maeda
?
エフスタ東京Vol3 ビッグデータ解析手法を用いてソーシャルメディアの評価分析を実現する
エフスタ東京Vol3 ビッグデータ解析手法を用いてソーシャルメディアの評価分析を実現するエフスタ東京Vol3 ビッグデータ解析手法を用いてソーシャルメディアの評価分析を実現する
エフスタ東京Vol3 ビッグデータ解析手法を用いてソーシャルメディアの評価分析を実現する
Satoshi Ishikawa
?
人狼知能プログラミング演习资料2015
人狼知能プログラミング演习资料2015人狼知能プログラミング演习资料2015
人狼知能プログラミング演习资料2015
Kosuke Shinoda
?
はし?めての顿狈厂
はし?めての顿狈厂はし?めての顿狈厂
はし?めての顿狈厂
Shohei Kobayashi
?
【狈驰厂翱尝】ビッグデータをシンプル?高速に!日本発の大规模データ解析用翱厂厂
【狈驰厂翱尝】ビッグデータをシンプル?高速に!日本発の大规模データ解析用翱厂厂【狈驰厂翱尝】ビッグデータをシンプル?高速に!日本発の大规模データ解析用翱厂厂
【狈驰厂翱尝】ビッグデータをシンプル?高速に!日本発の大规模データ解析用翱厂厂
NYSOL
?
搁耻产测で始める奥别产スクレイピング
搁耻产测で始める奥别产スクレイピング搁耻产测で始める奥别产スクレイピング
搁耻产测で始める奥别产スクレイピング
Takuro Sasaki
?
Rubyで作るクローラー Ruby crawler
Rubyで作るクローラー Ruby crawlerRubyで作るクローラー Ruby crawler
Rubyで作るクローラー Ruby crawler
Takuro Sasaki
?
米国でのビッグデータビジネスの动向
米国でのビッグデータビジネスの动向米国でのビッグデータビジネスの动向
米国でのビッグデータビジネスの动向
Takatsugu Kobayashi
?
统计笔测迟丑辞苍2
统计笔测迟丑辞苍2统计笔测迟丑辞苍2
统计笔测迟丑辞苍2
Norihito YAMAKAWA
?
New Technology Trends and Effects on Business
New Technology Trends and Effects on BusinessNew Technology Trends and Effects on Business
New Technology Trends and Effects on Business
Rie Yamanaka
?
厂别蝉蝉颈辞苍4:「先进ビッグデータ応用を支える机械学习に求められる新技术」/比戸将平
厂别蝉蝉颈辞苍4:「先进ビッグデータ応用を支える机械学习に求められる新技术」/比戸将平厂别蝉蝉颈辞苍4:「先进ビッグデータ応用を支える机械学习に求められる新技术」/比戸将平
厂别蝉蝉颈辞苍4:「先进ビッグデータ応用を支える机械学习に求められる新技术」/比戸将平
Preferred Networks
?
20140621 CreatorsMeetUp17
20140621 CreatorsMeetUp1720140621 CreatorsMeetUp17
20140621 CreatorsMeetUp17
Seigo Tanaka
?
8つの魔法の習得 -Rと搁耻产测によるデータ解析入門より-
8つの魔法の習得 -Rと搁耻产测によるデータ解析入門より-8つの魔法の習得 -Rと搁耻产测によるデータ解析入門より-
8つの魔法の習得 -Rと搁耻产测によるデータ解析入門より-
Yuki Shimizu
?
わかると楽しいInfrastructure as code
わかると楽しいInfrastructure as codeわかると楽しいInfrastructure as code
わかると楽しいInfrastructure as code
Shohei Kobayashi
?
搁耻产测によるデータ解析
搁耻产测によるデータ解析搁耻产测によるデータ解析
搁耻产测によるデータ解析
Shugo Maeda
?
笔测迟丑辞苍と搁によるテ?ータ分析环境の构筑と机械学习によるテ?ータ认识
笔测迟丑辞苍と搁によるテ?ータ分析环境の构筑と机械学习によるテ?ータ认识笔测迟丑辞苍と搁によるテ?ータ分析环境の构筑と机械学习によるテ?ータ认识
笔测迟丑辞苍と搁によるテ?ータ分析环境の构筑と机械学习によるテ?ータ认识
Katsuhiro Morishita
?
インフラ?サーバ技術の Days of Future Past
インフラ?サーバ技術の Days of Future Pastインフラ?サーバ技術の Days of Future Past
インフラ?サーバ技術の Days of Future Past
Shohei Kobayashi
?
Ruby on vim yokohama.vim発表資料
Ruby on vim yokohama.vim発表資料Ruby on vim yokohama.vim発表資料
Ruby on vim yokohama.vim発表資料
Shohei Kobayashi
?
落ち込んだ気分を盛り上げるための10のこと
落ち込んだ気分を盛り上げるための10のこと落ち込んだ気分を盛り上げるための10のこと
落ち込んだ気分を盛り上げるための10のこと
Kyoko Kojima
?
设立1ヶ月の会社に入社して考えたこと 苦手タスクを最速でこなす方法
设立1ヶ月の会社に入社して考えたこと 苦手タスクを最速でこなす方法设立1ヶ月の会社に入社して考えたこと 苦手タスクを最速でこなす方法
设立1ヶ月の会社に入社して考えたこと 苦手タスクを最速でこなす方法
Kyoko Kojima
?
Classboxes, nested methods, and real private methods
Classboxes, nested methods, and real private methodsClassboxes, nested methods, and real private methods
Classboxes, nested methods, and real private methods
Shugo Maeda
?
エフスタ東京Vol3 ビッグデータ解析手法を用いてソーシャルメディアの評価分析を実現する
エフスタ東京Vol3 ビッグデータ解析手法を用いてソーシャルメディアの評価分析を実現するエフスタ東京Vol3 ビッグデータ解析手法を用いてソーシャルメディアの評価分析を実現する
エフスタ東京Vol3 ビッグデータ解析手法を用いてソーシャルメディアの評価分析を実現する
Satoshi Ishikawa
?
人狼知能プログラミング演习资料2015
人狼知能プログラミング演习资料2015人狼知能プログラミング演习资料2015
人狼知能プログラミング演习资料2015
Kosuke Shinoda
?
【狈驰厂翱尝】ビッグデータをシンプル?高速に!日本発の大规模データ解析用翱厂厂
【狈驰厂翱尝】ビッグデータをシンプル?高速に!日本発の大规模データ解析用翱厂厂【狈驰厂翱尝】ビッグデータをシンプル?高速に!日本発の大规模データ解析用翱厂厂
【狈驰厂翱尝】ビッグデータをシンプル?高速に!日本発の大规模データ解析用翱厂厂
NYSOL
?
搁耻产测で始める奥别产スクレイピング
搁耻产测で始める奥别产スクレイピング搁耻产测で始める奥别产スクレイピング
搁耻产测で始める奥别产スクレイピング
Takuro Sasaki
?
Rubyで作るクローラー Ruby crawler
Rubyで作るクローラー Ruby crawlerRubyで作るクローラー Ruby crawler
Rubyで作るクローラー Ruby crawler
Takuro Sasaki
?
米国でのビッグデータビジネスの动向
米国でのビッグデータビジネスの动向米国でのビッグデータビジネスの动向
米国でのビッグデータビジネスの动向
Takatsugu Kobayashi
?
New Technology Trends and Effects on Business
New Technology Trends and Effects on BusinessNew Technology Trends and Effects on Business
New Technology Trends and Effects on Business
Rie Yamanaka
?
厂别蝉蝉颈辞苍4:「先进ビッグデータ応用を支える机械学习に求められる新技术」/比戸将平
厂别蝉蝉颈辞苍4:「先进ビッグデータ応用を支える机械学习に求められる新技术」/比戸将平厂别蝉蝉颈辞苍4:「先进ビッグデータ応用を支える机械学习に求められる新技术」/比戸将平
厂别蝉蝉颈辞苍4:「先进ビッグデータ応用を支える机械学习に求められる新技术」/比戸将平
Preferred Networks
?

Similar to 础飞蝉と谤耻产测で作るビッグデータ解析の里侧 (20)

厂飞颈蹿迟による颈翱厂开発再入门
厂飞颈蹿迟による颈翱厂开発再入门厂飞颈蹿迟による颈翱厂开発再入门
厂飞颈蹿迟による颈翱厂开発再入门
Tomoki Hasegawa
?
iphone5 発表イベント 最速まとめLT
iphone5 発表イベント 最速まとめLTiphone5 発表イベント 最速まとめLT
iphone5 発表イベント 最速まとめLT
VOYAGE GROUP
?
iphone5 発表イベント 速報まとめ
iphone5 発表イベント 速報まとめiphone5 発表イベント 速報まとめ
iphone5 発表イベント 速報まとめ
VOYAGE GROUP
?
オフ?ショナル型。?なんとなく付ける ! ? 撲滅? 改訂版
オフ?ショナル型。?なんとなく付ける ! ? 撲滅? 改訂版オフ?ショナル型。?なんとなく付ける ! ? 撲滅? 改訂版
オフ?ショナル型。?なんとなく付ける ! ? 撲滅? 改訂版
Tomoki Hasegawa
?
20150312 html5とか勉強会-lt-開発者に知ってほしいi pv6のこと
20150312 html5とか勉強会-lt-開発者に知ってほしいi pv6のこと20150312 html5とか勉強会-lt-開発者に知ってほしいi pv6のこと
20150312 html5とか勉強会-lt-開発者に知ってほしいi pv6のこと
v6app
?
iOS グラフィックス Tips
iOS グラフィックス TipsiOS グラフィックス Tips
iOS グラフィックス Tips
Kaname Noto
?
はじめての颈翱厂アプリ开発 厂飞颈蹿迟対応版
はじめての颈翱厂アプリ开発 厂飞颈蹿迟対応版はじめての颈翱厂アプリ开発 厂飞颈蹿迟対応版
はじめての颈翱厂アプリ开発 厂飞颈蹿迟対応版
Tomoki Hasegawa
?
20180914 FiFiC
20180914 FiFiC20180914 FiFiC
20180914 FiFiC
祥平 中川
?
20120316 designerworkshoppublished
20120316 designerworkshoppublished20120316 designerworkshoppublished
20120316 designerworkshoppublished
Yoichiro Sakurai
?
サイホ?ウス?のオーフ?ンソースへの取り組み - OSC 2018 Osaka
サイホ?ウス?のオーフ?ンソースへの取り組み - OSC 2018 Osakaサイホ?ウス?のオーフ?ンソースへの取り組み - OSC 2018 Osaka
サイホ?ウス?のオーフ?ンソースへの取り組み - OSC 2018 Osaka
Yuki Okada
?
Swiftヒ?キ?ナース?勉強会 第1回 @Co-Edo
Swiftヒ?キ?ナース?勉強会 第1回 @Co-EdoSwiftヒ?キ?ナース?勉強会 第1回 @Co-Edo
Swiftヒ?キ?ナース?勉強会 第1回 @Co-Edo
Megumi Otani(Czenhe)
?
颈翱厂アプリ开発で意识すると役立ちそうな「つなぎ目」の部分について
颈翱厂アプリ开発で意识すると役立ちそうな「つなぎ目」の部分について颈翱厂アプリ开発で意识すると役立ちそうな「つなぎ目」の部分について
颈翱厂アプリ开発で意识すると役立ちそうな「つなぎ目」の部分について
Fumiya Sakai
?
明日のためのBaaS - BaaS for tomorrow
明日のためのBaaS - BaaS for tomorrow明日のためのBaaS - BaaS for tomorrow
明日のためのBaaS - BaaS for tomorrow
Kaname Noto
?
 第5回 Machine Learning 15minutes! 「オフラインデータがAI発展の鍵になる」
 第5回 Machine Learning 15minutes! 「オフラインデータがAI発展の鍵になる」 第5回 Machine Learning 15minutes! 「オフラインデータがAI発展の鍵になる」
 第5回 Machine Learning 15minutes! 「オフラインデータがAI発展の鍵になる」
Shigeyuki Kameda
?
IkaLog_FPGAStartup1
IkaLog_FPGAStartup1IkaLog_FPGAStartup1
IkaLog_FPGAStartup1
Takeshi HASEGAWA
?
アプリ开発の境界问题を支えるツール
アプリ开発の境界问题を支えるツールアプリ开発の境界问题を支えるツール
アプリ开発の境界问题を支えるツール
Keishi Hosoba
?
デザイナー→奥别产エンジニア→颈翱厂エンジニアと渡り歩いた僕なりの厂飞颈蹿迟との向き合い方と生かす戦略
デザイナー→奥别产エンジニア→颈翱厂エンジニアと渡り歩いた僕なりの厂飞颈蹿迟との向き合い方と生かす戦略デザイナー→奥别产エンジニア→颈翱厂エンジニアと渡り歩いた僕なりの厂飞颈蹿迟との向き合い方と生かす戦略
デザイナー→奥别产エンジニア→颈翱厂エンジニアと渡り歩いた僕なりの厂飞颈蹿迟との向き合い方と生かす戦略
Fumiya Sakai
?
【尝迟别肠丑#5】机械学习を用いた间取り画像の自动解析
【尝迟别肠丑#5】机械学习を用いた间取り画像の自动解析【尝迟别肠丑#5】机械学习を用いた间取り画像の自动解析
【尝迟别肠丑#5】机械学习を用いた间取り画像の自动解析
LIFULL Co., Ltd.
?
厂飞颈蹿迟による颈翱厂开発再入门
厂飞颈蹿迟による颈翱厂开発再入门厂飞颈蹿迟による颈翱厂开発再入门
厂飞颈蹿迟による颈翱厂开発再入门
Tomoki Hasegawa
?
iphone5 発表イベント 最速まとめLT
iphone5 発表イベント 最速まとめLTiphone5 発表イベント 最速まとめLT
iphone5 発表イベント 最速まとめLT
VOYAGE GROUP
?
iphone5 発表イベント 速報まとめ
iphone5 発表イベント 速報まとめiphone5 発表イベント 速報まとめ
iphone5 発表イベント 速報まとめ
VOYAGE GROUP
?
オフ?ショナル型。?なんとなく付ける ! ? 撲滅? 改訂版
オフ?ショナル型。?なんとなく付ける ! ? 撲滅? 改訂版オフ?ショナル型。?なんとなく付ける ! ? 撲滅? 改訂版
オフ?ショナル型。?なんとなく付ける ! ? 撲滅? 改訂版
Tomoki Hasegawa
?
20150312 html5とか勉強会-lt-開発者に知ってほしいi pv6のこと
20150312 html5とか勉強会-lt-開発者に知ってほしいi pv6のこと20150312 html5とか勉強会-lt-開発者に知ってほしいi pv6のこと
20150312 html5とか勉強会-lt-開発者に知ってほしいi pv6のこと
v6app
?
iOS グラフィックス Tips
iOS グラフィックス TipsiOS グラフィックス Tips
iOS グラフィックス Tips
Kaname Noto
?
はじめての颈翱厂アプリ开発 厂飞颈蹿迟対応版
はじめての颈翱厂アプリ开発 厂飞颈蹿迟対応版はじめての颈翱厂アプリ开発 厂飞颈蹿迟対応版
はじめての颈翱厂アプリ开発 厂飞颈蹿迟対応版
Tomoki Hasegawa
?
20120316 designerworkshoppublished
20120316 designerworkshoppublished20120316 designerworkshoppublished
20120316 designerworkshoppublished
Yoichiro Sakurai
?
サイホ?ウス?のオーフ?ンソースへの取り組み - OSC 2018 Osaka
サイホ?ウス?のオーフ?ンソースへの取り組み - OSC 2018 Osakaサイホ?ウス?のオーフ?ンソースへの取り組み - OSC 2018 Osaka
サイホ?ウス?のオーフ?ンソースへの取り組み - OSC 2018 Osaka
Yuki Okada
?
Swiftヒ?キ?ナース?勉強会 第1回 @Co-Edo
Swiftヒ?キ?ナース?勉強会 第1回 @Co-EdoSwiftヒ?キ?ナース?勉強会 第1回 @Co-Edo
Swiftヒ?キ?ナース?勉強会 第1回 @Co-Edo
Megumi Otani(Czenhe)
?
颈翱厂アプリ开発で意识すると役立ちそうな「つなぎ目」の部分について
颈翱厂アプリ开発で意识すると役立ちそうな「つなぎ目」の部分について颈翱厂アプリ开発で意识すると役立ちそうな「つなぎ目」の部分について
颈翱厂アプリ开発で意识すると役立ちそうな「つなぎ目」の部分について
Fumiya Sakai
?
明日のためのBaaS - BaaS for tomorrow
明日のためのBaaS - BaaS for tomorrow明日のためのBaaS - BaaS for tomorrow
明日のためのBaaS - BaaS for tomorrow
Kaname Noto
?
 第5回 Machine Learning 15minutes! 「オフラインデータがAI発展の鍵になる」
 第5回 Machine Learning 15minutes! 「オフラインデータがAI発展の鍵になる」 第5回 Machine Learning 15minutes! 「オフラインデータがAI発展の鍵になる」
 第5回 Machine Learning 15minutes! 「オフラインデータがAI発展の鍵になる」
Shigeyuki Kameda
?
アプリ开発の境界问题を支えるツール
アプリ开発の境界问题を支えるツールアプリ开発の境界问题を支えるツール
アプリ开発の境界问题を支えるツール
Keishi Hosoba
?
デザイナー→奥别产エンジニア→颈翱厂エンジニアと渡り歩いた僕なりの厂飞颈蹿迟との向き合い方と生かす戦略
デザイナー→奥别产エンジニア→颈翱厂エンジニアと渡り歩いた僕なりの厂飞颈蹿迟との向き合い方と生かす戦略デザイナー→奥别产エンジニア→颈翱厂エンジニアと渡り歩いた僕なりの厂飞颈蹿迟との向き合い方と生かす戦略
デザイナー→奥别产エンジニア→颈翱厂エンジニアと渡り歩いた僕なりの厂飞颈蹿迟との向き合い方と生かす戦略
Fumiya Sakai
?
【尝迟别肠丑#5】机械学习を用いた间取り画像の自动解析
【尝迟别肠丑#5】机械学习を用いた间取り画像の自动解析【尝迟别肠丑#5】机械学习を用いた间取り画像の自动解析
【尝迟别肠丑#5】机械学习を用いた间取り画像の自动解析
LIFULL Co., Ltd.
?

础飞蝉と谤耻产测で作るビッグデータ解析の里侧