狠狠撸

狠狠撸Share a Scribd company logo
Spot	
 ?Instance	
 ?+	
 ?Spark	
 ?+	
 ?
MLlib	
 ?
で実現する簡単低コスト	
 ?
高速機械学習	
 
@yamakatu	
 ?
AWS	
 ?Casual	
 ?Talks#2	
 ?
2014/4/18
Spot Instance + Spark + MLlibで実現する簡単低コスト機械学習
おまだれ	
 
?? @yamakatu	
 ?
?? お仕事:検索方面	
 ?
?? 自称フルスタックイクメンエンジニア	
 ?
?? 開発、インフラ、機械学習、統計、検索、育児	
 ?
?? gihyo.jp	
 ?連載「Mahoutで体感する機械学習の実践」	
 ?
?? 合言葉は「読まずにはてブだけして」	
 ?
	
 ?
What’s	
 ?Spark	
 
の前にHadoopの話
Hadoopが苦手とする処理	
 
?? オンライン処理(リアルタイム性)	
 ?
?? バッチ処理で使おう	
 ?
?? 繰り返し処理	
 ?
?? ?	
 ?
繰り返し処理@Hadoop?	
 
?? ここで言うところの繰り返し処理	
 ?
?? 一般的に言うところの「繰り返し処理」というよりも	
 ?
?? 前回の計算結果を次の計算で利用するような繰り返し処理	
 ?
HDFS?Map?Shu?e?Reduce?HDFS	
 ?
HDFS?Map?Shu?e?Reduce?HDFS	
 ?
HDFS?Map?Shu?e?Reduce?HDFS	
 ?
Why	
 ??	
 
?? Disk	
 ?I/O	
 ?
1.? 前回の出力をHDFS経由で入力値として受け取る	
 ?
?? そのまま持っとけよ。。。	
 ?
2.? さらにMap処理の出力は各ノードのローカルディスク	
 ?
?? バッファからあふれた分だけだっけ?	
 ?
?? タスク処理の準備にかかる時間	
 ?
1.? JVMの起動コスト	
 ?
?? TaskTrackerはmap/reduceタスクごとに子プロセスを起動	
 ?
	
 ?
2.? TaskTrackerへのタスク割当間隔	
 ?
?? Heartbeatでスロットの空き数を通知	
 ?
?最大でHeartbeat間隔の時間だけ何もしないスロットが存在	
 ?
(dfs.heartbeat.intervalの値:デフォ3秒)	
 ?
この二つの問題は解決できる	
 
そう、Sparkならね
Spark	
 ?vs.	
 ?Disk	
 ?I/O	
 ?	
 
?? キャッシュ	
 ?
?? データセットのキャッシュ	
 ?
?? 計算結果のキャッシュ	
 ?
?Disk	
 ?I/O減	
 ?
?? RDD(Resillient	
 ?Distributed	
 ?Datasets)	
 ?
?? キャッシュはクラスタノード間で分散保持	
 ?
?一部が失われても復旧可能	
 ?
Spark	
 ?vs.	
 ?task	
 ?launching	
 ?time	
 ?	
 
?? 論文曰く、「fast	
 ?event-?‐driven	
 ?RPC	
 ?libraryを使ったよ」	
 ?
	
 ?
Spark	
 ?vs.	
 ?task	
 ?launching	
 ?time	
 ?	
 
?? 論文曰く、「fast	
 ?event-?‐driven	
 ?RPC	
 ?libraryを使ったよ」	
 ?
?? 5?10sec	
 ??	
 ?5ms	
 ?
?? Ref.	
 ?
	
 ?“Shark:	
 ?SQL	
 ?and	
 ?Rich	
 ?AnalyWcs	
 ?at	
 ?Scale”	
 ?
hYps://www.icsi.berkeley.edu/pubs/networking/ICSI_sharksql12.pdf	
 ?
結果、繰り返し処理の高速化	
 
Ref.	
 ?
“Spark:	
 ?A	
 ?framework	
 ?for	
 ?iteraWve	
 ?and	
 ?interacWve	
 ?cluster	
 ?compuWng”	
 ?
hYp://laser.inf.ethz.ch/2013/material/joseph/LASER-?‐Joseph-?‐6.pdf	
 ?
機械学習	
 ?on	
 ?Spark	
 
?? Sparkの代表的な用途として機械学習	
 ?
?? What’s	
 ?機械学習	
 ?
?? スパムフィルタ	
 ?
?? レコメンド	
 ?
?? 顔認識、手書き文字認識	
 ?
?? 画像処理	
 ?
?? 広告のパーソナライズ	
 ?
?? マルウェア検知	
 ?
?? とかとか	
 ?
?? 機械学習のアルゴリズムの一部は繰り返し処理が激しい	
 ?
What’s	
 ?MLlib	
 
?? Spark用の機械学習ライブラリ	
 ?
?? 実装済みアルゴリズム(まだ少ない)	
 ?
?? SVM	
 ?
?? ロジスティク回帰	
 ?
?? 線形回帰	
 ?
?? リッジ回帰	
 ?
?? Lasso	
 ?
?? K-?‐Means	
 ?
?? 協調フィルタリング	
 ?
?? ALS(交互最小二乗法)	
 ?
?? Gradient	
 ?Descent(最急降下法)	
 ?
Why	
 ?MLlib	
 
?? 簡単!	
 ?
?? JavaでK-?‐Meansを利用する場合	
 ?
KMeansModel	
 ?model	
 ?=	
 ?KMeans.train(points.rdd(),	
 ?5,	
 ?3,	
 ?5);	
 ?
	
 ?
というのは嘘で、実際には前段階で入力データをpointsに
入力データをキャッシュさせる処理を書くけど	
 ?
Hadoop	
 ?vs.	
 ?Spark(+MLlib)	
 
?? 速度比較	
 ?
?? ロジスティク回帰で100倍	
 ?
?? ref.	
 ?hYp://spark.apache.org/	
 ?
	
 ?
	
 ?
	
 ?
?? What’s	
 ?ロジスティク回帰
Why	
 ?EC2	
 ?(+Spot	
 ?Instance)	
 
?? 機械学習	
 ?on	
 ?EC2	
 ?
?? バッチ処理であることが多い	
 ?
?? 低い稼働率	
 ?
?? 計算量が多くなりがち	
 ?
?? 高いスペックのマシンを利用したい	
 ?
?? Spot	
 ?Instance	
 ?
?? 安い	
 ?
?? 用途によってはリアルタイム性を重視しない	
 ?
?? Spark	
 ?on	
 ?EC2	
 ?
?? spark/ec2/spark-?‐ec2	
 ?
?? EC2上にクラスタを構築、管理するためのスクリプト	
 ?
?? コマンド一発でインスタンスの生成からsparkのインストール、設定まで	
 ?
?? Spark公式	
 ?
?? Spot	
 ?Instance対応	
 ?
?? 分散処理とSpot	
 ?Instance	
 ?
?? 1台でちんたらバッチ処理やってると相場が上昇してTerminateされる	
 ?
How	
 ?to	
 ?use	
 ?spark-?‐ec2	
 
?? 例えば	
 ?
?? masterをm3.large	
 ?
?? slaveをm3.xlargeで3台	
 ?
?? Amazon	
 ?Linux(64bit)	
 ?
?? Tokyo	
 ?Region	
 ?
$	
 ?spark-?‐ec2	
 ?–t	
 ?m3.xlarge	
 ?–s	
 ?3	
 ?–m	
 ?m3.large	
 ?–a	
 ?ami-?‐84f1cfc1	
 ?–r	
 ?ap-?‐northeast-?‐1	
 ?	
 ?–k	
 ?
hoge	
 ?launch	
 ?spark-?‐test	
 ?
	
 ?
?? 上記構成のslaveをspot	
 ?instance($0.3で入札)で構築	
 ?
	
 ?
$	
 ?spark-?‐ec2	
 ?-?‐-?‐spot-?‐price=0.3	
 ?–t	
 ?m3.xlarge	
 ?–s	
 ?3	
 ?–m	
 ?m3.large	
 ?–a	
 ?ami-?‐84f1cfc1	
 ?–r	
 ?ap-?‐
northeast-?‐1	
 ?	
 ?–k	
 ?hoge	
 ?launch	
 ?spark-?‐test	
 ?
?? 他にもオプション色々	
 ?
?? -?‐z	
 ?ZONE,	
 ?-?‐-?‐zone=ZONE	
 ?
?? -?‐-?‐ebs-?‐vol-?‐size=SIZE	
 ?
?? -?‐-?‐use-?‐exisWng-?‐master	
 ?
?? (略	
 ?
まとめ	
 
?? 簡単	
 ?
?? /spark/ec2/ec2-?‐spark	
 ?
?? MLlib	
 ?
?? 低コスト	
 ?
?? EC2	
 ?+	
 ?Spot	
 ?Instance	
 ?
?? 高速	
 ?
?? Spark	
 ?
?? 機械学習	
 ?
?? 繰り返し処理で実装されてるアルゴリズムだけだけどね	
 ?
Fin.

More Related Content

What's hot (20)

スキーマ 付き 分散ストリーム処理 を実行可能な FlinkSQLClient の紹介
スキーマ 付き 分散ストリーム処理 を実行可能な FlinkSQLClient の紹介スキーマ 付き 分散ストリーム処理 を実行可能な FlinkSQLClient の紹介
スキーマ 付き 分散ストリーム処理 を実行可能な FlinkSQLClient の紹介
Sotaro Kimura
?
碍补蹿办补を活用するためのストリーム処理の基本
碍补蹿办补を活用するためのストリーム処理の基本碍补蹿办补を活用するためのストリーム処理の基本
碍补蹿办补を活用するためのストリーム処理の基本
Sotaro Kimura
?
2015 03-12 道玄坂LT祭り第2回 Spark DataFrame Introduction
2015 03-12 道玄坂LT祭り第2回 Spark DataFrame Introduction2015 03-12 道玄坂LT祭り第2回 Spark DataFrame Introduction
2015 03-12 道玄坂LT祭り第2回 Spark DataFrame Introduction
Yu Ishikawa
?
JP version - Beyond Shuffling - Apache Spark のスケールアップのためのヒントとコツ
JP version - Beyond Shuffling - Apache Spark のスケールアップのためのヒントとコツJP version - Beyond Shuffling - Apache Spark のスケールアップのためのヒントとコツ
JP version - Beyond Shuffling - Apache Spark のスケールアップのためのヒントとコツ
Holden Karau
?
Lambda in java_20160121
Lambda in java_20160121Lambda in java_20160121
Lambda in java_20160121
Teruo Kawasaki
?
Spark/MapReduceの 機械学習ライブラリ比較検証
Spark/MapReduceの 機械学習ライブラリ比較検証Spark/MapReduceの 機械学習ライブラリ比較検証
Spark/MapReduceの 機械学習ライブラリ比較検証
Recruit Technologies
?
TokyoWebminig カジュアルなHadoop
TokyoWebminig カジュアルなHadoopTokyoWebminig カジュアルなHadoop
TokyoWebminig カジュアルなHadoop
Teruo Kawasaki
?
ログ解析基盘におけるストリーム処理パイプラインについて
ログ解析基盘におけるストリーム処理パイプラインについてログ解析基盘におけるストリーム処理パイプラインについて
ログ解析基盘におけるストリーム処理パイプラインについて
cyberagent
?
性能測定道 事始め編
性能測定道 事始め編性能測定道 事始め編
性能測定道 事始め編
Yuto Hayamizu
?
Re:dash Use Cases at iPROS
Re:dash Use Cases at iPROSRe:dash Use Cases at iPROS
Re:dash Use Cases at iPROS
Jumpei Yokota
?
Spark Structured Streaming with Kafka
Spark Structured Streaming with KafkaSpark Structured Streaming with Kafka
Spark Structured Streaming with Kafka
Sotaro Kimura
?
ML Pipelineで実践機械学習
ML Pipelineで実践機械学習ML Pipelineで実践機械学習
ML Pipelineで実践機械学習
Kazuki Taniguchi
?
性能測定道 実践編
性能測定道 実践編性能測定道 実践編
性能測定道 実践編
Yuto Hayamizu
?
Hadoop Source Code Reading #17
Hadoop Source Code Reading #17Hadoop Source Code Reading #17
Hadoop Source Code Reading #17
Shingo Furuyama
?
Sparkを用いたヒ?ック?テ?ータ解析 ? 前編 ?
Sparkを用いたヒ?ック?テ?ータ解析 ? 前編 ?Sparkを用いたヒ?ック?テ?ータ解析 ? 前編 ?
Sparkを用いたヒ?ック?テ?ータ解析 ? 前編 ?
x1 ichi
?
SparkTokyo2019NovIshizaki
SparkTokyo2019NovIshizakiSparkTokyo2019NovIshizaki
SparkTokyo2019NovIshizaki
Kazuaki Ishizaki
?
20150513 legobease
20150513 legobease20150513 legobease
20150513 legobease
Takeshi Yamamuro
?
MapReduce/Spark/Tezのフェアな性能比較に向けて (Cloudera World Tokyo 2014 LT講演)
MapReduce/Spark/Tezのフェアな性能比較に向けて (Cloudera World Tokyo 2014 LT講演)MapReduce/Spark/Tezのフェアな性能比較に向けて (Cloudera World Tokyo 2014 LT講演)
MapReduce/Spark/Tezのフェアな性能比較に向けて (Cloudera World Tokyo 2014 LT講演)
Hadoop / Spark Conference Japan
?
贬颈惫别尘补濒濒で始める不动产価格推定サービス
贬颈惫别尘补濒濒で始める不动产価格推定サービス贬颈惫别尘补濒濒で始める不动产価格推定サービス
贬颈惫别尘补濒濒で始める不动产価格推定サービス
Kentaro Yoshida
?
厂辫补谤办のクエリ処理系と周辺の话题
厂辫补谤办のクエリ処理系と周辺の话题厂辫补谤办のクエリ処理系と周辺の话题
厂辫补谤办のクエリ処理系と周辺の话题
Takeshi Yamamuro
?
スキーマ 付き 分散ストリーム処理 を実行可能な FlinkSQLClient の紹介
スキーマ 付き 分散ストリーム処理 を実行可能な FlinkSQLClient の紹介スキーマ 付き 分散ストリーム処理 を実行可能な FlinkSQLClient の紹介
スキーマ 付き 分散ストリーム処理 を実行可能な FlinkSQLClient の紹介
Sotaro Kimura
?
碍补蹿办补を活用するためのストリーム処理の基本
碍补蹿办补を活用するためのストリーム処理の基本碍补蹿办补を活用するためのストリーム処理の基本
碍补蹿办补を活用するためのストリーム処理の基本
Sotaro Kimura
?
2015 03-12 道玄坂LT祭り第2回 Spark DataFrame Introduction
2015 03-12 道玄坂LT祭り第2回 Spark DataFrame Introduction2015 03-12 道玄坂LT祭り第2回 Spark DataFrame Introduction
2015 03-12 道玄坂LT祭り第2回 Spark DataFrame Introduction
Yu Ishikawa
?
JP version - Beyond Shuffling - Apache Spark のスケールアップのためのヒントとコツ
JP version - Beyond Shuffling - Apache Spark のスケールアップのためのヒントとコツJP version - Beyond Shuffling - Apache Spark のスケールアップのためのヒントとコツ
JP version - Beyond Shuffling - Apache Spark のスケールアップのためのヒントとコツ
Holden Karau
?
Spark/MapReduceの 機械学習ライブラリ比較検証
Spark/MapReduceの 機械学習ライブラリ比較検証Spark/MapReduceの 機械学習ライブラリ比較検証
Spark/MapReduceの 機械学習ライブラリ比較検証
Recruit Technologies
?
TokyoWebminig カジュアルなHadoop
TokyoWebminig カジュアルなHadoopTokyoWebminig カジュアルなHadoop
TokyoWebminig カジュアルなHadoop
Teruo Kawasaki
?
ログ解析基盘におけるストリーム処理パイプラインについて
ログ解析基盘におけるストリーム処理パイプラインについてログ解析基盘におけるストリーム処理パイプラインについて
ログ解析基盘におけるストリーム処理パイプラインについて
cyberagent
?
性能測定道 事始め編
性能測定道 事始め編性能測定道 事始め編
性能測定道 事始め編
Yuto Hayamizu
?
Re:dash Use Cases at iPROS
Re:dash Use Cases at iPROSRe:dash Use Cases at iPROS
Re:dash Use Cases at iPROS
Jumpei Yokota
?
Spark Structured Streaming with Kafka
Spark Structured Streaming with KafkaSpark Structured Streaming with Kafka
Spark Structured Streaming with Kafka
Sotaro Kimura
?
ML Pipelineで実践機械学習
ML Pipelineで実践機械学習ML Pipelineで実践機械学習
ML Pipelineで実践機械学習
Kazuki Taniguchi
?
性能測定道 実践編
性能測定道 実践編性能測定道 実践編
性能測定道 実践編
Yuto Hayamizu
?
Hadoop Source Code Reading #17
Hadoop Source Code Reading #17Hadoop Source Code Reading #17
Hadoop Source Code Reading #17
Shingo Furuyama
?
Sparkを用いたヒ?ック?テ?ータ解析 ? 前編 ?
Sparkを用いたヒ?ック?テ?ータ解析 ? 前編 ?Sparkを用いたヒ?ック?テ?ータ解析 ? 前編 ?
Sparkを用いたヒ?ック?テ?ータ解析 ? 前編 ?
x1 ichi
?
MapReduce/Spark/Tezのフェアな性能比較に向けて (Cloudera World Tokyo 2014 LT講演)
MapReduce/Spark/Tezのフェアな性能比較に向けて (Cloudera World Tokyo 2014 LT講演)MapReduce/Spark/Tezのフェアな性能比較に向けて (Cloudera World Tokyo 2014 LT講演)
MapReduce/Spark/Tezのフェアな性能比較に向けて (Cloudera World Tokyo 2014 LT講演)
Hadoop / Spark Conference Japan
?
贬颈惫别尘补濒濒で始める不动产価格推定サービス
贬颈惫别尘补濒濒で始める不动产価格推定サービス贬颈惫别尘补濒濒で始める不动产価格推定サービス
贬颈惫别尘补濒濒で始める不动产価格推定サービス
Kentaro Yoshida
?
厂辫补谤办のクエリ処理系と周辺の话题
厂辫补谤办のクエリ処理系と周辺の话题厂辫补谤办のクエリ処理系と周辺の话题
厂辫补谤办のクエリ処理系と周辺の话题
Takeshi Yamamuro
?

Viewers also liked (9)

Amazon Kinesis: Real-time Streaming Big data Processing Applications (BDT311)...
Amazon Kinesis: Real-time Streaming Big data Processing Applications (BDT311)...Amazon Kinesis: Real-time Streaming Big data Processing Applications (BDT311)...
Amazon Kinesis: Real-time Streaming Big data Processing Applications (BDT311)...
Amazon Web Services
?
5分でできる ebfly
5分でできる ebfly5分でできる ebfly
5分でできる ebfly
Kazuyuki Honda
?
CloudTrail でログとれ?る
CloudTrail でログとれ?るCloudTrail でログとれ?る
CloudTrail でログとれ?る
Hokuto Hoshi
?
20140418 aws-casual-network
20140418 aws-casual-network20140418 aws-casual-network
20140418 aws-casual-network
Yasuhiro Araki, Ph.D
?
20140329 modern logging and data analysis pattern on .NET
20140329 modern logging and data analysis pattern on .NET20140329 modern logging and data analysis pattern on .NET
20140329 modern logging and data analysis pattern on .NET
Takayoshi Tanaka
?
Kinesis Analyticsの適用できない用途と、Kinesis Firehoseの苦労話
Kinesis Analyticsの適用できない用途と、Kinesis Firehoseの苦労話Kinesis Analyticsの適用できない用途と、Kinesis Firehoseの苦労話
Kinesis Analyticsの適用できない用途と、Kinesis Firehoseの苦労話
Sotaro Kimura
?
贵濒耻别苍迟诲のお勧めシステム构成パターン
贵濒耻别苍迟诲のお勧めシステム构成パターン贵濒耻别苍迟诲のお勧めシステム构成パターン
贵濒耻别苍迟诲のお勧めシステム构成パターン
Kentaro Yoshida
?
fluentd を利用した大規模ウェブサービスのロギング
fluentd を利用した大規模ウェブサービスのロギングfluentd を利用した大規模ウェブサービスのロギング
fluentd を利用した大規模ウェブサービスのロギング
Yuichi Tateno
?
Amazon Kinesis: Real-time Streaming Big data Processing Applications (BDT311)...
Amazon Kinesis: Real-time Streaming Big data Processing Applications (BDT311)...Amazon Kinesis: Real-time Streaming Big data Processing Applications (BDT311)...
Amazon Kinesis: Real-time Streaming Big data Processing Applications (BDT311)...
Amazon Web Services
?
CloudTrail でログとれ?る
CloudTrail でログとれ?るCloudTrail でログとれ?る
CloudTrail でログとれ?る
Hokuto Hoshi
?
20140329 modern logging and data analysis pattern on .NET
20140329 modern logging and data analysis pattern on .NET20140329 modern logging and data analysis pattern on .NET
20140329 modern logging and data analysis pattern on .NET
Takayoshi Tanaka
?
Kinesis Analyticsの適用できない用途と、Kinesis Firehoseの苦労話
Kinesis Analyticsの適用できない用途と、Kinesis Firehoseの苦労話Kinesis Analyticsの適用できない用途と、Kinesis Firehoseの苦労話
Kinesis Analyticsの適用できない用途と、Kinesis Firehoseの苦労話
Sotaro Kimura
?
贵濒耻别苍迟诲のお勧めシステム构成パターン
贵濒耻别苍迟诲のお勧めシステム构成パターン贵濒耻别苍迟诲のお勧めシステム构成パターン
贵濒耻别苍迟诲のお勧めシステム构成パターン
Kentaro Yoshida
?
fluentd を利用した大規模ウェブサービスのロギング
fluentd を利用した大規模ウェブサービスのロギングfluentd を利用した大規模ウェブサービスのロギング
fluentd を利用した大規模ウェブサービスのロギング
Yuichi Tateno
?

Similar to Spot Instance + Spark + MLlibで実現する簡単低コスト機械学習 (20)

20161027 hadoop summit Generating Recommendations at Amazon Scale with Apach...
20161027 hadoop summit  Generating Recommendations at Amazon Scale with Apach...20161027 hadoop summit  Generating Recommendations at Amazon Scale with Apach...
20161027 hadoop summit Generating Recommendations at Amazon Scale with Apach...
Amazon Web Services Japan
?
Amazon Elastic MapReduce@Hadoop Conference Japan 2011 Fall
Amazon Elastic MapReduce@Hadoop Conference Japan 2011 FallAmazon Elastic MapReduce@Hadoop Conference Japan 2011 Fall
Amazon Elastic MapReduce@Hadoop Conference Japan 2011 Fall
Shinpei Ohtani
?
础耻迟辞贰苍肠辞诲别谤で特徴抽出
础耻迟辞贰苍肠辞诲别谤で特徴抽出础耻迟辞贰苍肠辞诲别谤で特徴抽出
础耻迟辞贰苍肠辞诲别谤で特徴抽出
Kai Sasaki
?
Life and how_to_live_it
Life and how_to_live_itLife and how_to_live_it
Life and how_to_live_it
Toshiro Yagi
?
ゲームのインフラを础飞蝉で実戦迟颈辫蝉全て见せます
ゲームのインフラを础飞蝉で実戦迟颈辫蝉全て见せますゲームのインフラを础飞蝉で実戦迟颈辫蝉全て见せます
ゲームのインフラを础飞蝉で実戦迟颈辫蝉全て见せます
infinite_loop
?
Spark MLlib code reading ~optimization~
Spark MLlib code reading ~optimization~Spark MLlib code reading ~optimization~
Spark MLlib code reading ~optimization~
Kai Sasaki
?
Lineにおけるspring frameworkの活用
Lineにおけるspring frameworkの活用Lineにおけるspring frameworkの活用
Lineにおけるspring frameworkの活用
Tokuhiro Matsuno
?
贬补诲辞辞辫事始め
贬补诲辞辞辫事始め贬补诲辞辞辫事始め
贬补诲辞辞辫事始め
You&I
?
データ分析基盤として Rancher?k8s で始まるのか調査してみた
データ分析基盤として Rancher?k8s で始まるのか調査してみたデータ分析基盤として Rancher?k8s で始まるのか調査してみた
データ分析基盤として Rancher?k8s で始まるのか調査してみた
YASUKAZU NAGATOMI
?
Object-Funcational Analysis and design
Object-Funcational Analysis and designObject-Funcational Analysis and design
Object-Funcational Analysis and design
Tomoharu ASAMI
?
本番环境で使いたい笔贬笔
本番环境で使いたい笔贬笔本番环境で使いたい笔贬笔
本番环境で使いたい笔贬笔
Takuya Sato
?
Rdbms起点で考えると見えない世界 okuyama勉強会
Rdbms起点で考えると見えない世界 okuyama勉強会Rdbms起点で考えると見えない世界 okuyama勉強会
Rdbms起点で考えると見えない世界 okuyama勉強会
Masakazu Muraoka
?
Amazon DynamoDB 初心者が理解した事
Amazon DynamoDB 初心者が理解した事Amazon DynamoDB 初心者が理解した事
Amazon DynamoDB 初心者が理解した事
Hirokazu Tokuno
?
オンプレ回帰も简単実现!自由自在なデータベース运用とは
オンプレ回帰も简単実现!自由自在なデータベース运用とはオンプレ回帰も简単実现!自由自在なデータベース运用とは
オンプレ回帰も简単実现!自由自在なデータベース运用とは
株式会社クライム
?
20111130 10 aws-meister-emr_long-public
20111130 10 aws-meister-emr_long-public20111130 10 aws-meister-emr_long-public
20111130 10 aws-meister-emr_long-public
Amazon Web Services Japan
?
serverless framework + AWS Lambda with Python
serverless framework + AWS Lambda with Pythonserverless framework + AWS Lambda with Python
serverless framework + AWS Lambda with Python
masahitojp
?
NHN techcon-20120519-fujimoto
NHN techcon-20120519-fujimotoNHN techcon-20120519-fujimoto
NHN techcon-20120519-fujimoto
Masaki Fujimoto
?
Reco choku tech night #09 -reinvent2018報告会-
Reco choku tech night #09 -reinvent2018報告会-Reco choku tech night #09 -reinvent2018報告会-
Reco choku tech night #09 -reinvent2018報告会-
recotech
?
20160127三木会 RDB経験者のためのspark
20160127三木会 RDB経験者のためのspark20160127三木会 RDB経験者のためのspark
20160127三木会 RDB経験者のためのspark
Ryuji Tamagawa
?
奥别产时代の大富豪的プログラミングのススメ
奥别产时代の大富豪的プログラミングのススメ奥别产时代の大富豪的プログラミングのススメ
奥别产时代の大富豪的プログラミングのススメ
Hideyuki Takeuchi
?
20161027 hadoop summit Generating Recommendations at Amazon Scale with Apach...
20161027 hadoop summit  Generating Recommendations at Amazon Scale with Apach...20161027 hadoop summit  Generating Recommendations at Amazon Scale with Apach...
20161027 hadoop summit Generating Recommendations at Amazon Scale with Apach...
Amazon Web Services Japan
?
Amazon Elastic MapReduce@Hadoop Conference Japan 2011 Fall
Amazon Elastic MapReduce@Hadoop Conference Japan 2011 FallAmazon Elastic MapReduce@Hadoop Conference Japan 2011 Fall
Amazon Elastic MapReduce@Hadoop Conference Japan 2011 Fall
Shinpei Ohtani
?
础耻迟辞贰苍肠辞诲别谤で特徴抽出
础耻迟辞贰苍肠辞诲别谤で特徴抽出础耻迟辞贰苍肠辞诲别谤で特徴抽出
础耻迟辞贰苍肠辞诲别谤で特徴抽出
Kai Sasaki
?
Life and how_to_live_it
Life and how_to_live_itLife and how_to_live_it
Life and how_to_live_it
Toshiro Yagi
?
ゲームのインフラを础飞蝉で実戦迟颈辫蝉全て见せます
ゲームのインフラを础飞蝉で実戦迟颈辫蝉全て见せますゲームのインフラを础飞蝉で実戦迟颈辫蝉全て见せます
ゲームのインフラを础飞蝉で実戦迟颈辫蝉全て见せます
infinite_loop
?
Spark MLlib code reading ~optimization~
Spark MLlib code reading ~optimization~Spark MLlib code reading ~optimization~
Spark MLlib code reading ~optimization~
Kai Sasaki
?
Lineにおけるspring frameworkの活用
Lineにおけるspring frameworkの活用Lineにおけるspring frameworkの活用
Lineにおけるspring frameworkの活用
Tokuhiro Matsuno
?
贬补诲辞辞辫事始め
贬补诲辞辞辫事始め贬补诲辞辞辫事始め
贬补诲辞辞辫事始め
You&I
?
データ分析基盤として Rancher?k8s で始まるのか調査してみた
データ分析基盤として Rancher?k8s で始まるのか調査してみたデータ分析基盤として Rancher?k8s で始まるのか調査してみた
データ分析基盤として Rancher?k8s で始まるのか調査してみた
YASUKAZU NAGATOMI
?
Object-Funcational Analysis and design
Object-Funcational Analysis and designObject-Funcational Analysis and design
Object-Funcational Analysis and design
Tomoharu ASAMI
?
本番环境で使いたい笔贬笔
本番环境で使いたい笔贬笔本番环境で使いたい笔贬笔
本番环境で使いたい笔贬笔
Takuya Sato
?
Rdbms起点で考えると見えない世界 okuyama勉強会
Rdbms起点で考えると見えない世界 okuyama勉強会Rdbms起点で考えると見えない世界 okuyama勉強会
Rdbms起点で考えると見えない世界 okuyama勉強会
Masakazu Muraoka
?
Amazon DynamoDB 初心者が理解した事
Amazon DynamoDB 初心者が理解した事Amazon DynamoDB 初心者が理解した事
Amazon DynamoDB 初心者が理解した事
Hirokazu Tokuno
?
オンプレ回帰も简単実现!自由自在なデータベース运用とは
オンプレ回帰も简単実现!自由自在なデータベース运用とはオンプレ回帰も简単実现!自由自在なデータベース运用とは
オンプレ回帰も简単実现!自由自在なデータベース运用とは
株式会社クライム
?
serverless framework + AWS Lambda with Python
serverless framework + AWS Lambda with Pythonserverless framework + AWS Lambda with Python
serverless framework + AWS Lambda with Python
masahitojp
?
NHN techcon-20120519-fujimoto
NHN techcon-20120519-fujimotoNHN techcon-20120519-fujimoto
NHN techcon-20120519-fujimoto
Masaki Fujimoto
?
Reco choku tech night #09 -reinvent2018報告会-
Reco choku tech night #09 -reinvent2018報告会-Reco choku tech night #09 -reinvent2018報告会-
Reco choku tech night #09 -reinvent2018報告会-
recotech
?
20160127三木会 RDB経験者のためのspark
20160127三木会 RDB経験者のためのspark20160127三木会 RDB経験者のためのspark
20160127三木会 RDB経験者のためのspark
Ryuji Tamagawa
?
奥别产时代の大富豪的プログラミングのススメ
奥别产时代の大富豪的プログラミングのススメ奥别产时代の大富豪的プログラミングのススメ
奥别产时代の大富豪的プログラミングのススメ
Hideyuki Takeuchi
?

Recently uploaded (11)

LF Decentralized Trust Tokyo Meetup 3
LF Decentralized Trust Tokyo Meetup 3LF Decentralized Trust Tokyo Meetup 3
LF Decentralized Trust Tokyo Meetup 3
LFDT Tokyo Meetup
?
【卒业论文】尝尝惭を用いた惭耻濒迟颈-础驳别苍迟-顿别产补迟别における反论の効果に関する研究
【卒业论文】尝尝惭を用いた惭耻濒迟颈-础驳别苍迟-顿别产补迟别における反论の効果に関する研究【卒业论文】尝尝惭を用いた惭耻濒迟颈-础驳别苍迟-顿别产补迟别における反论の効果に関する研究
【卒业论文】尝尝惭を用いた惭耻濒迟颈-础驳别苍迟-顿别产补迟别における反论の効果に関する研究
harmonylab
?
贬补谤耻办颈厂丑颈苍办补飞补冲尝尝惭を利用した果树农家の経験知の対话的蓄积支援冲诲别颈尘2025
贬补谤耻办颈厂丑颈苍办补飞补冲尝尝惭を利用した果树农家の経験知の対话的蓄积支援冲诲别颈尘2025贬补谤耻办颈厂丑颈苍办补飞补冲尝尝惭を利用した果树农家の経験知の対话的蓄积支援冲诲别颈尘2025
贬补谤耻办颈厂丑颈苍办补飞补冲尝尝惭を利用した果树农家の経験知の対话的蓄积支援冲诲别颈尘2025
Matsushita Laboratory
?
【卒业论文】深层学习によるログ异常検知モデルを用いたサイバー攻撃検知に関する研究
【卒业论文】深层学习によるログ异常検知モデルを用いたサイバー攻撃検知に関する研究【卒业论文】深层学习によるログ异常検知モデルを用いたサイバー攻撃検知に関する研究
【卒业论文】深层学习によるログ异常検知モデルを用いたサイバー攻撃検知に関する研究
harmonylab
?
狈辞诲补滨迟蝉耻办颈冲反省観点の分类に基づく试合の振り返り支援システムに関する有用性検証冲顿贰滨惭2025
狈辞诲补滨迟蝉耻办颈冲反省観点の分类に基づく试合の振り返り支援システムに関する有用性検証冲顿贰滨惭2025狈辞诲补滨迟蝉耻办颈冲反省観点の分类に基づく试合の振り返り支援システムに関する有用性検証冲顿贰滨惭2025
狈辞诲补滨迟蝉耻办颈冲反省観点の分类に基づく试合の振り返り支援システムに関する有用性検証冲顿贰滨惭2025
Matsushita Laboratory
?
空间オーディオを用いたヘッドパスワードの提案と音源提示手法の最适化
空间オーディオを用いたヘッドパスワードの提案と音源提示手法の最适化空间オーディオを用いたヘッドパスワードの提案と音源提示手法の最适化
空间オーディオを用いたヘッドパスワードの提案と音源提示手法の最适化
sugiuralab
?
ラズパイを使って作品を作ったらラズパイコンテストで碍厂驰赏を貰って、さらに、文化庁メディア芸术祭で审査员推荐作品に选ばれてしまった件?自作チップでラズパイ...
ラズパイを使って作品を作ったらラズパイコンテストで碍厂驰赏を貰って、さらに、文化庁メディア芸术祭で审査员推荐作品に选ばれてしまった件?自作チップでラズパイ...ラズパイを使って作品を作ったらラズパイコンテストで碍厂驰赏を貰って、さらに、文化庁メディア芸术祭で审査员推荐作品に选ばれてしまった件?自作チップでラズパイ...
ラズパイを使って作品を作ったらラズパイコンテストで碍厂驰赏を貰って、さらに、文化庁メディア芸术祭で审査员推荐作品に选ばれてしまった件?自作チップでラズパイ...
Industrial Technology Research Institute (ITRI)(工業技術研究院, 工研院)
?
测距センサと滨惭鲍センサを用いた指轮型デバイスにおける颜认証システムの提案
测距センサと滨惭鲍センサを用いた指轮型デバイスにおける颜认証システムの提案测距センサと滨惭鲍センサを用いた指轮型デバイスにおける颜认証システムの提案
测距センサと滨惭鲍センサを用いた指轮型デバイスにおける颜认証システムの提案
sugiuralab
?
実はアナタの身近にある!? Linux のチェックポイント/レストア機能 (NTT Tech Conference 2025 発表資料)
実はアナタの身近にある!? Linux のチェックポイント/レストア機能 (NTT Tech Conference 2025 発表資料)実はアナタの身近にある!? Linux のチェックポイント/レストア機能 (NTT Tech Conference 2025 発表資料)
実はアナタの身近にある!? Linux のチェックポイント/レストア機能 (NTT Tech Conference 2025 発表資料)
NTT DATA Technology & Innovation
?
第1回日本理学疗法推论学会学术大会での発表资料(2025年3月2日 高桥可奈恵)
第1回日本理学疗法推论学会学术大会での発表资料(2025年3月2日 高桥可奈恵)第1回日本理学疗法推论学会学术大会での発表资料(2025年3月2日 高桥可奈恵)
第1回日本理学疗法推论学会学术大会での発表资料(2025年3月2日 高桥可奈恵)
Matsushita Laboratory
?
2025フードテックWeek大阪展示会 - LoRaWANを使った複数ポイント温度管理 by AVNET玉井部長
2025フードテックWeek大阪展示会 - LoRaWANを使った複数ポイント温度管理 by AVNET玉井部長2025フードテックWeek大阪展示会 - LoRaWANを使った複数ポイント温度管理 by AVNET玉井部長
2025フードテックWeek大阪展示会 - LoRaWANを使った複数ポイント温度管理 by AVNET玉井部長
CRI Japan, Inc.
?
LF Decentralized Trust Tokyo Meetup 3
LF Decentralized Trust Tokyo Meetup 3LF Decentralized Trust Tokyo Meetup 3
LF Decentralized Trust Tokyo Meetup 3
LFDT Tokyo Meetup
?
【卒业论文】尝尝惭を用いた惭耻濒迟颈-础驳别苍迟-顿别产补迟别における反论の効果に関する研究
【卒业论文】尝尝惭を用いた惭耻濒迟颈-础驳别苍迟-顿别产补迟别における反论の効果に関する研究【卒业论文】尝尝惭を用いた惭耻濒迟颈-础驳别苍迟-顿别产补迟别における反论の効果に関する研究
【卒业论文】尝尝惭を用いた惭耻濒迟颈-础驳别苍迟-顿别产补迟别における反论の効果に関する研究
harmonylab
?
贬补谤耻办颈厂丑颈苍办补飞补冲尝尝惭を利用した果树农家の経験知の対话的蓄积支援冲诲别颈尘2025
贬补谤耻办颈厂丑颈苍办补飞补冲尝尝惭を利用した果树农家の経験知の対话的蓄积支援冲诲别颈尘2025贬补谤耻办颈厂丑颈苍办补飞补冲尝尝惭を利用した果树农家の経験知の対话的蓄积支援冲诲别颈尘2025
贬补谤耻办颈厂丑颈苍办补飞补冲尝尝惭を利用した果树农家の経験知の対话的蓄积支援冲诲别颈尘2025
Matsushita Laboratory
?
【卒业论文】深层学习によるログ异常検知モデルを用いたサイバー攻撃検知に関する研究
【卒业论文】深层学习によるログ异常検知モデルを用いたサイバー攻撃検知に関する研究【卒业论文】深层学习によるログ异常検知モデルを用いたサイバー攻撃検知に関する研究
【卒业论文】深层学习によるログ异常検知モデルを用いたサイバー攻撃検知に関する研究
harmonylab
?
狈辞诲补滨迟蝉耻办颈冲反省観点の分类に基づく试合の振り返り支援システムに関する有用性検証冲顿贰滨惭2025
狈辞诲补滨迟蝉耻办颈冲反省観点の分类に基づく试合の振り返り支援システムに関する有用性検証冲顿贰滨惭2025狈辞诲补滨迟蝉耻办颈冲反省観点の分类に基づく试合の振り返り支援システムに関する有用性検証冲顿贰滨惭2025
狈辞诲补滨迟蝉耻办颈冲反省観点の分类に基づく试合の振り返り支援システムに関する有用性検証冲顿贰滨惭2025
Matsushita Laboratory
?
空间オーディオを用いたヘッドパスワードの提案と音源提示手法の最适化
空间オーディオを用いたヘッドパスワードの提案と音源提示手法の最适化空间オーディオを用いたヘッドパスワードの提案と音源提示手法の最适化
空间オーディオを用いたヘッドパスワードの提案と音源提示手法の最适化
sugiuralab
?
ラズパイを使って作品を作ったらラズパイコンテストで碍厂驰赏を貰って、さらに、文化庁メディア芸术祭で审査员推荐作品に选ばれてしまった件?自作チップでラズパイ...
ラズパイを使って作品を作ったらラズパイコンテストで碍厂驰赏を貰って、さらに、文化庁メディア芸术祭で审査员推荐作品に选ばれてしまった件?自作チップでラズパイ...ラズパイを使って作品を作ったらラズパイコンテストで碍厂驰赏を貰って、さらに、文化庁メディア芸术祭で审査员推荐作品に选ばれてしまった件?自作チップでラズパイ...
ラズパイを使って作品を作ったらラズパイコンテストで碍厂驰赏を貰って、さらに、文化庁メディア芸术祭で审査员推荐作品に选ばれてしまった件?自作チップでラズパイ...
Industrial Technology Research Institute (ITRI)(工業技術研究院, 工研院)
?
测距センサと滨惭鲍センサを用いた指轮型デバイスにおける颜认証システムの提案
测距センサと滨惭鲍センサを用いた指轮型デバイスにおける颜认証システムの提案测距センサと滨惭鲍センサを用いた指轮型デバイスにおける颜认証システムの提案
测距センサと滨惭鲍センサを用いた指轮型デバイスにおける颜认証システムの提案
sugiuralab
?
実はアナタの身近にある!? Linux のチェックポイント/レストア機能 (NTT Tech Conference 2025 発表資料)
実はアナタの身近にある!? Linux のチェックポイント/レストア機能 (NTT Tech Conference 2025 発表資料)実はアナタの身近にある!? Linux のチェックポイント/レストア機能 (NTT Tech Conference 2025 発表資料)
実はアナタの身近にある!? Linux のチェックポイント/レストア機能 (NTT Tech Conference 2025 発表資料)
NTT DATA Technology & Innovation
?
第1回日本理学疗法推论学会学术大会での発表资料(2025年3月2日 高桥可奈恵)
第1回日本理学疗法推论学会学术大会での発表资料(2025年3月2日 高桥可奈恵)第1回日本理学疗法推论学会学术大会での発表资料(2025年3月2日 高桥可奈恵)
第1回日本理学疗法推论学会学术大会での発表资料(2025年3月2日 高桥可奈恵)
Matsushita Laboratory
?
2025フードテックWeek大阪展示会 - LoRaWANを使った複数ポイント温度管理 by AVNET玉井部長
2025フードテックWeek大阪展示会 - LoRaWANを使った複数ポイント温度管理 by AVNET玉井部長2025フードテックWeek大阪展示会 - LoRaWANを使った複数ポイント温度管理 by AVNET玉井部長
2025フードテックWeek大阪展示会 - LoRaWANを使った複数ポイント温度管理 by AVNET玉井部長
CRI Japan, Inc.
?

Spot Instance + Spark + MLlibで実現する簡単低コスト機械学習

  • 1. Spot ?Instance ?+ ?Spark ?+ ? MLlib ? で実現する簡単低コスト ? 高速機械学習 @yamakatu ? AWS ?Casual ?Talks#2 ? 2014/4/18
  • 3. おまだれ ?? @yamakatu ? ?? お仕事:検索方面 ? ?? 自称フルスタックイクメンエンジニア ? ?? 開発、インフラ、機械学習、統計、検索、育児 ? ?? gihyo.jp ?連載「Mahoutで体感する機械学習の実践」 ? ?? 合言葉は「読まずにはてブだけして」 ? ?
  • 5. Hadoopが苦手とする処理 ?? オンライン処理(リアルタイム性) ? ?? バッチ処理で使おう ? ?? 繰り返し処理 ? ?? ? ?
  • 6. 繰り返し処理@Hadoop? ?? ここで言うところの繰り返し処理 ? ?? 一般的に言うところの「繰り返し処理」というよりも ? ?? 前回の計算結果を次の計算で利用するような繰り返し処理 ? HDFS?Map?Shu?e?Reduce?HDFS ? HDFS?Map?Shu?e?Reduce?HDFS ? HDFS?Map?Shu?e?Reduce?HDFS ?
  • 7. Why ?? ?? Disk ?I/O ? 1.? 前回の出力をHDFS経由で入力値として受け取る ? ?? そのまま持っとけよ。。。 ? 2.? さらにMap処理の出力は各ノードのローカルディスク ? ?? バッファからあふれた分だけだっけ? ? ?? タスク処理の準備にかかる時間 ? 1.? JVMの起動コスト ? ?? TaskTrackerはmap/reduceタスクごとに子プロセスを起動 ? ? 2.? TaskTrackerへのタスク割当間隔 ? ?? Heartbeatでスロットの空き数を通知 ? ?最大でHeartbeat間隔の時間だけ何もしないスロットが存在 ? (dfs.heartbeat.intervalの値:デフォ3秒) ?
  • 9. Spark ?vs. ?Disk ?I/O ? ?? キャッシュ ? ?? データセットのキャッシュ ? ?? 計算結果のキャッシュ ? ?Disk ?I/O減 ? ?? RDD(Resillient ?Distributed ?Datasets) ? ?? キャッシュはクラスタノード間で分散保持 ? ?一部が失われても復旧可能 ?
  • 10. Spark ?vs. ?task ?launching ?time ? ?? 論文曰く、「fast ?event-?‐driven ?RPC ?libraryを使ったよ」 ? ?
  • 11. Spark ?vs. ?task ?launching ?time ? ?? 論文曰く、「fast ?event-?‐driven ?RPC ?libraryを使ったよ」 ? ?? 5?10sec ?? ?5ms ? ?? Ref. ? ?“Shark: ?SQL ?and ?Rich ?AnalyWcs ?at ?Scale” ? hYps://www.icsi.berkeley.edu/pubs/networking/ICSI_sharksql12.pdf ?
  • 12. 結果、繰り返し処理の高速化 Ref. ? “Spark: ?A ?framework ?for ?iteraWve ?and ?interacWve ?cluster ?compuWng” ? hYp://laser.inf.ethz.ch/2013/material/joseph/LASER-?‐Joseph-?‐6.pdf ?
  • 13. 機械学習 ?on ?Spark ?? Sparkの代表的な用途として機械学習 ? ?? What’s ?機械学習 ? ?? スパムフィルタ ? ?? レコメンド ? ?? 顔認識、手書き文字認識 ? ?? 画像処理 ? ?? 広告のパーソナライズ ? ?? マルウェア検知 ? ?? とかとか ? ?? 機械学習のアルゴリズムの一部は繰り返し処理が激しい ?
  • 14. What’s ?MLlib ?? Spark用の機械学習ライブラリ ? ?? 実装済みアルゴリズム(まだ少ない) ? ?? SVM ? ?? ロジスティク回帰 ? ?? 線形回帰 ? ?? リッジ回帰 ? ?? Lasso ? ?? K-?‐Means ? ?? 協調フィルタリング ? ?? ALS(交互最小二乗法) ? ?? Gradient ?Descent(最急降下法) ?
  • 15. Why ?MLlib ?? 簡単! ? ?? JavaでK-?‐Meansを利用する場合 ? KMeansModel ?model ?= ?KMeans.train(points.rdd(), ?5, ?3, ?5); ? ? というのは嘘で、実際には前段階で入力データをpointsに 入力データをキャッシュさせる処理を書くけど ?
  • 16. Hadoop ?vs. ?Spark(+MLlib) ?? 速度比較 ? ?? ロジスティク回帰で100倍 ? ?? ref. ?hYp://spark.apache.org/ ? ? ? ? ?? What’s ?ロジスティク回帰
  • 17. Why ?EC2 ?(+Spot ?Instance) ?? 機械学習 ?on ?EC2 ? ?? バッチ処理であることが多い ? ?? 低い稼働率 ? ?? 計算量が多くなりがち ? ?? 高いスペックのマシンを利用したい ? ?? Spot ?Instance ? ?? 安い ? ?? 用途によってはリアルタイム性を重視しない ? ?? Spark ?on ?EC2 ? ?? spark/ec2/spark-?‐ec2 ? ?? EC2上にクラスタを構築、管理するためのスクリプト ? ?? コマンド一発でインスタンスの生成からsparkのインストール、設定まで ? ?? Spark公式 ? ?? Spot ?Instance対応 ? ?? 分散処理とSpot ?Instance ? ?? 1台でちんたらバッチ処理やってると相場が上昇してTerminateされる ?
  • 18. How ?to ?use ?spark-?‐ec2 ?? 例えば ? ?? masterをm3.large ? ?? slaveをm3.xlargeで3台 ? ?? Amazon ?Linux(64bit) ? ?? Tokyo ?Region ? $ ?spark-?‐ec2 ?–t ?m3.xlarge ?–s ?3 ?–m ?m3.large ?–a ?ami-?‐84f1cfc1 ?–r ?ap-?‐northeast-?‐1 ? ?–k ? hoge ?launch ?spark-?‐test ? ? ?? 上記構成のslaveをspot ?instance($0.3で入札)で構築 ? ? $ ?spark-?‐ec2 ?-?‐-?‐spot-?‐price=0.3 ?–t ?m3.xlarge ?–s ?3 ?–m ?m3.large ?–a ?ami-?‐84f1cfc1 ?–r ?ap-?‐ northeast-?‐1 ? ?–k ?hoge ?launch ?spark-?‐test ? ?? 他にもオプション色々 ? ?? -?‐z ?ZONE, ?-?‐-?‐zone=ZONE ? ?? -?‐-?‐ebs-?‐vol-?‐size=SIZE ? ?? -?‐-?‐use-?‐exisWng-?‐master ? ?? (略 ?
  • 19. まとめ ?? 簡単 ? ?? /spark/ec2/ec2-?‐spark ? ?? MLlib ? ?? 低コスト ? ?? EC2 ?+ ?Spot ?Instance ? ?? 高速 ? ?? Spark ? ?? 機械学習 ? ?? 繰り返し処理で実装されてるアルゴリズムだけだけどね ?
  • 20. Fin.