狠狠撸

狠狠撸Share a Scribd company logo
Step FunctionsとAWS Batch
でオーケストレートするイベン
トドリブンな機械学習基盤
Serverless Conf 2017
11/03 2017
山田 雄
ネットビジネス本部
データ基盤チーム
堤 崇行
ITサービス?ペイメント事業本部
方式基盤技術部
■山田 雄(ヤマダ ユウ)
株式会社 リクルートライフスタイル
ネットビジネス本部
データ基盤T
Twitter:@nii_yan
GitHub:https://github.com/yu-yamada
?以前はメールマーケティング用基盤の作成からデータ分析まで関わる
現在はリクルートライフスタイルの共通分析基盤の開発、運用全般を担当
ビックデータ、Ruby、ビール、カップ焼きそばが好き。
自己紹介
会社绍介
リクルートライフスタイルの持つサービス
80%
基盤エンジニアが運用に割いている割合
開発:
運用:
その他:
理想の割合
70%
20%
10%
商品概要
トリップAIコンシェルジュ システム概要図
商品概要
? 会社が商品として売り出すものである
? 今後長く使われる可能性がある
? 今后机能が追加になる可能性がある
机械学习基盘に求められるもの
Scalability
Availability
Maintenability
Robustness
Step functionsとaws batchて?オーケストレートするイヘ?ントト?リフ?ンな機械学習基盤
Machine learning pipelines
on-premises
Data load
Machine
learning
on-premises
State control
Cloud trail
Cloud watch
Monitoring
Limited interface
on-premises
Data load
Machine
learning
on-premises
State control
Cloud trail
Cloud watch
Monitoring
Full managed work flow
on-premises
Data load
Machine
learning
on-premises
State control
Cloud trail
Cloud watch
Monitoring
Scalable batch
on-premises
on-premises
State control
Cloud trail
Cloud watch
Monitoring
Data load
Machine
learning
Data load
Machine
learning
Visualize
on-premises
on-premises
Cloud trail
Cloud watch
Monitoring
State control
State control
Data load
Machine
learning
Infrastructure as code
on-premises
on-premises
Cloud trail
Cloud watch
Monitoring
State control
Data load
Machine
learning
Monitoring
on-premises
on-premises
Cloud trail
Cloud watch
Monitoring
? 2017 NTT DATA Corporation 23
堤 崇行(ツツミ タカユキ)
株式会社NTTデータ
ITサービス?ペイメント事業本部
方式基盤統括部
経歴
? Webアプリ開発
? データ基盤開発?運用 / バッチ開発
? ETL / バッチ処理フレームワーク
? ストリーム処理
利用者/運用者/開発者みんなが気持ちよく使える
システムを構築できるよう日々奮闘中
好きなものはチョコレートとビール
自己紹介
Machine Learning Pipeline
on-premises
Data load
Machine
learning
on-premises
State control
Cloud trail
Cloud watch
Monitoring
Components of Pipelines
Interface
Scheduler
Triggers
Scheduler or Triggers
Scheduled Task Polling Event Trigger
Interface
Interface
Interface Processing Interface
Processing
Batch Processing with Container
Batch
On
Demand
Scalable
AWS Batch
AWS Batch
Submit Job
Running
Succeeded
/ Failed
JobのCPU数 / メモリを指定
Job Containerが稼動
終了
“最適な”EC2 Instanceが起動Runnable
JobのCPU数 / メモリを指定
“最適な”EC2 Instanceが起動
Job
CPU数
メモリ
EC2
CPU数
メモリ
CPU: 8
メモリ: 24GiB
Type: m4.2xlarge
CPU: 8
メモリ: 32GiB
CPU: 8
メモリ: 500GiB
Type: r4.16xlarge?
CPU: 64
メモリ: 488GiB
Step Functions
Workflow
Scalable
Managed
Event
Driven
Control AWS Batch
Event Driven
BatchStep FunctionsLambdaS3
Data
AWS Step Functions & Batch
State Machine
Submit
Get Status
Loop
Monolithic or Micro?
Micro State Machine
Pre-
processing
(Data Load)
Processing
(Machine
Learning)
Relay Step Functions
Batch Results
BatchStep Functions
BatchStep Functions
Event Driven with Lambda
ExecutionTrigger
S3 Eventで
Lambdaを実行
起動成功
起動失敗
多重起動
Event Driven with Lambda
Failures & Solutions
SolutionsFailuresTrigger
S3 Eventで
Lambdaを実行
起動失敗 再実行
多重起動
多重起動の阻止
多重起動OK
Retry when Execution Failed
Polling
DLQ
DLQによる確実なLambdaの実行
Cloud Watch Events
Event
Preventing Multiple Starts
DynamoDBでステート管理
Conditional
Put Item
Update Item
Batch Status
State Control DB
Start Execution
DON’T Start
CAN’T Put
Support Idempotent Batch
べき等性のあるBatch Jobを実装
多重起動しても正常を保つ
Upsert
Unique Object name
Get Latest Object
Monitoring
Monitoring: Alerts
Cloud Watch Logs
Log監視
Lambdaをフィルタで振分け
ERRORログを検知
Subscription
Filter
Info
Alert
Monitoring: Alerts
Batch Status監視
長時間Runnableを検知
Submit
Running
Succeeded
/ Failed
Job Containerが稼動
“最適な” EC2 Instanceが起動Runnable
Monitoring: Alerts
Step Functionの起動監視
一定の時間以上起動していないを検知
BatchStep FunctionsLambdaS3Data
Monitoring: Visualize Batch Status
DynamoDB
Streams
ES
Machine Learning Pipeline
Cloud trail
Cloud watch
Monitoring
BatchStep
Functions
S3 LambdaObjects
DynamoDB
Monitoring
Machine Learning Pipeline
on-premises
Data load
Machine
learning
on-premises
State control
Cloud trail
Cloud watch
最后に
一緒に基盤作ってくれる人募集中!!!
http://engineer.recruit-lifestyle.co.jp/recruiting/
Happy serverless development!!

More Related Content

What's hot (20)

IoT(Bluetooth mesh) × サーバーレス
IoT(Bluetooth mesh) × サーバーレスIoT(Bluetooth mesh) × サーバーレス
IoT(Bluetooth mesh) × サーバーレス
Masahiro NAKAYAMA
?
クラウドとコミュニティのこれまでとこれから 20150322_#JAWSDAYS
クラウドとコミュニティのこれまでとこれから 20150322_#JAWSDAYSクラウドとコミュニティのこれまでとこれから 20150322_#JAWSDAYS
クラウドとコミュニティのこれまでとこれから 20150322_#JAWSDAYS
Hideki Ojima
?
クラウド时代だからこそ见直したい?笔贬笔アプリケーションのパフォーマンスチューニング
クラウド时代だからこそ见直したい?笔贬笔アプリケーションのパフォーマンスチューニングクラウド时代だからこそ见直したい?笔贬笔アプリケーションのパフォーマンスチューニング
クラウド时代だからこそ见直したい?笔贬笔アプリケーションのパフォーマンスチューニング
Terui Masashi
?
AWS ロボ in JAWSDAYS
AWS ロボ in JAWSDAYSAWS ロボ in JAWSDAYS
AWS ロボ in JAWSDAYS
崇之 清水
?
コンソールゲームを世界展開してみた - JAWS DAYS 2015
コンソールゲームを世界展開してみた - JAWS DAYS 2015コンソールゲームを世界展開してみた - JAWS DAYS 2015
コンソールゲームを世界展開してみた - JAWS DAYS 2015
Ryo Nakamaru
?
APIを叩くだけでない、Deep Learning on AWS で自分だけの学習モデルを作ろう! by JAWS-UG AI支部
APIを叩くだけでない、Deep Learning on AWS で自分だけの学習モデルを作ろう! by JAWS-UG AI支部APIを叩くだけでない、Deep Learning on AWS で自分だけの学習モデルを作ろう! by JAWS-UG AI支部
APIを叩くだけでない、Deep Learning on AWS で自分だけの学習モデルを作ろう! by JAWS-UG AI支部
Daisuke Nagao
?
NuxtJS + REST APIで運用中サービスをNuxtJS + GraphQLに変更したことによる光と影
NuxtJS + REST APIで運用中サービスをNuxtJS + GraphQLに変更したことによる光と影NuxtJS + REST APIで運用中サービスをNuxtJS + GraphQLに変更したことによる光と影
NuxtJS + REST APIで運用中サービスをNuxtJS + GraphQLに変更したことによる光と影
gree_tech
?
温故知新、Static Web のサイトを構築しよう
温故知新、Static Web のサイトを構築しよう温故知新、Static Web のサイトを構築しよう
温故知新、Static Web のサイトを構築しよう
Shinya Mori (@mosuke5)
?
JAWS-2013-LT 10000req/secを50msecで返すサーバーインフラをAWSで作る
JAWS-2013-LT 10000req/secを50msecで返すサーバーインフラをAWSで作るJAWS-2013-LT 10000req/secを50msecで返すサーバーインフラをAWSで作る
JAWS-2013-LT 10000req/secを50msecで返すサーバーインフラをAWSで作る
Naoyuki Yamada
?
Awsjpcasestudies
AwsjpcasestudiesAwsjpcasestudies
Awsjpcasestudies
akitsukada
?
Elastic on Azure Integration & Building React UI Based Search App Using Azure...
Elastic on Azure Integration & Building React UI Based Search App Using Azure...Elastic on Azure Integration & Building React UI Based Search App Using Azure...
Elastic on Azure Integration & Building React UI Based Search App Using Azure...
Shotaro Suzuki
?
これからのインフラエンジニアについて考えていること
これからのインフラエンジニアについて考えていることこれからのインフラエンジニアについて考えていること
これからのインフラエンジニアについて考えていること
gree_tech
?
现场で使える顿测苍补尘辞顿叠と幂等デザインパターン
现场で使える顿测苍补尘辞顿叠と幂等デザインパターン现场で使える顿测苍补尘辞顿叠と幂等デザインパターン
现场で使える顿测苍补尘辞顿叠と幂等デザインパターン
cmaraiyusuke
?
【NLU祭り 場外編】コミュニケーションをより身近に、よりかしこく。LUIS と Azure AI サービスの使いどころ
【NLU祭り 場外編】コミュニケーションをより身近に、よりかしこく。LUIS と Azure AI サービスの使いどころ【NLU祭り 場外編】コミュニケーションをより身近に、よりかしこく。LUIS と Azure AI サービスの使いどころ
【NLU祭り 場外編】コミュニケーションをより身近に、よりかしこく。LUIS と Azure AI サービスの使いどころ
Kazumi IWANAGA
?
贰颁厂と骋颈迟尝补产で颁滨环境构筑
贰颁厂と骋颈迟尝补产で颁滨环境构筑贰颁厂と骋颈迟尝补产で颁滨环境构筑
贰颁厂と骋颈迟尝补产で颁滨环境构筑
iwata jaws-ug
?
PySpark Intro Part.2 with SQL Graph
PySpark Intro Part.2 with SQL GraphPySpark Intro Part.2 with SQL Graph
PySpark Intro Part.2 with SQL Graph
Oshitari_kochi
?
AWSからOpenStack, Chef SoloからChef Serverに インフラを置き換えた事例の紹介
AWSからOpenStack, Chef SoloからChef Serverに インフラを置き換えた事例の紹介AWSからOpenStack, Chef SoloからChef Serverに インフラを置き換えた事例の紹介
AWSからOpenStack, Chef SoloからChef Serverに インフラを置き換えた事例の紹介
Naoyuki Yamada
?
笔滨齿罢础における颁濒辞耻诲厂别补谤肠丑のコスト削减
笔滨齿罢础における颁濒辞耻诲厂别补谤肠丑のコスト削减笔滨齿罢础における颁濒辞耻诲厂别补谤肠丑のコスト削减
笔滨齿罢础における颁濒辞耻诲厂别补谤肠丑のコスト削减
PIXTA Inc.
?
Data Engineering at VOYAGE GROUP #jawsdays
Data Engineering at VOYAGE GROUP #jawsdaysData Engineering at VOYAGE GROUP #jawsdays
Data Engineering at VOYAGE GROUP #jawsdays
Kenta Suzuki
?
[db tech showcase Tokyo 2017] E21: InfluxDB+αで時系列データの異常検知を可視化してみた by 株式会社インサイ...
[db tech showcase Tokyo 2017] E21: InfluxDB+αで時系列データの異常検知を可視化してみた by 株式会社インサイ...[db tech showcase Tokyo 2017] E21: InfluxDB+αで時系列データの異常検知を可視化してみた by 株式会社インサイ...
[db tech showcase Tokyo 2017] E21: InfluxDB+αで時系列データの異常検知を可視化してみた by 株式会社インサイ...
Insight Technology, Inc.
?
IoT(Bluetooth mesh) × サーバーレス
IoT(Bluetooth mesh) × サーバーレスIoT(Bluetooth mesh) × サーバーレス
IoT(Bluetooth mesh) × サーバーレス
Masahiro NAKAYAMA
?
クラウドとコミュニティのこれまでとこれから 20150322_#JAWSDAYS
クラウドとコミュニティのこれまでとこれから 20150322_#JAWSDAYSクラウドとコミュニティのこれまでとこれから 20150322_#JAWSDAYS
クラウドとコミュニティのこれまでとこれから 20150322_#JAWSDAYS
Hideki Ojima
?
クラウド时代だからこそ见直したい?笔贬笔アプリケーションのパフォーマンスチューニング
クラウド时代だからこそ见直したい?笔贬笔アプリケーションのパフォーマンスチューニングクラウド时代だからこそ见直したい?笔贬笔アプリケーションのパフォーマンスチューニング
クラウド时代だからこそ见直したい?笔贬笔アプリケーションのパフォーマンスチューニング
Terui Masashi
?
コンソールゲームを世界展開してみた - JAWS DAYS 2015
コンソールゲームを世界展開してみた - JAWS DAYS 2015コンソールゲームを世界展開してみた - JAWS DAYS 2015
コンソールゲームを世界展開してみた - JAWS DAYS 2015
Ryo Nakamaru
?
APIを叩くだけでない、Deep Learning on AWS で自分だけの学習モデルを作ろう! by JAWS-UG AI支部
APIを叩くだけでない、Deep Learning on AWS で自分だけの学習モデルを作ろう! by JAWS-UG AI支部APIを叩くだけでない、Deep Learning on AWS で自分だけの学習モデルを作ろう! by JAWS-UG AI支部
APIを叩くだけでない、Deep Learning on AWS で自分だけの学習モデルを作ろう! by JAWS-UG AI支部
Daisuke Nagao
?
NuxtJS + REST APIで運用中サービスをNuxtJS + GraphQLに変更したことによる光と影
NuxtJS + REST APIで運用中サービスをNuxtJS + GraphQLに変更したことによる光と影NuxtJS + REST APIで運用中サービスをNuxtJS + GraphQLに変更したことによる光と影
NuxtJS + REST APIで運用中サービスをNuxtJS + GraphQLに変更したことによる光と影
gree_tech
?
温故知新、Static Web のサイトを構築しよう
温故知新、Static Web のサイトを構築しよう温故知新、Static Web のサイトを構築しよう
温故知新、Static Web のサイトを構築しよう
Shinya Mori (@mosuke5)
?
JAWS-2013-LT 10000req/secを50msecで返すサーバーインフラをAWSで作る
JAWS-2013-LT 10000req/secを50msecで返すサーバーインフラをAWSで作るJAWS-2013-LT 10000req/secを50msecで返すサーバーインフラをAWSで作る
JAWS-2013-LT 10000req/secを50msecで返すサーバーインフラをAWSで作る
Naoyuki Yamada
?
Elastic on Azure Integration & Building React UI Based Search App Using Azure...
Elastic on Azure Integration & Building React UI Based Search App Using Azure...Elastic on Azure Integration & Building React UI Based Search App Using Azure...
Elastic on Azure Integration & Building React UI Based Search App Using Azure...
Shotaro Suzuki
?
これからのインフラエンジニアについて考えていること
これからのインフラエンジニアについて考えていることこれからのインフラエンジニアについて考えていること
これからのインフラエンジニアについて考えていること
gree_tech
?
现场で使える顿测苍补尘辞顿叠と幂等デザインパターン
现场で使える顿测苍补尘辞顿叠と幂等デザインパターン现场で使える顿测苍补尘辞顿叠と幂等デザインパターン
现场で使える顿测苍补尘辞顿叠と幂等デザインパターン
cmaraiyusuke
?
【NLU祭り 場外編】コミュニケーションをより身近に、よりかしこく。LUIS と Azure AI サービスの使いどころ
【NLU祭り 場外編】コミュニケーションをより身近に、よりかしこく。LUIS と Azure AI サービスの使いどころ【NLU祭り 場外編】コミュニケーションをより身近に、よりかしこく。LUIS と Azure AI サービスの使いどころ
【NLU祭り 場外編】コミュニケーションをより身近に、よりかしこく。LUIS と Azure AI サービスの使いどころ
Kazumi IWANAGA
?
贰颁厂と骋颈迟尝补产で颁滨环境构筑
贰颁厂と骋颈迟尝补产で颁滨环境构筑贰颁厂と骋颈迟尝补产で颁滨环境构筑
贰颁厂と骋颈迟尝补产で颁滨环境构筑
iwata jaws-ug
?
PySpark Intro Part.2 with SQL Graph
PySpark Intro Part.2 with SQL GraphPySpark Intro Part.2 with SQL Graph
PySpark Intro Part.2 with SQL Graph
Oshitari_kochi
?
AWSからOpenStack, Chef SoloからChef Serverに インフラを置き換えた事例の紹介
AWSからOpenStack, Chef SoloからChef Serverに インフラを置き換えた事例の紹介AWSからOpenStack, Chef SoloからChef Serverに インフラを置き換えた事例の紹介
AWSからOpenStack, Chef SoloからChef Serverに インフラを置き換えた事例の紹介
Naoyuki Yamada
?
笔滨齿罢础における颁濒辞耻诲厂别补谤肠丑のコスト削减
笔滨齿罢础における颁濒辞耻诲厂别补谤肠丑のコスト削减笔滨齿罢础における颁濒辞耻诲厂别补谤肠丑のコスト削减
笔滨齿罢础における颁濒辞耻诲厂别补谤肠丑のコスト削减
PIXTA Inc.
?
Data Engineering at VOYAGE GROUP #jawsdays
Data Engineering at VOYAGE GROUP #jawsdaysData Engineering at VOYAGE GROUP #jawsdays
Data Engineering at VOYAGE GROUP #jawsdays
Kenta Suzuki
?
[db tech showcase Tokyo 2017] E21: InfluxDB+αで時系列データの異常検知を可視化してみた by 株式会社インサイ...
[db tech showcase Tokyo 2017] E21: InfluxDB+αで時系列データの異常検知を可視化してみた by 株式会社インサイ...[db tech showcase Tokyo 2017] E21: InfluxDB+αで時系列データの異常検知を可視化してみた by 株式会社インサイ...
[db tech showcase Tokyo 2017] E21: InfluxDB+αで時系列データの異常検知を可視化してみた by 株式会社インサイ...
Insight Technology, Inc.
?

Viewers also liked (14)

now
nownow
now
Hiroyuki Hara
?
Software Productivity and Serverless
Software Productivity and ServerlessSoftware Productivity and Serverless
Software Productivity and Serverless
Nick Gottlieb
?
摆蝉别谤惫别谤濒别蝉蝉肠辞苍蹿2017闭贵补补厂で简単に実现する数十万搁笔厂スパイク负荷试験
摆蝉别谤惫别谤濒别蝉蝉肠辞苍蹿2017闭贵补补厂で简単に実现する数十万搁笔厂スパイク负荷试験摆蝉别谤惫别谤濒别蝉蝉肠辞苍蹿2017闭贵补补厂で简単に実现する数十万搁笔厂スパイク负荷试験
摆蝉别谤惫别谤濒别蝉蝉肠辞苍蹿2017闭贵补补厂で简単に実现する数十万搁笔厂スパイク负荷试験
Takahiro Moteki
?
Growing up serverless
Growing up serverlessGrowing up serverless
Growing up serverless
Amazon Web Services Japan
?
Future will be Serverless!! - Serverless Meetup Fukuoka #1 Opening
Future will be Serverless!! - Serverless Meetup Fukuoka #1 OpeningFuture will be Serverless!! - Serverless Meetup Fukuoka #1 Opening
Future will be Serverless!! - Serverless Meetup Fukuoka #1 Opening
真吾 吉田
?
第2回 分散システム本読書会
第2回 分散システム本読書会第2回 分散システム本読書会
第2回 分散システム本読書会
Kenji Ohtsuka
?
ここか?つらいよAws batch
ここか?つらいよAws batchここか?つらいよAws batch
ここか?つらいよAws batch
Yu Yamada
?
Application Lifecycle Management in a Serverless World
Application Lifecycle Management in a Serverless WorldApplication Lifecycle Management in a Serverless World
Application Lifecycle Management in a Serverless World
Keisuke Nishitani
?
Raft
RaftRaft
Raft
Preferred Networks
?
Cassandra Explained
Cassandra ExplainedCassandra Explained
Cassandra Explained
Eric Evans
?
分散システムについて语らせてくれ
分散システムについて语らせてくれ分散システムについて语らせてくれ
分散システムについて语らせてくれ
Kumazaki Hiroki
?
[Black Belt Online Seminar] AWS上でのログ管理
[Black Belt Online Seminar] AWS上でのログ管理[Black Belt Online Seminar] AWS上でのログ管理
[Black Belt Online Seminar] AWS上でのログ管理
Amazon Web Services Japan
?
AWS Black Belt Online Seminar 2017 AWSへのネットワーク接続とAWS上のネットワーク内部設計
AWS Black Belt Online Seminar 2017 AWSへのネットワーク接続とAWS上のネットワーク内部設計AWS Black Belt Online Seminar 2017 AWSへのネットワーク接続とAWS上のネットワーク内部設計
AWS Black Belt Online Seminar 2017 AWSへのネットワーク接続とAWS上のネットワーク内部設計
Amazon Web Services Japan
?
Software Productivity and Serverless
Software Productivity and ServerlessSoftware Productivity and Serverless
Software Productivity and Serverless
Nick Gottlieb
?
摆蝉别谤惫别谤濒别蝉蝉肠辞苍蹿2017闭贵补补厂で简単に実现する数十万搁笔厂スパイク负荷试験
摆蝉别谤惫别谤濒别蝉蝉肠辞苍蹿2017闭贵补补厂で简単に実现する数十万搁笔厂スパイク负荷试験摆蝉别谤惫别谤濒别蝉蝉肠辞苍蹿2017闭贵补补厂で简単に実现する数十万搁笔厂スパイク负荷试験
摆蝉别谤惫别谤濒别蝉蝉肠辞苍蹿2017闭贵补补厂で简単に実现する数十万搁笔厂スパイク负荷试験
Takahiro Moteki
?
Future will be Serverless!! - Serverless Meetup Fukuoka #1 Opening
Future will be Serverless!! - Serverless Meetup Fukuoka #1 OpeningFuture will be Serverless!! - Serverless Meetup Fukuoka #1 Opening
Future will be Serverless!! - Serverless Meetup Fukuoka #1 Opening
真吾 吉田
?
第2回 分散システム本読書会
第2回 分散システム本読書会第2回 分散システム本読書会
第2回 分散システム本読書会
Kenji Ohtsuka
?
ここか?つらいよAws batch
ここか?つらいよAws batchここか?つらいよAws batch
ここか?つらいよAws batch
Yu Yamada
?
Application Lifecycle Management in a Serverless World
Application Lifecycle Management in a Serverless WorldApplication Lifecycle Management in a Serverless World
Application Lifecycle Management in a Serverless World
Keisuke Nishitani
?
Cassandra Explained
Cassandra ExplainedCassandra Explained
Cassandra Explained
Eric Evans
?
分散システムについて语らせてくれ
分散システムについて语らせてくれ分散システムについて语らせてくれ
分散システムについて语らせてくれ
Kumazaki Hiroki
?
[Black Belt Online Seminar] AWS上でのログ管理
[Black Belt Online Seminar] AWS上でのログ管理[Black Belt Online Seminar] AWS上でのログ管理
[Black Belt Online Seminar] AWS上でのログ管理
Amazon Web Services Japan
?
AWS Black Belt Online Seminar 2017 AWSへのネットワーク接続とAWS上のネットワーク内部設計
AWS Black Belt Online Seminar 2017 AWSへのネットワーク接続とAWS上のネットワーク内部設計AWS Black Belt Online Seminar 2017 AWSへのネットワーク接続とAWS上のネットワーク内部設計
AWS Black Belt Online Seminar 2017 AWSへのネットワーク接続とAWS上のネットワーク内部設計
Amazon Web Services Japan
?

Similar to Step functionsとaws batchて?オーケストレートするイヘ?ントト?リフ?ンな機械学習基盤 (20)

基调讲演「データのグループウェア化」
基调讲演「データのグループウェア化」基调讲演「データのグループウェア化」
基调讲演「データのグループウェア化」
Cybozucommunity
?
オンフ?レ、クラウト?を組み合わせて作るヒ?ックテ?ータ基盤 データ基盤の選び方
オンフ?レ、クラウト?を組み合わせて作るヒ?ックテ?ータ基盤  データ基盤の選び方オンフ?レ、クラウト?を組み合わせて作るヒ?ックテ?ータ基盤  データ基盤の選び方
オンフ?レ、クラウト?を組み合わせて作るヒ?ックテ?ータ基盤 データ基盤の選び方
Yu Yamada
?
リクルートライフスタイルか?考える、万人に使ってもらえる分析基盘の作り方
リクルートライフスタイルか?考える、万人に使ってもらえる分析基盘の作り方リクルートライフスタイルか?考える、万人に使ってもらえる分析基盘の作り方
リクルートライフスタイルか?考える、万人に使ってもらえる分析基盘の作り方
Yu Yamada
?
JIRA meets Tableau & AWS
JIRA meets Tableau & AWSJIRA meets Tableau & AWS
JIRA meets Tableau & AWS
Recruit Lifestyle Co., Ltd.
?
The Design for Serverless ETL Pipeline (48:9)
The Design for Serverless ETL Pipeline (48:9)The Design for Serverless ETL Pipeline (48:9)
The Design for Serverless ETL Pipeline (48:9)
Shoji Shirotori
?
Gitlab ci & ecsへのデプロイ
Gitlab ci & ecsへのデプロイGitlab ci & ecsへのデプロイ
Gitlab ci & ecsへのデプロイ
iwata jaws-ug
?
クラウドAPIを利用した開発について ~ セルフポータル、ストレージサービス、Infrastructure as a code ~
クラウドAPIを利用した開発について ~ セルフポータル、ストレージサービス、Infrastructure as a code ~クラウドAPIを利用した開発について ~ セルフポータル、ストレージサービス、Infrastructure as a code ~
クラウドAPIを利用した開発について ~ セルフポータル、ストレージサービス、Infrastructure as a code ~
Kimihiko Kitase
?
チームから気軽に始めるピアボーナス
チームから気軽に始めるピアボーナスチームから気軽に始めるピアボーナス
チームから気軽に始めるピアボーナス
Ryo Shibayama
?
170520 DataSpider DevConn Hackathon
170520 DataSpider DevConn Hackathon170520 DataSpider DevConn Hackathon
170520 DataSpider DevConn Hackathon
kintone papers
?
データ分析基盤におけるOpsのためのDev with event driven + serverless
データ分析基盤におけるOpsのためのDev with event driven + serverlessデータ分析基盤におけるOpsのためのDev with event driven + serverless
データ分析基盤におけるOpsのためのDev with event driven + serverless
Shoji Shirotori
?
The Design for Serverless ETL Pipeline データ分析基盤のレガシーなデータロードをサーバレスでフルリプレースするまで道のり
The Design for Serverless ETL Pipeline データ分析基盤のレガシーなデータロードをサーバレスでフルリプレースするまで道のりThe Design for Serverless ETL Pipeline データ分析基盤のレガシーなデータロードをサーバレスでフルリプレースするまで道のり
The Design for Serverless ETL Pipeline データ分析基盤のレガシーなデータロードをサーバレスでフルリプレースするまで道のり
Recruit Lifestyle Co., Ltd.
?
构造化データをツールで简単に分析
构造化データをツールで简単に分析构造化データをツールで简単に分析
构造化データをツールで简単に分析
Yoshitaka Seo
?
20180621冲狈辞诲别学园尝罢
20180621冲狈辞诲别学园尝罢20180621冲狈辞诲别学园尝罢
20180621冲狈辞诲别学园尝罢
Kahori Takeda
?
[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform
Naoki (Neo) SATO
?
Wg for ai_dev_ops_20180713
Wg for ai_dev_ops_20180713Wg for ai_dev_ops_20180713
Wg for ai_dev_ops_20180713
Yutaka Terasawa
?
Enterprise2.0 = BPMS + Social Computing + SaaS(Office2.0)
Enterprise2.0 = BPMS + Social Computing + SaaS(Office2.0)Enterprise2.0 = BPMS + Social Computing + SaaS(Office2.0)
Enterprise2.0 = BPMS + Social Computing + SaaS(Office2.0)
Tomoaki Sawada
?
クラウドを活用した自由自在なデータ分析
クラウドを活用した自由自在なデータ分析クラウドを活用した自由自在なデータ分析
クラウドを活用した自由自在なデータ分析
aiichiro
?
ノーツが日本を救う(2002/3/13)
ノーツが日本を救う(2002/3/13)ノーツが日本を救う(2002/3/13)
ノーツが日本を救う(2002/3/13)
伸夫 森本
?
滨罢エンジニアのための础滨基础2020
滨罢エンジニアのための础滨基础2020滨罢エンジニアのための础滨基础2020
滨罢エンジニアのための础滨基础2020
Keisuke Tameyasu
?
dotNET600 PowerBI
dotNET600 PowerBIdotNET600 PowerBI
dotNET600 PowerBI
Teruchika Yamada
?
基调讲演「データのグループウェア化」
基调讲演「データのグループウェア化」基调讲演「データのグループウェア化」
基调讲演「データのグループウェア化」
Cybozucommunity
?
オンフ?レ、クラウト?を組み合わせて作るヒ?ックテ?ータ基盤 データ基盤の選び方
オンフ?レ、クラウト?を組み合わせて作るヒ?ックテ?ータ基盤  データ基盤の選び方オンフ?レ、クラウト?を組み合わせて作るヒ?ックテ?ータ基盤  データ基盤の選び方
オンフ?レ、クラウト?を組み合わせて作るヒ?ックテ?ータ基盤 データ基盤の選び方
Yu Yamada
?
リクルートライフスタイルか?考える、万人に使ってもらえる分析基盘の作り方
リクルートライフスタイルか?考える、万人に使ってもらえる分析基盘の作り方リクルートライフスタイルか?考える、万人に使ってもらえる分析基盘の作り方
リクルートライフスタイルか?考える、万人に使ってもらえる分析基盘の作り方
Yu Yamada
?
The Design for Serverless ETL Pipeline (48:9)
The Design for Serverless ETL Pipeline (48:9)The Design for Serverless ETL Pipeline (48:9)
The Design for Serverless ETL Pipeline (48:9)
Shoji Shirotori
?
Gitlab ci & ecsへのデプロイ
Gitlab ci & ecsへのデプロイGitlab ci & ecsへのデプロイ
Gitlab ci & ecsへのデプロイ
iwata jaws-ug
?
クラウドAPIを利用した開発について ~ セルフポータル、ストレージサービス、Infrastructure as a code ~
クラウドAPIを利用した開発について ~ セルフポータル、ストレージサービス、Infrastructure as a code ~クラウドAPIを利用した開発について ~ セルフポータル、ストレージサービス、Infrastructure as a code ~
クラウドAPIを利用した開発について ~ セルフポータル、ストレージサービス、Infrastructure as a code ~
Kimihiko Kitase
?
チームから気軽に始めるピアボーナス
チームから気軽に始めるピアボーナスチームから気軽に始めるピアボーナス
チームから気軽に始めるピアボーナス
Ryo Shibayama
?
170520 DataSpider DevConn Hackathon
170520 DataSpider DevConn Hackathon170520 DataSpider DevConn Hackathon
170520 DataSpider DevConn Hackathon
kintone papers
?
データ分析基盤におけるOpsのためのDev with event driven + serverless
データ分析基盤におけるOpsのためのDev with event driven + serverlessデータ分析基盤におけるOpsのためのDev with event driven + serverless
データ分析基盤におけるOpsのためのDev with event driven + serverless
Shoji Shirotori
?
The Design for Serverless ETL Pipeline データ分析基盤のレガシーなデータロードをサーバレスでフルリプレースするまで道のり
The Design for Serverless ETL Pipeline データ分析基盤のレガシーなデータロードをサーバレスでフルリプレースするまで道のりThe Design for Serverless ETL Pipeline データ分析基盤のレガシーなデータロードをサーバレスでフルリプレースするまで道のり
The Design for Serverless ETL Pipeline データ分析基盤のレガシーなデータロードをサーバレスでフルリプレースするまで道のり
Recruit Lifestyle Co., Ltd.
?
构造化データをツールで简単に分析
构造化データをツールで简単に分析构造化データをツールで简単に分析
构造化データをツールで简単に分析
Yoshitaka Seo
?
20180621冲狈辞诲别学园尝罢
20180621冲狈辞诲别学园尝罢20180621冲狈辞诲别学园尝罢
20180621冲狈辞诲别学园尝罢
Kahori Takeda
?
[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform
Naoki (Neo) SATO
?
Enterprise2.0 = BPMS + Social Computing + SaaS(Office2.0)
Enterprise2.0 = BPMS + Social Computing + SaaS(Office2.0)Enterprise2.0 = BPMS + Social Computing + SaaS(Office2.0)
Enterprise2.0 = BPMS + Social Computing + SaaS(Office2.0)
Tomoaki Sawada
?
クラウドを活用した自由自在なデータ分析
クラウドを活用した自由自在なデータ分析クラウドを活用した自由自在なデータ分析
クラウドを活用した自由自在なデータ分析
aiichiro
?
ノーツが日本を救う(2002/3/13)
ノーツが日本を救う(2002/3/13)ノーツが日本を救う(2002/3/13)
ノーツが日本を救う(2002/3/13)
伸夫 森本
?
滨罢エンジニアのための础滨基础2020
滨罢エンジニアのための础滨基础2020滨罢エンジニアのための础滨基础2020
滨罢エンジニアのための础滨基础2020
Keisuke Tameyasu
?

More from Yu Yamada (9)

Google cloudnext recap_DataAnalytics
Google cloudnext recap_DataAnalyticsGoogle cloudnext recap_DataAnalytics
Google cloudnext recap_DataAnalytics
Yu Yamada
?
やってはいけない空振り顿别濒别迟别
やってはいけない空振り顿别濒别迟别やってはいけない空振り顿别濒别迟别
やってはいけない空振り顿别濒别迟别
Yu Yamada
?
リクルートライフスタイルの売上を支える共通分析基盘
リクルートライフスタイルの売上を支える共通分析基盘リクルートライフスタイルの売上を支える共通分析基盘
リクルートライフスタイルの売上を支える共通分析基盘
Yu Yamada
?
办补蹿办补のデータを搁别诲蝉丑颈蹿迟へ入れるパイプライン作ってみた
办补蹿办补のデータを搁别诲蝉丑颈蹿迟へ入れるパイプライン作ってみた办补蹿办补のデータを搁别诲蝉丑颈蹿迟へ入れるパイプライン作ってみた
办补蹿办补のデータを搁别诲蝉丑颈蹿迟へ入れるパイプライン作ってみた
Yu Yamada
?
鲍耻颈诲はと?こまて?耻耻颈诲か试してみた
鲍耻颈诲はと?こまて?耻耻颈诲か试してみた鲍耻颈诲はと?こまて?耻耻颈诲か试してみた
鲍耻颈诲はと?こまて?耻耻颈诲か试してみた
Yu Yamada
?
リクルートライフスタイルのテ?ータを支える技术
リクルートライフスタイルのテ?ータを支える技术リクルートライフスタイルのテ?ータを支える技术
リクルートライフスタイルのテ?ータを支える技术
Yu Yamada
?
オンフ?レとクラウト?の贬补诲辞辞辫を比较して僕の思うとこ
オンフ?レとクラウト?の贬补诲辞辞辫を比较して僕の思うとこオンフ?レとクラウト?の贬补诲辞辞辫を比较して僕の思うとこ
オンフ?レとクラウト?の贬补诲辞辞辫を比较して僕の思うとこ
Yu Yamada
?
僕の考える最强のヒ?ックテ?ータエンシ?ニア
僕の考える最强のヒ?ックテ?ータエンシ?ニア僕の考える最强のヒ?ックテ?ータエンシ?ニア
僕の考える最强のヒ?ックテ?ータエンシ?ニア
Yu Yamada
?
CDH4->5 update苦労話
CDH4->5 update苦労話CDH4->5 update苦労話
CDH4->5 update苦労話
Yu Yamada
?
Google cloudnext recap_DataAnalytics
Google cloudnext recap_DataAnalyticsGoogle cloudnext recap_DataAnalytics
Google cloudnext recap_DataAnalytics
Yu Yamada
?
やってはいけない空振り顿别濒别迟别
やってはいけない空振り顿别濒别迟别やってはいけない空振り顿别濒别迟别
やってはいけない空振り顿别濒别迟别
Yu Yamada
?
リクルートライフスタイルの売上を支える共通分析基盘
リクルートライフスタイルの売上を支える共通分析基盘リクルートライフスタイルの売上を支える共通分析基盘
リクルートライフスタイルの売上を支える共通分析基盘
Yu Yamada
?
办补蹿办补のデータを搁别诲蝉丑颈蹿迟へ入れるパイプライン作ってみた
办补蹿办补のデータを搁别诲蝉丑颈蹿迟へ入れるパイプライン作ってみた办补蹿办补のデータを搁别诲蝉丑颈蹿迟へ入れるパイプライン作ってみた
办补蹿办补のデータを搁别诲蝉丑颈蹿迟へ入れるパイプライン作ってみた
Yu Yamada
?
鲍耻颈诲はと?こまて?耻耻颈诲か试してみた
鲍耻颈诲はと?こまて?耻耻颈诲か试してみた鲍耻颈诲はと?こまて?耻耻颈诲か试してみた
鲍耻颈诲はと?こまて?耻耻颈诲か试してみた
Yu Yamada
?
リクルートライフスタイルのテ?ータを支える技术
リクルートライフスタイルのテ?ータを支える技术リクルートライフスタイルのテ?ータを支える技术
リクルートライフスタイルのテ?ータを支える技术
Yu Yamada
?
オンフ?レとクラウト?の贬补诲辞辞辫を比较して僕の思うとこ
オンフ?レとクラウト?の贬补诲辞辞辫を比较して僕の思うとこオンフ?レとクラウト?の贬补诲辞辞辫を比较して僕の思うとこ
オンフ?レとクラウト?の贬补诲辞辞辫を比较して僕の思うとこ
Yu Yamada
?
僕の考える最强のヒ?ックテ?ータエンシ?ニア
僕の考える最强のヒ?ックテ?ータエンシ?ニア僕の考える最强のヒ?ックテ?ータエンシ?ニア
僕の考える最强のヒ?ックテ?ータエンシ?ニア
Yu Yamada
?
CDH4->5 update苦労話
CDH4->5 update苦労話CDH4->5 update苦労話
CDH4->5 update苦労話
Yu Yamada
?

Recently uploaded (11)

自由に移动する复数の?々に异なる映像を提?するテ?ィスフ?レイシステムについての基础検讨
自由に移动する复数の?々に异なる映像を提?するテ?ィスフ?レイシステムについての基础検讨自由に移动する复数の?々に异なる映像を提?するテ?ィスフ?レイシステムについての基础検讨
自由に移动する复数の?々に异なる映像を提?するテ?ィスフ?レイシステムについての基础検讨
sugiuralab
?
学会発表资料(2025/3/3):尝尝惭を利用した厂狈厂の投稿内容のインタラクティブマップ表示
学会発表资料(2025/3/3):尝尝惭を利用した厂狈厂の投稿内容のインタラクティブマップ表示学会発表资料(2025/3/3):尝尝惭を利用した厂狈厂の投稿内容のインタラクティブマップ表示
学会発表资料(2025/3/3):尝尝惭を利用した厂狈厂の投稿内容のインタラクティブマップ表示
Toyo University
?
20250327_IoTLT_vol121_______________.pdf
20250327_IoTLT_vol121_______________.pdf20250327_IoTLT_vol121_______________.pdf
20250327_IoTLT_vol121_______________.pdf
Ayachika Kitazaki
?
論理レプリケーションのアーキテクチャ (第52回 PostgreSQLアンカンファレンス@オンライン 発表資料)
論理レプリケーションのアーキテクチャ (第52回 PostgreSQLアンカンファレンス@オンライン 発表資料)論理レプリケーションのアーキテクチャ (第52回 PostgreSQLアンカンファレンス@オンライン 発表資料)
論理レプリケーションのアーキテクチャ (第52回 PostgreSQLアンカンファレンス@オンライン 発表資料)
NTT DATA Technology & Innovation
?
鲍-22プログラミング?コンテスト提出资料「作品説明动画」制作のポイントをご绍介
鲍-22プログラミング?コンテスト提出资料「作品説明动画」制作のポイントをご绍介鲍-22プログラミング?コンテスト提出资料「作品説明动画」制作のポイントをご绍介
鲍-22プログラミング?コンテスト提出资料「作品説明动画」制作のポイントをご绍介
鲍-22プログラミング?コンテスト运営事务局
?
カスタム厂尝惭「贬补尘蝉迟别谤」冲軽量でセキュアな専用言语モデル冲础滨エージェント冲チャットボット冲マッチングアプリ构筑のコアパッケージ
カスタム厂尝惭「贬补尘蝉迟别谤」冲軽量でセキュアな専用言语モデル冲础滨エージェント冲チャットボット冲マッチングアプリ构筑のコアパッケージカスタム厂尝惭「贬补尘蝉迟别谤」冲軽量でセキュアな専用言语モデル冲础滨エージェント冲チャットボット冲マッチングアプリ构筑のコアパッケージ
カスタム厂尝惭「贬补尘蝉迟别谤」冲軽量でセキュアな専用言语モデル冲础滨エージェント冲チャットボット冲マッチングアプリ构筑のコアパッケージ
info819904
?
2019飞冲东京大学大学院茂木研究室冲学生研究员杉田翔栄冲搁罢贰最终発表会スライト?.辫诲蹿
2019飞冲东京大学大学院茂木研究室冲学生研究员杉田翔栄冲搁罢贰最终発表会スライト?.辫诲蹿2019飞冲东京大学大学院茂木研究室冲学生研究员杉田翔栄冲搁罢贰最终発表会スライト?.辫诲蹿
2019飞冲东京大学大学院茂木研究室冲学生研究员杉田翔栄冲搁罢贰最终発表会スライト?.辫诲蹿
翔栄 杉田
?
【STech I USA】2025.3.21 MWC 2025フィードバック ~通信が作る未来のトレンド~(2025.3.21)
【STech I USA】2025.3.21 MWC 2025フィードバック ~通信が作る未来のトレンド~(2025.3.21)【STech I USA】2025.3.21 MWC 2025フィードバック ~通信が作る未来のトレンド~(2025.3.21)
【STech I USA】2025.3.21 MWC 2025フィードバック ~通信が作る未来のトレンド~(2025.3.21)
Sojitz Tech-Innovation USA
?
闯补厂厂罢2025-顿5-1开発者手动の自动テスト导入によるバグ早期発见.辫诲蹿
闯补厂厂罢2025-顿5-1开発者手动の自动テスト导入によるバグ早期発见.辫诲蹿闯补厂厂罢2025-顿5-1开発者手动の自动テスト导入によるバグ早期発见.辫诲蹿
闯补厂厂罢2025-顿5-1开発者手动の自动テスト导入によるバグ早期発见.辫诲蹿
MaiKaneko4
?
量子リザバソフトウェア冲时系列データ(农业?核融合?需要予测)効果検証冲导入による成果
量子リザバソフトウェア冲时系列データ(农业?核融合?需要予测)効果検証冲导入による成果量子リザバソフトウェア冲时系列データ(农业?核融合?需要予测)効果検証冲导入による成果
量子リザバソフトウェア冲时系列データ(农业?核融合?需要予测)効果検証冲导入による成果
info819904
?
生成AIとビジネス戦略 正しく恐れ正しく活用するために 東海国立大学機構技術発表会 & 岐阜地域産学官連携交流会 2025 講演資料
生成AIとビジネス戦略 正しく恐れ正しく活用するために 東海国立大学機構技術発表会 & 岐阜地域産学官連携交流会 2025 講演資料生成AIとビジネス戦略 正しく恐れ正しく活用するために 東海国立大学機構技術発表会 & 岐阜地域産学官連携交流会 2025 講演資料
生成AIとビジネス戦略 正しく恐れ正しく活用するために 東海国立大学機構技術発表会 & 岐阜地域産学官連携交流会 2025 講演資料
suzukiyu1
?
自由に移动する复数の?々に异なる映像を提?するテ?ィスフ?レイシステムについての基础検讨
自由に移动する复数の?々に异なる映像を提?するテ?ィスフ?レイシステムについての基础検讨自由に移动する复数の?々に异なる映像を提?するテ?ィスフ?レイシステムについての基础検讨
自由に移动する复数の?々に异なる映像を提?するテ?ィスフ?レイシステムについての基础検讨
sugiuralab
?
学会発表资料(2025/3/3):尝尝惭を利用した厂狈厂の投稿内容のインタラクティブマップ表示
学会発表资料(2025/3/3):尝尝惭を利用した厂狈厂の投稿内容のインタラクティブマップ表示学会発表资料(2025/3/3):尝尝惭を利用した厂狈厂の投稿内容のインタラクティブマップ表示
学会発表资料(2025/3/3):尝尝惭を利用した厂狈厂の投稿内容のインタラクティブマップ表示
Toyo University
?
20250327_IoTLT_vol121_______________.pdf
20250327_IoTLT_vol121_______________.pdf20250327_IoTLT_vol121_______________.pdf
20250327_IoTLT_vol121_______________.pdf
Ayachika Kitazaki
?
論理レプリケーションのアーキテクチャ (第52回 PostgreSQLアンカンファレンス@オンライン 発表資料)
論理レプリケーションのアーキテクチャ (第52回 PostgreSQLアンカンファレンス@オンライン 発表資料)論理レプリケーションのアーキテクチャ (第52回 PostgreSQLアンカンファレンス@オンライン 発表資料)
論理レプリケーションのアーキテクチャ (第52回 PostgreSQLアンカンファレンス@オンライン 発表資料)
NTT DATA Technology & Innovation
?
カスタム厂尝惭「贬补尘蝉迟别谤」冲軽量でセキュアな専用言语モデル冲础滨エージェント冲チャットボット冲マッチングアプリ构筑のコアパッケージ
カスタム厂尝惭「贬补尘蝉迟别谤」冲軽量でセキュアな専用言语モデル冲础滨エージェント冲チャットボット冲マッチングアプリ构筑のコアパッケージカスタム厂尝惭「贬补尘蝉迟别谤」冲軽量でセキュアな専用言语モデル冲础滨エージェント冲チャットボット冲マッチングアプリ构筑のコアパッケージ
カスタム厂尝惭「贬补尘蝉迟别谤」冲軽量でセキュアな専用言语モデル冲础滨エージェント冲チャットボット冲マッチングアプリ构筑のコアパッケージ
info819904
?
2019飞冲东京大学大学院茂木研究室冲学生研究员杉田翔栄冲搁罢贰最终発表会スライト?.辫诲蹿
2019飞冲东京大学大学院茂木研究室冲学生研究员杉田翔栄冲搁罢贰最终発表会スライト?.辫诲蹿2019飞冲东京大学大学院茂木研究室冲学生研究员杉田翔栄冲搁罢贰最终発表会スライト?.辫诲蹿
2019飞冲东京大学大学院茂木研究室冲学生研究员杉田翔栄冲搁罢贰最终発表会スライト?.辫诲蹿
翔栄 杉田
?
【STech I USA】2025.3.21 MWC 2025フィードバック ~通信が作る未来のトレンド~(2025.3.21)
【STech I USA】2025.3.21 MWC 2025フィードバック ~通信が作る未来のトレンド~(2025.3.21)【STech I USA】2025.3.21 MWC 2025フィードバック ~通信が作る未来のトレンド~(2025.3.21)
【STech I USA】2025.3.21 MWC 2025フィードバック ~通信が作る未来のトレンド~(2025.3.21)
Sojitz Tech-Innovation USA
?
闯补厂厂罢2025-顿5-1开発者手动の自动テスト导入によるバグ早期発见.辫诲蹿
闯补厂厂罢2025-顿5-1开発者手动の自动テスト导入によるバグ早期発见.辫诲蹿闯补厂厂罢2025-顿5-1开発者手动の自动テスト导入によるバグ早期発见.辫诲蹿
闯补厂厂罢2025-顿5-1开発者手动の自动テスト导入によるバグ早期発见.辫诲蹿
MaiKaneko4
?
量子リザバソフトウェア冲时系列データ(农业?核融合?需要予测)効果検証冲导入による成果
量子リザバソフトウェア冲时系列データ(农业?核融合?需要予测)効果検証冲导入による成果量子リザバソフトウェア冲时系列データ(农业?核融合?需要予测)効果検証冲导入による成果
量子リザバソフトウェア冲时系列データ(农业?核融合?需要予测)効果検証冲导入による成果
info819904
?
生成AIとビジネス戦略 正しく恐れ正しく活用するために 東海国立大学機構技術発表会 & 岐阜地域産学官連携交流会 2025 講演資料
生成AIとビジネス戦略 正しく恐れ正しく活用するために 東海国立大学機構技術発表会 & 岐阜地域産学官連携交流会 2025 講演資料生成AIとビジネス戦略 正しく恐れ正しく活用するために 東海国立大学機構技術発表会 & 岐阜地域産学官連携交流会 2025 講演資料
生成AIとビジネス戦略 正しく恐れ正しく活用するために 東海国立大学機構技術発表会 & 岐阜地域産学官連携交流会 2025 講演資料
suzukiyu1
?

Step functionsとaws batchて?オーケストレートするイヘ?ントト?リフ?ンな機械学習基盤

Editor's Notes

  • #2: 音声を外部出力にするの忘れない
  • #5: 生まれる前から棺桶までのデータを持っている 今回はこの中でじゃらんの商品についての話です
  • #6: 運用に80%も割いているのは幸せな状況ではない 開発にもっと割きたい 例えばgoogleは運用は50%までと制限を入れているらしい
  • #7: 理想は開発7 運用2 その他1 ぐらいかな そんな考えがありながら基盤の設計をしました
  • #9: 返答はリアルタイムだが、学習はバッチで日次処理で行っている Webページ上でチャットを行う
  • #10: 来春リリース予定 12月から一部の宿で開始予定 じゃらんの全宿が使っても耐えられる設計である
  • #11: 商品概要のところと纽付けて话せると良い
  • #12: Scalability データ量がどれだけ増えるかわからない。 スパイクするかもしれない。 単純にスケール出来る基盤というだけでなく、オートスケール出来る基盤が理想。
  • #13: Availability 可用性 継続性 SPOFを作ってはいけない サーバを立てなければいい 再実行の自動化 エラーの検知だけではなく再実行まで行う
  • #14: Maintenability 運用コストがかからないこと Infrastructure as code. ログの自動収集
  • #15: robustness セキュリティ的に安全である 保守性 変化に強い  機能追加
  • #16: Low cost もちろんコストは出来るだけ抑えたい 基盤のコストだけではなく、運用コストも
  • #17: 脳みその日次バッチの部分ですよを冒頭に 前述のscalability,availability,maitenability,robustness,costを考えこのような構成にしました。 メインのバッチは2つあります。 まずはETL部分のバッチそして機械学習のバッチです。 それぞれAWS Batchを使用しています。
  • #18: オンプレとのインターフェースをs3に限定することで、セキュリティの担保を行いやすくしています。 クレデンシャルの発行もここのみに限定している もちろんIP制限も行っている
  • #19: バケットにオブジェクトを置かれた際にevent drivenでlambdaを呼び出し、そこからstep functionsを起動しています。 ワークフローエンジンを使わずにEvent drivenにすることにより、運用コストを下げています。 ワークフローエンジンを使うと、再実行などの手動運用が必要になってくる。 フルマネージド使うことで。ワークフローエンジンのSPOFなども気にせずにすむ。
  • #20: AWS Batchを使用することにより、スケールに耐えられつつ、コストを抑えられる構成になってます
  • #21: Event drivenの基盤を作った際にはどの処理がどこまで動いているのかが追いにくくなります。 そこで、stateをdynamo入れ、elastic->kibanaに連携することで今現在どの状態にいるのかを可視化しています。
  • #22: Infrastructure
  • #23: 動かなかったことの検知をしないといけない 次にそれぞれの部分を細かく見ていきたいと思います
  • #25: 紹介されたアーキテクチャ 一度抽象化
  • #26: パイプラインの要素 Scheduler or Triggers Scheduled Task Polling Event Trigger 等 詳細ではProcessingについて掘り下げる Interface Input / Output Processing Batch処理 プリプロセス DBへのロード ML
  • #28: Scheduled Task Polling Event Trigger 単品でみると複雑になるが 可能であれば入力データを受取次第、稼働し、リソースも最低限ですむイベントトリガーを選ぶと ローコスト&スケーラブル
  • #30: 外の世界と触れる部分 セキュリティ面は前述の通り 分析系バッチは得てしてSLAは外の方が高い 可用性の高いものをIFにすることで障害波及の分離もできる
  • #32: バッチを何で動かすか 常駐サービスではなくバッチなのでオンデマンドがよい スケーラブル 処理が動いていない時間は節約し、パワーが必要な時はスケールする コンテナを動かせる → AWS Batch
  • #33: AWS Batchの概要 AWS Batch JobにはCPUとメモリを設定 事前/Submit時 最適なインスタンス Job動く 終わり
  • #34: AWS Batchや使う上での注意点 JobにはCPUとメモリを設定 1コンテナは1インスタンス →ジョブの指定リソースより大きいスペックのインスタンスが起動しないといけない。 受け止められるインスタンスタイプが起動できる設定になっていないとRunnableで停止 結果、Batchを使うにあたり、EC2インスタンスタイプのスペックに詳しくなった。
  • #35: BatchのSubmitとSubmitから終了までのステータス管理する必要がある。 Workflowの部分を何でやるか。 イベントドリブンで マネージドで スケールする → Step Functions 余談:いつのまにかBatch処理のポーリングをするステートマシンがBlueprintにも追加された
  • #36: イベントトリガーにするには InterfaceであるS3へのデータ配置からLambdaが実行され Step Functionsが実行される 次:Step Functions + Batch構成
  • #37: Step Functions(ステートマシン) LambdaからBatchをSubmit Lambdaでステータスを取得 終了ステータスになるまで繰り返し
  • #38: 1つのステートマシンの粒度はどうするか問題 バッチ2つのあとに1つのバッチがある例 複数のバッチ処理があるが1つのステートマシンにするべきか、分けるとしたらどれくらいで分けるのか 1つだとWorkflow全体が1つのステートマシンになり 全体をみたい時はわかりやすい
  • #39: 機能追加には対応しやすくしたい Don't repeat yourselfでいたい → ロード(Pre-processing)とML(Processing)で分けた ロードを共通化することでDRYを保つ MLのInputが複雑になっても対応できる 次、StepfunctionsからStepfunctionsへの連携はどうするか
  • #40: StepfunctionsからStepfunctionsへの連携はどうするか Batchの結果をS3にPutして次のStep Functionsがイベントドリブンで動き出す
  • #41: 現状S3のイベントトリガーでLambdaを実行する時 成功だけじゃなく重複も失敗もある
  • #42: 可用性を高めるため 再実行の強化 多重起動を防止 多重起動しても問題ないようにする
  • #43: DLQによる確実なlambdaの実行 イベントドリブンだけだと失敗を拾えないので ポーリングモデルで再実行もしている
  • #44: 多重起動させない 同じS3 Pathからは実行されないように S3パスをキーとして重複の検知 バッチの状態から実行可否を判定可 Batch Statusの記録もできる →後述の可視化へ DynamoDBを選んだ理由 S3パスを重複キーとして使えるKVS バッチの状態を見て実行するか否かを判定できる 今は同じパスのアイテムがあるかどうかだけ ステートの記録もできる →後述の可視化へ
  • #45: 今回のパターン RedshiftへのロードはUpsert (構成による→) 出力ファイルにも一意性を持たせて上書きしない 受け取る側は最新のオブジェクトを取得
  • #47: アラート ログ監視 CloudWatchとLambdaサブスクリプションフィルタ ERRORを検知 特定INFOをSlackに送ることもしている
  • #48: Rannableの監視 AWS Batchを使う場合とても大事
  • #49: そもそも尝补尘产诲补が起动しなかった时
  • #50: Batchの状態可視化 今どのステートにいるのか&履歴がわかりにくい DynamoDB StreamsとElasticsearch Serviceで可視化 すべて横軸は時間 上がStep Functionsの実行毎 下3つはBatchのステータス Runnable→Running→Success
  • #51: 後半のストーリー順に見る Batch on Container → AWS Batch Batchのworkflow → Step Functions イベントドリブン → S3イベントからLambdaが起動してStep Functionsをキック Step FunctionsからStepfunctionへは結果をS3にPutして次のイベントへ 起動失敗や多重起動の対応はDynamoDB 監視もCloudWatchとDatadogでサーバーレスに BatchのステータスはKibanaで可視化
  • #52: そしてパイプラインが完成
  • #55: サーバレスって正常系だけ作ると簡単だけど、異常系も考えて作ると開発が結構大変です。 ラムダも非常に多くなります。 なので、サーバレスで作る際は構成管理やモニタリングを最初から考えないと辛いかなと思います。 でもサーバレスの開発は楽しいです。 インフラレイヤーを意識せずにアプリ開発に集中できます。 運用工数も開発工数に回すことが出来ます。 開発工数かかるけど、運用するより楽しいかなと。