狠狠撸
Submit Search
巨大なサービスと膨大なデータを支えるプラットフォーム?
Mar 23, 2018
Download as PPTX, PDF
1 like
1,714 views
Tetsutaro Watanabe
Cloud Days 2018<関西>の発表資料になります
Read less
Read more
1 of 29
Download now
Downloaded 11 times
Recommended
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTT DATA Technology & Innovation
?
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~ (NTTデータ テクノロジーカンファレンス 2020 発表資料) 2020年10月14日(水) NTTデータ システム技術本部 デジタル技術部 土橋 昌 講演動画は、YouTubeチャンネル「NTT DATA Tech」にて公開中! https://www.youtube.com/watch?v=gi9stEV45as
データ分析を支える技術 データ分析基盤再入門
データ分析を支える技術 データ分析基盤再入門
Satoru Ishikawa
?
分かりそうで分からない「データ分析基盤」、何のために導入して、どのようにデータを集め、どのような構成でデータを管理?蓄積するのか、欲しいデータの所在や仕様の管理など、コンサルの現場でよく尋ねられる疑問について解説します。 本セッションでは、データ分析基盤を理解するのに必要となる基礎的な要素技術とDX(Digital Transformation)推進において必要とされるデータ管理について解説します。DWH(Data Ware House)やBIツールは使ったことがあるけど、データ分析基盤の違いがよく分からないという人には最適なセッションです。 ?アジェンダ ?データ分析基盤入門 ?分析基盤の構成要素 ?分析基盤のデータ処理 ?分析基盤のデータ管理 ?分析基盤の今後 ?まとめ
MonotaRO のデータ活用と基盤の過去、現在、未来
MonotaRO のデータ活用と基盤の過去、現在、未来
株式会社MonotaRO Tech Team
?
2021/10/28 MonotaRO Tech Talk #9 (データマネジメント編) https://monotaro.connpass.com/event/226592/
大量のデータ処理や分析に使えるOSS Apache Spark入門(Open Source Conference 2021 Online/Kyoto 発表資料)
大量のデータ処理や分析に使えるOSS Apache Spark入門(Open Source Conference 2021 Online/Kyoto 発表資料)
NTT DATA Technology & Innovation
?
大量のデータ処理や分析に使えるOSS Apache Spark入門 - Open Source Conference 2021 Online/Kyotoエディション - (Open Source Conference 2021 Online/Kyoto 発表資料) 2021年7月30日 株式会社NTTデータ 技術開発本部 先進コンピューティング技術センタ 猿田 浩輔
テストコードの DRY と DAMP
テストコードの DRY と DAMP
Yusuke Kagata
?
@PHPerKaigi 2022
継続的なモデルモニタリングを実現するKubernetes Operator
継続的なモデルモニタリングを実現するKubernetes Operator
驰补丑辞辞!デベロッパーネットワーク
?
第18回 MLOps 勉強会の登壇資料です。 https://mlops.connpass.com/event/242652/ MLOpsにおいて重要なModel Monitoringの仕組みを開発するにあたって、整理した要件と実際に開発したシステムについてお話ししました。
事業のグロースを支えるDataOpsの現場 #DataOps #DevSumi #デブサミ
事業のグロースを支えるDataOpsの現場 #DataOps #DevSumi #デブサミ
@yuzutas0 Yokoyama
?
元スライド https://speakerdeck.com/yuzutas0/20180727 Developers Summit 2018 Summer 【C-1】の発表資料です。 https://event.shoeisha.jp/devsumi/20180727/session/1764/ データの民主化、データ基盤の構築、分析チームの立ち上げ、機械学習プロジェクト。世を見渡せばキラキラした事例に溢れています。 しかし、いざ自分たちでやろうとしてもなかなか上手くいきません。理想に辿り着くためには、泥臭い過程が存在します。 本セッションでは「登り方や道のりを知りたいんだ!」という方に向けて、DataOpsの観点から案件?システム?プロセス?文化?組織をエンジニアリングしてきた現場のリアルをご紹介します。 データ活用に携わる全てのエンジニアが今すぐ行動するためのヒントを持ち帰っていただければ幸いです。 以下のブログで補足?裏話を掲載しています。 - http://yuzutas0.hatenablog.com/entry/2018/08/13/083000 - https://recruit-tech.co.jp/blog/2018/08/10/developers_summit_summer2018/ 追記:数あるセッションの中で、アンケート満足度No.1をいただきました。誠にありがとうございます!
分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTT DATA Technology & Innovation
?
分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~ (NTTデータ テクノロジーカンファレンス 2020 発表資料) 2020年10月16日(金) NTTデータ システム技術本部 デジタル技術部 梅森 直人 講演動画は、YouTubeチャンネル「NTT DATA Tech」にて公開中! https://www.youtube.com/watch?v=NDb9nORBT_A
初めてのデータ分析基盘构筑をまかされた、その时何を考えておくと良いのか
初めてのデータ分析基盘构筑をまかされた、その时何を考えておくと良いのか
Techon Organization
?
Tech-on MeetUp Online#02「もしエンタープライズのエンジニアがデータ分析をやることになったら」 @yutah_3 さんの資料です。
PySparkによるジョブを、より速く、よりスケーラブルに実行するための最善の方法 ※講演は翻訳資料にて行います。 - Getting the Best...
PySparkによるジョブを、より速く、よりスケーラブルに実行するための最善の方法 ※講演は翻訳資料にて行います。 - Getting the Best...
Holden Karau
?
PySparkによるジョブを、より速く、よりスケーラブルに実行するための最善の方法 ※講演は翻訳資料にて行います。PySparkによるジョブを、より速く、よりスケーラブルに実行するための最善の方法についてご紹介します。PythonとSparkにおけるJobの高速化に奮闘している方は必聴です。(当講演はSparkの基本を理解している方を対象としています。初めての方は、下記サイトのVideoを事前に視聴することをおすすめします。http://bit.ly/hkPySpark)
Apache Bigtopによるオープンなビッグデータ処理基盤の構築(オープンデベロッパーズカンファレンス 2021 Online 発表資料)
Apache Bigtopによるオープンなビッグデータ処理基盤の構築(オープンデベロッパーズカンファレンス 2021 Online 発表資料)
NTT DATA Technology & Innovation
?
Apache Bigtopによるオープンなビッグデータ処理基盤の構築 (オープンデベロッパーズカンファレンス 2021 Online 発表資料) 2021年8月28日 株式会社NTTデータ 技術開発本部 先進コンピューティング技術センタ 関 堅吾 岩崎 正剛
ビッグデータ処理データベースの全体像と使い分け?2018年惫别谤蝉颈辞苍
ビッグデータ処理データベースの全体像と使い分け?2018年惫别谤蝉颈辞苍
Tetsutaro Watanabe
?
ビッグデータ処理データベースを分类し、2018/9时点で最新のプロダクトを绍介しています。
データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...
データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...
NTT DATA Technology & Innovation
?
データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み (NTTデータ テクノロジーカンファレンス 2020 発表資料) 2020年10月14日(水) NTTデータ システム技術本部 デジタル技術部 八木 香充 NTTデータ システム技術本部 デジタル技術部 大山 真実 講演動画は、YouTubeチャンネル「NTT DATA Tech」にて公開中! https://www.youtube.com/watch?v=zv9rosm-fsY
データ仮想化を活用したデータ分析のフローと分析モデル作成の自动化のご绍介
データ仮想化を活用したデータ分析のフローと分析モデル作成の自动化のご绍介
Denodo
?
Watch full webinar here: https://bit.ly/3QM4bgI データ仮想化(Denodo)を活用した当社の考えるアーキテクチャーの中から今回はDenodoとプログラミング言語の一例としてPythonにフォーカスをあてて、データの理解?データの準備?モデル作成?評価?展開のフローとそれぞれで用いる仕組みと注目ポイントについてご紹介致します。 また分析モデル作成の自動化をご支援する仕組みとしてDataRobotの概要と注目ポイント についてもご紹介致します。
贬补诲辞辞辫入门
贬补诲辞辞辫入门
Preferred Networks
?
Hadoop Conference Japan 2009 「贬补诲辞辞辫入门」の講演資料
「指標」を支えるエンシ?ニアリンク?: DataOpsNight #1
「指標」を支えるエンシ?ニアリンク?: DataOpsNight #1
株式会社MonotaRO Tech Team
?
DataOps Night#1 https://finatext.connpass.com/event/233494/
贬补诲辞辞辫を叠蚕にマイグレしようとしてる话
贬补诲辞辞辫を叠蚕にマイグレしようとしてる话
Recruit Technologies
?
2017/03/29 Google Cloud はやわかりセミナー in 名古屋での、松田の講演資料になります
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
NTT DATA Technology & Innovation
?
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~ (映像情報メディア学会2021年冬季大会企画セッション 発表資料) 2021年12月16日 NTTデータ 山口 永
【マーケティンク??テクノロシ?ーフェア 大阪 2023】 テ?ータから正しい意思決定を行うために ?全社横断て?実施したテ?ータ活用フ?ロシ?ェクトの取...
【マーケティンク??テクノロシ?ーフェア 大阪 2023】 テ?ータから正しい意思決定を行うために ?全社横断て?実施したテ?ータ活用フ?ロシ?ェクトの取...
株式会社MonotaRO Tech Team
?
マーケティンク??テクノロシ?ーフェア 大阪 2023で発表した資料になります
惭尝翱辫蝉はバズワード
惭尝翱辫蝉はバズワード
Tetsutaro Watanabe
?
惭尝翱辫蝉という言叶からは运用という印象を受けますが、惭尝翱辫蝉製品の机能や惭尝翱辫蝉カンファレンスの発表内容をみると、印象とは异なります。本スライドではなぜ惭尝翱辫蝉がバズワードなのか绍介します
テ?ータ収集の基本と「闯补辫补苍罢补虫颈」アフ?リにおける実践例
テ?ータ収集の基本と「闯补辫补苍罢补虫颈」アフ?リにおける実践例
Tetsutaro Watanabe
?
データ収集の基本として、データソース毎に典型的なデータ収集方法を整理して説明しています。また闯补辫补苍罢补虫颈アプリにおいてどのように実践しているかを説明しています。
分散トレーシンク?技術について(Open tracingやjaeger)
分散トレーシンク?技術について(Open tracingやjaeger)
NTT Communications Technology Development
?
勉强会で分散トレーシング技术について调査した内容を発表した资料です。翱辫别苍罢谤补肠颈苍驳や闯补别驳别谤などについてのざっくりとした解説などを行っています。
ビッグデータ処理データベースの全体像と使い分け
ビッグデータ処理データベースの全体像と使い分け
Recruit Technologies
?
2016/07/15 db tech showcase Tokyo 2016での渡部の講演資料になります
pg_bigmで全文検索するときに気を付けたい5つのポイント(第23回PostgreSQLアンカンファレンス@オンライン 発表資料)
pg_bigmで全文検索するときに気を付けたい5つのポイント(第23回PostgreSQLアンカンファレンス@オンライン 発表資料)
NTT DATA Technology & Innovation
?
pg_bigmで全文検索するときに気を付けたい5つのポイント (第23回PostgreSQLアンカンファレンス@オンライン 発表資料) 2021年5月11日 株式会社NTTデータ 技術開発本部 先進コンピューティング技術センタ 藤井 雅雄
pg_hint_planを知る(第37回PostgreSQLアンカンファレンス@オンライン 発表資料)
pg_hint_planを知る(第37回PostgreSQLアンカンファレンス@オンライン 発表資料)
NTT DATA Technology & Innovation
?
pg_hint_planを知る (第37回PostgreSQLアンカンファレンス@オンライン 発表資料) 2022年12月20日(火) NTTデータ 技術開発本部 先進コンピューティング技術センタ 葛木 優太
VSCodeで作るPostgreSQL開発環境(第25回 PostgreSQLアンカンファレンス@オンライン 発表資料)
VSCodeで作るPostgreSQL開発環境(第25回 PostgreSQLアンカンファレンス@オンライン 発表資料)
NTT DATA Technology & Innovation
?
VSCodeで作るPostgreSQL開発環境 (第25回 PostgreSQLアンカンファレンス@オンライン 発表資料) 2021年7月6日 株式会社NTTデータ 技術開発本部 先進コンピューティング技術センタ 加藤 慎也
リクルートを支える横断テ?ータ基盘と机械学习の适用事例
リクルートを支える横断テ?ータ基盘と机械学习の适用事例
Tetsutaro Watanabe
?
Data Platform Confference Tokyo 2017 で話した「リクルートを支える横断テ?ータ基盘と机械学习の适用事例」です
リクルートにおけるデータのインフラ化への取组
リクルートにおけるデータのインフラ化への取组
Recruit Technologies
?
2016/10/07 CEATEC JAPANでの、池田の講演資料になります
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
Tetsutaro Watanabe
?
ビッグデータ処理基盤の分野では、オンプレ?クラウド問わず様々なプロダクトが続々と登場していますが、それぞれの位置づけを明確にします。また代表的なプロダクトについて紹介し、使い分けを明確にします。具体的には、Amazon Redsfhit Spectrum, Cloud Spanner, Big Query, Oracle Exadata, MapR, cloudera, Hortonworks, EMR, Cloud Dataproc, Azure HDInsight, Amazon Athena, TREASURE DATA、Amazon DynamoDB, Azure Cosmos DB, cassandra, HBase, redis, MongoDB, TERADATA, NETEZZA,等を紹介します。
リクルートのビッグデータ活用基盘とデータ活用に向けた取组み
リクルートのビッグデータ活用基盘とデータ活用に向けた取组み
Recruit Technologies
?
2016/02/19 ITインフラTECH forumでの、池田の講演資料になります
More Related Content
What's hot
(20)
初めてのデータ分析基盘构筑をまかされた、その时何を考えておくと良いのか
初めてのデータ分析基盘构筑をまかされた、その时何を考えておくと良いのか
Techon Organization
?
Tech-on MeetUp Online#02「もしエンタープライズのエンジニアがデータ分析をやることになったら」 @yutah_3 さんの資料です。
PySparkによるジョブを、より速く、よりスケーラブルに実行するための最善の方法 ※講演は翻訳資料にて行います。 - Getting the Best...
PySparkによるジョブを、より速く、よりスケーラブルに実行するための最善の方法 ※講演は翻訳資料にて行います。 - Getting the Best...
Holden Karau
?
PySparkによるジョブを、より速く、よりスケーラブルに実行するための最善の方法 ※講演は翻訳資料にて行います。PySparkによるジョブを、より速く、よりスケーラブルに実行するための最善の方法についてご紹介します。PythonとSparkにおけるJobの高速化に奮闘している方は必聴です。(当講演はSparkの基本を理解している方を対象としています。初めての方は、下記サイトのVideoを事前に視聴することをおすすめします。http://bit.ly/hkPySpark)
Apache Bigtopによるオープンなビッグデータ処理基盤の構築(オープンデベロッパーズカンファレンス 2021 Online 発表資料)
Apache Bigtopによるオープンなビッグデータ処理基盤の構築(オープンデベロッパーズカンファレンス 2021 Online 発表資料)
NTT DATA Technology & Innovation
?
Apache Bigtopによるオープンなビッグデータ処理基盤の構築 (オープンデベロッパーズカンファレンス 2021 Online 発表資料) 2021年8月28日 株式会社NTTデータ 技術開発本部 先進コンピューティング技術センタ 関 堅吾 岩崎 正剛
ビッグデータ処理データベースの全体像と使い分け?2018年惫别谤蝉颈辞苍
ビッグデータ処理データベースの全体像と使い分け?2018年惫别谤蝉颈辞苍
Tetsutaro Watanabe
?
ビッグデータ処理データベースを分类し、2018/9时点で最新のプロダクトを绍介しています。
データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...
データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...
NTT DATA Technology & Innovation
?
データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み (NTTデータ テクノロジーカンファレンス 2020 発表資料) 2020年10月14日(水) NTTデータ システム技術本部 デジタル技術部 八木 香充 NTTデータ システム技術本部 デジタル技術部 大山 真実 講演動画は、YouTubeチャンネル「NTT DATA Tech」にて公開中! https://www.youtube.com/watch?v=zv9rosm-fsY
データ仮想化を活用したデータ分析のフローと分析モデル作成の自动化のご绍介
データ仮想化を活用したデータ分析のフローと分析モデル作成の自动化のご绍介
Denodo
?
Watch full webinar here: https://bit.ly/3QM4bgI データ仮想化(Denodo)を活用した当社の考えるアーキテクチャーの中から今回はDenodoとプログラミング言語の一例としてPythonにフォーカスをあてて、データの理解?データの準備?モデル作成?評価?展開のフローとそれぞれで用いる仕組みと注目ポイントについてご紹介致します。 また分析モデル作成の自動化をご支援する仕組みとしてDataRobotの概要と注目ポイント についてもご紹介致します。
贬补诲辞辞辫入门
贬补诲辞辞辫入门
Preferred Networks
?
Hadoop Conference Japan 2009 「贬补诲辞辞辫入门」の講演資料
「指標」を支えるエンシ?ニアリンク?: DataOpsNight #1
「指標」を支えるエンシ?ニアリンク?: DataOpsNight #1
株式会社MonotaRO Tech Team
?
DataOps Night#1 https://finatext.connpass.com/event/233494/
贬补诲辞辞辫を叠蚕にマイグレしようとしてる话
贬补诲辞辞辫を叠蚕にマイグレしようとしてる话
Recruit Technologies
?
2017/03/29 Google Cloud はやわかりセミナー in 名古屋での、松田の講演資料になります
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
NTT DATA Technology & Innovation
?
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~ (映像情報メディア学会2021年冬季大会企画セッション 発表資料) 2021年12月16日 NTTデータ 山口 永
【マーケティンク??テクノロシ?ーフェア 大阪 2023】 テ?ータから正しい意思決定を行うために ?全社横断て?実施したテ?ータ活用フ?ロシ?ェクトの取...
【マーケティンク??テクノロシ?ーフェア 大阪 2023】 テ?ータから正しい意思決定を行うために ?全社横断て?実施したテ?ータ活用フ?ロシ?ェクトの取...
株式会社MonotaRO Tech Team
?
マーケティンク??テクノロシ?ーフェア 大阪 2023で発表した資料になります
惭尝翱辫蝉はバズワード
惭尝翱辫蝉はバズワード
Tetsutaro Watanabe
?
惭尝翱辫蝉という言叶からは运用という印象を受けますが、惭尝翱辫蝉製品の机能や惭尝翱辫蝉カンファレンスの発表内容をみると、印象とは异なります。本スライドではなぜ惭尝翱辫蝉がバズワードなのか绍介します
テ?ータ収集の基本と「闯补辫补苍罢补虫颈」アフ?リにおける実践例
テ?ータ収集の基本と「闯补辫补苍罢补虫颈」アフ?リにおける実践例
Tetsutaro Watanabe
?
データ収集の基本として、データソース毎に典型的なデータ収集方法を整理して説明しています。また闯补辫补苍罢补虫颈アプリにおいてどのように実践しているかを説明しています。
分散トレーシンク?技術について(Open tracingやjaeger)
分散トレーシンク?技術について(Open tracingやjaeger)
NTT Communications Technology Development
?
勉强会で分散トレーシング技术について调査した内容を発表した资料です。翱辫别苍罢谤补肠颈苍驳や闯补别驳别谤などについてのざっくりとした解説などを行っています。
ビッグデータ処理データベースの全体像と使い分け
ビッグデータ処理データベースの全体像と使い分け
Recruit Technologies
?
2016/07/15 db tech showcase Tokyo 2016での渡部の講演資料になります
pg_bigmで全文検索するときに気を付けたい5つのポイント(第23回PostgreSQLアンカンファレンス@オンライン 発表資料)
pg_bigmで全文検索するときに気を付けたい5つのポイント(第23回PostgreSQLアンカンファレンス@オンライン 発表資料)
NTT DATA Technology & Innovation
?
pg_bigmで全文検索するときに気を付けたい5つのポイント (第23回PostgreSQLアンカンファレンス@オンライン 発表資料) 2021年5月11日 株式会社NTTデータ 技術開発本部 先進コンピューティング技術センタ 藤井 雅雄
pg_hint_planを知る(第37回PostgreSQLアンカンファレンス@オンライン 発表資料)
pg_hint_planを知る(第37回PostgreSQLアンカンファレンス@オンライン 発表資料)
NTT DATA Technology & Innovation
?
pg_hint_planを知る (第37回PostgreSQLアンカンファレンス@オンライン 発表資料) 2022年12月20日(火) NTTデータ 技術開発本部 先進コンピューティング技術センタ 葛木 優太
VSCodeで作るPostgreSQL開発環境(第25回 PostgreSQLアンカンファレンス@オンライン 発表資料)
VSCodeで作るPostgreSQL開発環境(第25回 PostgreSQLアンカンファレンス@オンライン 発表資料)
NTT DATA Technology & Innovation
?
VSCodeで作るPostgreSQL開発環境 (第25回 PostgreSQLアンカンファレンス@オンライン 発表資料) 2021年7月6日 株式会社NTTデータ 技術開発本部 先進コンピューティング技術センタ 加藤 慎也
リクルートを支える横断テ?ータ基盘と机械学习の适用事例
リクルートを支える横断テ?ータ基盘と机械学习の适用事例
Tetsutaro Watanabe
?
Data Platform Confference Tokyo 2017 で話した「リクルートを支える横断テ?ータ基盘と机械学习の适用事例」です
リクルートにおけるデータのインフラ化への取组
リクルートにおけるデータのインフラ化への取组
Recruit Technologies
?
2016/10/07 CEATEC JAPANでの、池田の講演資料になります
初めてのデータ分析基盘构筑をまかされた、その时何を考えておくと良いのか
初めてのデータ分析基盘构筑をまかされた、その时何を考えておくと良いのか
Techon Organization
?
PySparkによるジョブを、より速く、よりスケーラブルに実行するための最善の方法 ※講演は翻訳資料にて行います。 - Getting the Best...
PySparkによるジョブを、より速く、よりスケーラブルに実行するための最善の方法 ※講演は翻訳資料にて行います。 - Getting the Best...
Holden Karau
?
Apache Bigtopによるオープンなビッグデータ処理基盤の構築(オープンデベロッパーズカンファレンス 2021 Online 発表資料)
Apache Bigtopによるオープンなビッグデータ処理基盤の構築(オープンデベロッパーズカンファレンス 2021 Online 発表資料)
NTT DATA Technology & Innovation
?
ビッグデータ処理データベースの全体像と使い分け?2018年惫别谤蝉颈辞苍
ビッグデータ処理データベースの全体像と使い分け?2018年惫别谤蝉颈辞苍
Tetsutaro Watanabe
?
データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...
データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...
NTT DATA Technology & Innovation
?
データ仮想化を活用したデータ分析のフローと分析モデル作成の自动化のご绍介
データ仮想化を活用したデータ分析のフローと分析モデル作成の自动化のご绍介
Denodo
?
贬补诲辞辞辫入门
贬补诲辞辞辫入门
Preferred Networks
?
「指標」を支えるエンシ?ニアリンク?: DataOpsNight #1
「指標」を支えるエンシ?ニアリンク?: DataOpsNight #1
株式会社MonotaRO Tech Team
?
贬补诲辞辞辫を叠蚕にマイグレしようとしてる话
贬补诲辞辞辫を叠蚕にマイグレしようとしてる话
Recruit Technologies
?
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
NTT DATA Technology & Innovation
?
【マーケティンク??テクノロシ?ーフェア 大阪 2023】 テ?ータから正しい意思決定を行うために ?全社横断て?実施したテ?ータ活用フ?ロシ?ェクトの取...
【マーケティンク??テクノロシ?ーフェア 大阪 2023】 テ?ータから正しい意思決定を行うために ?全社横断て?実施したテ?ータ活用フ?ロシ?ェクトの取...
株式会社MonotaRO Tech Team
?
惭尝翱辫蝉はバズワード
惭尝翱辫蝉はバズワード
Tetsutaro Watanabe
?
テ?ータ収集の基本と「闯补辫补苍罢补虫颈」アフ?リにおける実践例
テ?ータ収集の基本と「闯补辫补苍罢补虫颈」アフ?リにおける実践例
Tetsutaro Watanabe
?
分散トレーシンク?技術について(Open tracingやjaeger)
分散トレーシンク?技術について(Open tracingやjaeger)
NTT Communications Technology Development
?
ビッグデータ処理データベースの全体像と使い分け
ビッグデータ処理データベースの全体像と使い分け
Recruit Technologies
?
pg_bigmで全文検索するときに気を付けたい5つのポイント(第23回PostgreSQLアンカンファレンス@オンライン 発表資料)
pg_bigmで全文検索するときに気を付けたい5つのポイント(第23回PostgreSQLアンカンファレンス@オンライン 発表資料)
NTT DATA Technology & Innovation
?
pg_hint_planを知る(第37回PostgreSQLアンカンファレンス@オンライン 発表資料)
pg_hint_planを知る(第37回PostgreSQLアンカンファレンス@オンライン 発表資料)
NTT DATA Technology & Innovation
?
VSCodeで作るPostgreSQL開発環境(第25回 PostgreSQLアンカンファレンス@オンライン 発表資料)
VSCodeで作るPostgreSQL開発環境(第25回 PostgreSQLアンカンファレンス@オンライン 発表資料)
NTT DATA Technology & Innovation
?
リクルートを支える横断テ?ータ基盘と机械学习の适用事例
リクルートを支える横断テ?ータ基盘と机械学习の适用事例
Tetsutaro Watanabe
?
リクルートにおけるデータのインフラ化への取组
リクルートにおけるデータのインフラ化への取组
Recruit Technologies
?
Similar to 巨大なサービスと膨大なデータを支えるプラットフォーム?
(20)
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
Tetsutaro Watanabe
?
ビッグデータ処理基盤の分野では、オンプレ?クラウド問わず様々なプロダクトが続々と登場していますが、それぞれの位置づけを明確にします。また代表的なプロダクトについて紹介し、使い分けを明確にします。具体的には、Amazon Redsfhit Spectrum, Cloud Spanner, Big Query, Oracle Exadata, MapR, cloudera, Hortonworks, EMR, Cloud Dataproc, Azure HDInsight, Amazon Athena, TREASURE DATA、Amazon DynamoDB, Azure Cosmos DB, cassandra, HBase, redis, MongoDB, TERADATA, NETEZZA,等を紹介します。
リクルートのビッグデータ活用基盘とデータ活用に向けた取组み
リクルートのビッグデータ活用基盘とデータ活用に向けた取组み
Recruit Technologies
?
2016/02/19 ITインフラTECH forumでの、池田の講演資料になります
リクルートのビッグデータ活用基盘とビッグデータ活用のためのメタデータ管理奥别产のご绍介
リクルートのビッグデータ活用基盘とビッグデータ活用のためのメタデータ管理奥别产のご绍介
Recruit Technologies
?
2015/09/01 データ活用事例セミナーでの、池田の講演資料になります
リクルート式贬补诲辞辞辫の使い方
リクルート式贬补诲辞辞辫の使い方
Recruit Technologies
?
2015/10/14 Hortonworks社主催イベントでの、石川の講演資料になります
トレジャーデータ新サービス発表 2013/12/9
トレジャーデータ新サービス発表 2013/12/9
Treasure Data, Inc.
?
トレジャーデータサービスをリリースして一年あまり、今年の最後に目玉となる新サービスのお披露目を東京にて行いました。創業者?CTO 太田 一樹によるプレゼンテーションを公開させていただきます。 トレジャーデータの概要から、新サービスである、Treasure Query Accelerator(当社比従来の10-50倍高速化しました)、 Treasure Viewer(ドラッグアンドドロップで簡単にクロス集計などのグラフが作成できる)、新サービス価格体系についてのご案内も盛り込んでいます。 当日ご来場いただけた方はもちろん、ご都合で欠席された方もぜひご覧ください。 また、今後同内容のWebinarも開催していく予定です。
ビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラム
Recruit Technologies
?
复数顿叠のバックアップ?切り戻し运用手顺が异なって大変?!运用性の大幅改善、その先に。。
复数顿叠のバックアップ?切り戻し运用手顺が异なって大変?!运用性の大幅改善、その先に。。
Insight Technology, Inc.
?
松本 健様 シンプロビジョン株式会社 代表取締役 ORACLE、SQLサーバー、PostgreSQL、、、データベースには、各々の異なるバックアップ手順と運用が必要になります。そのすべてが情報システム部に託される現在、アクティフィオを使って運用をシンプルに、クラウドのストレージ?リソースを使ってコストも低減させましょう。とは、言っても、その投資費用は保険のように障害時にしか使わないのも現実。そこで、バックアップしたデータをテスト用、開発用に流用できたら更にTCOは改善できるはず。このセッションでは、『マルチDBバックアップ運用を容易に行う、バックアップデータをうまく活用する』をテーマにその仕組みと事例を皆様にご説明します。 【2018年12月12日開催 db tech showcaseフォローアップセミナー 人手が足りない情シスの皆様へ! DB運用課題あるある解決セミナー】
ビッグデータ&データマネジメント展
ビッグデータ&データマネジメント展
Recruit Technologies
?
ビッグデータ&データマネジメント展での讲演资料
WebDB Forum 2012 基調講演資料
WebDB Forum 2012 基調講演資料
Recruit Technologies
?
贬补诲辞辞辫カンファレンス2013
贬补诲辞辞辫カンファレンス2013
Recruit Technologies
?
データ集計基盤のいままでとこれから ?Hadoopからdataflowまで使い込んだ経験を徹底共有?
データ集計基盤のいままでとこれから ?Hadoopからdataflowまで使い込んだ経験を徹底共有?
Kazuhiro Mitsuhashi
?
顿叠(尘测蝉辩濒)上で実行することから始まった広告系大量データの処理に関して、试行错误しながらも贬补诲辞辞辫を経て诲补迟补蹿濒辞飞(叠颈驳蚕耻别谤测)に置き换えて大幅な効率化、低コスト化を実现。その过程で得た大量データを効率的に処理するための使いこなし戦略について彻底共有。
Big data解析ビジネス
Big data解析ビジネス
Mie Mori
?
Tokyo
変わる!? リクルートグループのデータ解析基盤
変わる!? リクルートグループのデータ解析基盤
Recruit Technologies
?
2015/07/15 IIJ Lead Initiative 2015での、野村の講演資料になります
[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform
Naoki (Neo) SATO
?
[de:code 2019 振り返り Night!] Data Platform https://satonaoki.wordpress.com/2019/06/10/decode19-data-platform-recap/ de:code 2019 振り返り Night! Sponsored by Qiita https://connpass.com/event/132783/
Ext js 20100526
Ext js 20100526
Shinichi Tomita
?
Web アプリケーションにおけるクライアントサイドのデータハンドリングと可視化の実現
Web アプリケーションにおけるクライアントサイドのデータハンドリングと可視化の実現
インフラジスティックス?ジャパン株式会社
?
2014 年 02 月 28 日に開催されたEnterprise × HTML5 Web Application Conference 2014 において弊社デベロッパー エバンジェリストの池原が講演させていただいた際の資料です。
Qiita x Microsoft - 機械学習セミナー Microsoft AI Platform
Qiita x Microsoft - 機械学習セミナー Microsoft AI Platform
Daiyu Hatakeyama
?
Build 2018 の情報も一部取り入れて、データサイエンティスト + Developer のための、Microsoft AI Platform のご紹介です。Data Science VM | Azure Machine Learning Services | Azure IoT Edge までカバーいています。
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入?活用事例
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入?活用事例
Amazon Web Services Japan
?
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ by トレジャーデータ株式会社 斉藤太郎
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ by トレジャーデータ株式会社 斉藤太郎
Insight Technology, Inc.
?
Treasure DataではFluentdなどで収集したデータに対し、Prestoによる低レイテンシクエリサービスを提供しています。これにより、ユーザーはすばやくデータに関する知見を得ることができ、データ分析の生産性を向上できます。このセッションでは、分散SQLエンジンであるPrestoの特徴とその実装について紹介します。
础耻迟辞苍辞尘辞耻蝉选手権システムエグゼ社発表资料
础耻迟辞苍辞尘辞耻蝉选手権システムエグゼ社発表资料
Mai Nagahisa
?
础耻迟辞苍辞尘辞耻蝉选手権に出场された株式会社システムエグゼ様の発表资料を代理でアップいたしました!
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
Tetsutaro Watanabe
?
リクルートのビッグデータ活用基盘とデータ活用に向けた取组み
リクルートのビッグデータ活用基盘とデータ活用に向けた取组み
Recruit Technologies
?
リクルートのビッグデータ活用基盘とビッグデータ活用のためのメタデータ管理奥别产のご绍介
リクルートのビッグデータ活用基盘とビッグデータ活用のためのメタデータ管理奥别产のご绍介
Recruit Technologies
?
リクルート式贬补诲辞辞辫の使い方
リクルート式贬补诲辞辞辫の使い方
Recruit Technologies
?
トレジャーデータ新サービス発表 2013/12/9
トレジャーデータ新サービス発表 2013/12/9
Treasure Data, Inc.
?
ビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラム
Recruit Technologies
?
复数顿叠のバックアップ?切り戻し运用手顺が异なって大変?!运用性の大幅改善、その先に。。
复数顿叠のバックアップ?切り戻し运用手顺が异なって大変?!运用性の大幅改善、その先に。。
Insight Technology, Inc.
?
ビッグデータ&データマネジメント展
ビッグデータ&データマネジメント展
Recruit Technologies
?
WebDB Forum 2012 基調講演資料
WebDB Forum 2012 基調講演資料
Recruit Technologies
?
贬补诲辞辞辫カンファレンス2013
贬补诲辞辞辫カンファレンス2013
Recruit Technologies
?
データ集計基盤のいままでとこれから ?Hadoopからdataflowまで使い込んだ経験を徹底共有?
データ集計基盤のいままでとこれから ?Hadoopからdataflowまで使い込んだ経験を徹底共有?
Kazuhiro Mitsuhashi
?
Big data解析ビジネス
Big data解析ビジネス
Mie Mori
?
変わる!? リクルートグループのデータ解析基盤
変わる!? リクルートグループのデータ解析基盤
Recruit Technologies
?
[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform
Naoki (Neo) SATO
?
Ext js 20100526
Ext js 20100526
Shinichi Tomita
?
Web アプリケーションにおけるクライアントサイドのデータハンドリングと可視化の実現
Web アプリケーションにおけるクライアントサイドのデータハンドリングと可視化の実現
インフラジスティックス?ジャパン株式会社
?
Qiita x Microsoft - 機械学習セミナー Microsoft AI Platform
Qiita x Microsoft - 機械学習セミナー Microsoft AI Platform
Daiyu Hatakeyama
?
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入?活用事例
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入?活用事例
Amazon Web Services Japan
?
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ by トレジャーデータ株式会社 斉藤太郎
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ by トレジャーデータ株式会社 斉藤太郎
Insight Technology, Inc.
?
础耻迟辞苍辞尘辞耻蝉选手権システムエグゼ社発表资料
础耻迟辞苍辞尘辞耻蝉选手権システムエグゼ社発表资料
Mai Nagahisa
?
More from Tetsutaro Watanabe
(19)
データサイエンティスト向け性能问题対応の基础
データサイエンティスト向け性能问题対応の基础
Tetsutaro Watanabe
?
データサイエンティストの皆さん、次のような性能问题にであったことないでしょうか。「データの加工処理が遅いからインスタンスタイプを上げたが速くならなかった」「机械学习の学习が遅いから、骋笔鲍を増やしたが、速くならなかった」こういったときにどうすればよいか説明します。
ドライブレコーダの动画を使った道路情报の自动差分抽出
ドライブレコーダの动画を使った道路情报の自动差分抽出
Tetsutaro Watanabe
?
自動運転時代には、今よりも更新頻度の高い地図が必要です。MoTでは大手地図会社であるゼンリンとの共同開発により、ドライブレコーダの動画を元に道路情報の差分を自動で抽出し、地図更新に役立てるプロジェクトを行っています。このプロジェクトを紹介します。 技術的な紹介ポイントとしては、次のものになります。マップマッチ、機械学習(ディープラーニング)、SLAMそしてGISツール等を組み合わせた高度なアプリケーション。大量の動画データに対して分散処理するために、AWS FSx for LustreやAWS Batchを用いてシステムを構成。計算コストの高い機械学習推論処理を最適化する工夫。データサイエンティストの成果物を本番に取り込むためのフレームワーク。
滨辞罢テ?ハ?イステ?ータ収集の难しい点
滨辞罢テ?ハ?イステ?ータ収集の难しい点
Tetsutaro Watanabe
?
Mobility Technologiesではタクシーに取り付けたデバイスのデータを収集していますが、Webとは違うIoTならではの問題や障害を経験しました。それを紹介します。
ドライブレコーダの画像认识による道路情报の自动差分抽出
ドライブレコーダの画像认识による道路情报の自动差分抽出
Tetsutaro Watanabe
?
Mobility Technologiesではドライブレコーダの画像认识による道路情报の自动差分抽出プロジェクトを実施しています。大量の動画に対して効率よく機械学習推論を行う必要があり、これをどのように実現しようとしているかを説明します。
先駆者に学ふ? MLOpsの実際
先駆者に学ふ? MLOpsの実際
Tetsutaro Watanabe
?
「惭尝翱辫蝉とはなにか?」という质问に対し、「データサイエンティストが、システム开発において、やらないことすべて」と定义した上で、惭尝翱辫蝉の説明、海外事例、「闯补辫补苍罢补虫颈」アプリでの事例を説明します
ML Ops NYC 19 & Strata Data Conference 2019 NewYork 注目セッションまとめ
ML Ops NYC 19 & Strata Data Conference 2019 NewYork 注目セッションまとめ
Tetsutaro Watanabe
?
ニューヨークで開催された機械学習運用に関するカンファレンス「ML Ops NYC 19」とデータ系のカンファレンス「Strata Data Conference 2019 New York」の注目セッションをまとめました
タクシードライブレコーダーの动画処理惭尝パイプラインに办耻产别谤苍别迟别蝉を使ってみた
タクシードライブレコーダーの动画処理惭尝パイプラインに办耻产别谤苍别迟别蝉を使ってみた
Tetsutaro Watanabe
?
闯补辫补苍罢补虫颈にてタクシードライブレコーダーの动画処理のための机械学习パイプラインに办耻产别谤苍别迟别蝉を使ってみた话です
闯补辫补苍罢补虫颈における厂补驳别尘补办别谤+αによる机械学习アフ?リケーションの本番运用
闯补辫补苍罢补虫颈における厂补驳别尘补办别谤+αによる机械学习アフ?リケーションの本番运用
Tetsutaro Watanabe
?
JapanTaxiでは配車アプリケーションに機械学習による予測を利用しており本番で運用しています。機械学習モデルはビジネス状況の変化とともに精度が劣化していく可能性があるため、日々の精度モニタリングと、モデル更新のための開発フローの整備が必要でした。それをSagemaker + αを用いて実現した内容を発表します。
JapanTaxiにおけるML Ops ?機械学習の開発運用プロセス?
JapanTaxiにおけるML Ops ?機械学習の開発運用プロセス?
Tetsutaro Watanabe
?
闯补辫苍罢补虫颈で本番运用している机械学习プロダクトについて、データサイエンティストの成果物をどのように运用に乗せているかを説明します。
Google Cloud Next '18 Recap/報告会 機械学習関連
Google Cloud Next '18 Recap/報告会 機械学習関連
Tetsutaro Watanabe
?
Google Cloud Next '18で発表された機械学習関連の発表をまとめています。またocadoのセッションの紹介もします。
奥颈谤别诲罢颈驳别谤を详しく説明
奥颈谤别诲罢颈驳别谤を详しく説明
Tetsutaro Watanabe
?
惭辞苍驳辞顿叠のストレージエンジンである奥颈谤别诲罢颈驳别谤について详しく説明します
リクルートテクノロシ?ース? における EMR の活用とコスト圧縮方法
リクルートテクノロシ?ース? における EMR の活用とコスト圧縮方法
Tetsutaro Watanabe
?
リクルートテクノロシ?ース? における EMR の活用とコスト圧縮方法
ヒ?ックテ?ータ処理技术の全体像とリクルートて?の使い分け
ヒ?ックテ?ータ処理技术の全体像とリクルートて?の使い分け
Tetsutaro Watanabe
?
ヒ?ックテ?ータ処理技术の全体像とリクルートて?の使い分け
惭辞苍驳辞顿叠か?遅いときの切り分け方法
惭辞苍驳辞顿叠か?遅いときの切り分け方法
Tetsutaro Watanabe
?
MMAPv1, WiredTigerについても詳細に説明しています
惭辞苍驳辞顿叠3.2の绍介
惭辞苍驳辞顿叠3.2の绍介
Tetsutaro Watanabe
?
惭辞苍驳辞顿叠3.2の绍介
MongoDB World 2014に行ってきた!
MongoDB World 2014に行ってきた!
Tetsutaro Watanabe
?
MongoDB World2014への参加レポートです
がっつり惭辞苍驳辞顿叠事例绍介
がっつり惭辞苍驳辞顿叠事例绍介
Tetsutaro Watanabe
?
2014年3月时点で、日本惭辞苍驳辞顿叠ユーザ会に集められた惭辞苍驳辞顿叠の事例绍介をします
初心者向け惭辞苍驳辞顿叠のキホン!
初心者向け惭辞苍驳辞顿叠のキホン!
Tetsutaro Watanabe
?
初心者向けにMongoDBの基本を解説しています。 この資料は2014/3/1のOSC 2014 Tokyo/Springで発表しました 。 2015/3/3最新の情報で一部アップデートしました。 2015/7/15MongoDB ver3.0ようにちょっと修正しました。
惭辞苍驳辞顿叠の监视
惭辞苍驳辞顿叠の监视
Tetsutaro Watanabe
?
?MongoDBで何を監視すべきか ?MongoDBのコマンド?メソッドによる監視 ?運用監視ツールとの連携して監視 ?MMS(MongoDB Monitoring Service)で監視
データサイエンティスト向け性能问题対応の基础
データサイエンティスト向け性能问题対応の基础
Tetsutaro Watanabe
?
ドライブレコーダの动画を使った道路情报の自动差分抽出
ドライブレコーダの动画を使った道路情报の自动差分抽出
Tetsutaro Watanabe
?
滨辞罢テ?ハ?イステ?ータ収集の难しい点
滨辞罢テ?ハ?イステ?ータ収集の难しい点
Tetsutaro Watanabe
?
ドライブレコーダの画像认识による道路情报の自动差分抽出
ドライブレコーダの画像认识による道路情报の自动差分抽出
Tetsutaro Watanabe
?
先駆者に学ふ? MLOpsの実際
先駆者に学ふ? MLOpsの実際
Tetsutaro Watanabe
?
ML Ops NYC 19 & Strata Data Conference 2019 NewYork 注目セッションまとめ
ML Ops NYC 19 & Strata Data Conference 2019 NewYork 注目セッションまとめ
Tetsutaro Watanabe
?
タクシードライブレコーダーの动画処理惭尝パイプラインに办耻产别谤苍别迟别蝉を使ってみた
タクシードライブレコーダーの动画処理惭尝パイプラインに办耻产别谤苍别迟别蝉を使ってみた
Tetsutaro Watanabe
?
闯补辫补苍罢补虫颈における厂补驳别尘补办别谤+αによる机械学习アフ?リケーションの本番运用
闯补辫补苍罢补虫颈における厂补驳别尘补办别谤+αによる机械学习アフ?リケーションの本番运用
Tetsutaro Watanabe
?
JapanTaxiにおけるML Ops ?機械学習の開発運用プロセス?
JapanTaxiにおけるML Ops ?機械学習の開発運用プロセス?
Tetsutaro Watanabe
?
Google Cloud Next '18 Recap/報告会 機械学習関連
Google Cloud Next '18 Recap/報告会 機械学習関連
Tetsutaro Watanabe
?
奥颈谤别诲罢颈驳别谤を详しく説明
奥颈谤别诲罢颈驳别谤を详しく説明
Tetsutaro Watanabe
?
リクルートテクノロシ?ース? における EMR の活用とコスト圧縮方法
リクルートテクノロシ?ース? における EMR の活用とコスト圧縮方法
Tetsutaro Watanabe
?
ヒ?ックテ?ータ処理技术の全体像とリクルートて?の使い分け
ヒ?ックテ?ータ処理技术の全体像とリクルートて?の使い分け
Tetsutaro Watanabe
?
惭辞苍驳辞顿叠か?遅いときの切り分け方法
惭辞苍驳辞顿叠か?遅いときの切り分け方法
Tetsutaro Watanabe
?
惭辞苍驳辞顿叠3.2の绍介
惭辞苍驳辞顿叠3.2の绍介
Tetsutaro Watanabe
?
MongoDB World 2014に行ってきた!
MongoDB World 2014に行ってきた!
Tetsutaro Watanabe
?
がっつり惭辞苍驳辞顿叠事例绍介
がっつり惭辞苍驳辞顿叠事例绍介
Tetsutaro Watanabe
?
初心者向け惭辞苍驳辞顿叠のキホン!
初心者向け惭辞苍驳辞顿叠のキホン!
Tetsutaro Watanabe
?
惭辞苍驳辞顿叠の监视
惭辞苍驳辞顿叠の监视
Tetsutaro Watanabe
?
巨大なサービスと膨大なデータを支えるプラットフォーム?
1.
(C) Recruit Holdings
Co.,Ltd. All rights reserved. 巨大なサービスと膨大なデータを支えるプラットフォーム ~リクルートでの Google BigQuery の活用とは?~ 2018/3/8 Cloud Days2018 <関西> KEY NOTE
2.
(C) Recruit Holdings
Co.,Ltd. All rights reserved. 自己紹介 {"ID" :"fetaro" "名前":"渡部 徹太郎" "研究":"東京工業大学でデータベースと情報検索の研究 (@日本データベース学会)" "仕事":{前職:["証券会社のオンライントレードシステムのWeb基盤", "オープンソースなら何でも。主にMongoDB,NoSQL"], 現職:["リクルートの分析基盤,Exadata,BigQuery,EMR"] 副業:["ビッグデータコンサルタント", "非常勤講師" ]} "エディタ":"emacs派", "趣味": ["自宅サーバ","麻雀"] }
3.
(C) Recruit Holdings
Co.,Ltd. All rights reserved. 目次 ■ データプラットフォームの紹介 ■ BigQuery の使い所
4.
(C) Recruit Holdings
Co.,Ltd. All rights reserved. データプラットフォームの紹介
5.
(C) Recruit Holdings
Co.,Ltd. All rights reserved. リクルートの事業領域 ライフイベント ライフスタイル 旅行 ライフスタイル 健康?美容 就職 結婚 転職 不動産 自動車 出産 教育 「ゆりかごから墓場まで」
6.
(C) Recruit Holdings
Co.,Ltd. All rights reserved. リクルートのビジネスモデル ■ リボンモデル
7.
(C) Recruit Holdings
Co.,Ltd. All rights reserved. リクルートのビジネスモデル クライアント カスタマ 集める 集める 動かす 動かす 結ぶ
8.
(C) Recruit Holdings
Co.,Ltd. All rights reserved. ビッグデータの活用箇所 カスタマ クライアント ①集客のコスト削減 ?メール?広告最適化 ?ポイント付与最適化 ③クライアント業務支援 ?レポーティング ④KPI可視化 データドリブンな意思決定支援 ②マッチング率向上 ?UI/UX改善 ?レコメンデーション
9.
(C) Recruit Holdings
Co.,Ltd. All rights reserved. リクルートホールディングス データ?AI戦略統括部 リクルート ホールディングス リクルートキャリア リクルート住まいカンパニー リクルートライフスタイル リクルートジョブズ リクルートスタッフィング リクルートマーケティングパートナーズ ??? リクルート テクノロジーズ リクルートアドミニストレーション リクルートコミュニケーションズ 事業会社 機能会社 データ?AI 戦略統括部
10.
(C) Recruit Holdings
Co.,Ltd. All rights reserved. Recruit ID?リクルートポイント ■ 共通IDで行動を把握?分析。共通ポイントの付与 横断データ基盤 Recruit ID
11.
(C) Recruit Holdings
Co.,Ltd. All rights reserved. 横断データ基盤
12.
(C) Recruit Holdings
Co.,Ltd. All rights reserved. 横断データ基盤の構成要素 12 ポイント?メール? 広告 マスタデータRecruit Service Web? アプリ Exadata RDS S3 行動データ API提供 集計/予測/分類 アドホック分析/データ共有 出力蓄積 データアプリケーション Google Cloud Storage Spanner 収集 ? ? ? 50サイト 加工 セグメント抽出 BigQuery BI?レポート GKE k8s
13.
(C) Recruit Holdings
Co.,Ltd. All rights reserved. 横断データ基盤のプロファイル ■ データ ● データ量:2,000+TB ● サービス:50 ● データベース:160 ● テーブル:8000 ■ 処理 ● サーバ数:200+ ● ジョブ数:10000 ● クエリ数: 100,000,000/月 ■ 体制 ● 分析環境利用者数:400人 ● 開発者数:87人 13
14.
(C) Recruit Holdings
Co.,Ltd. All rights reserved. 横断データ基盤の典型的な処理パターン ■ サイト横断でデータを取得、機械学習によりユーザを推定、 メール?ポイント最適化、UI/UX改善に利用する 14 Aサイト 行動 データ Exadata マスター データ S3 Web 機械学習による 属性推定 個人情報マスク 名寄せ DWH化 API化 推定結果の 格納 Exadata リスト作成 メール ポイント 最適化 UI/UX 改善 ブ ラ ウ ザ Point Aサイトに訪れたこと無いユーザでも、 Bサイトの情報から属性を推定できる Bサイト
15.
(C) Recruit Holdings
Co.,Ltd. All rights reserved. プラットフォームだけでなくデータガバナンスを強化 ■ データガバナンス ● メタデータ管理 ??? できてる! ● データフロー管理 ??? できてきた! ● データ品質管理 ??? これから 15
16.
(C) Recruit Holdings
Co.,Ltd. All rights reserved. メタデータ管理 ■ メタデータ可視化Web ● データを探す機能 ? データベース一覧?テーブル一覧 ? キーワード検索 ? 名前が似ているテーブル ● データの意味を知る機能 ? テーブル定義 ? コード値 ? 利用者のコメント ? よく利用しているユーザ ● データの関係を知る機能 ? 外部参照一覧 ? JOINされることが多いテーブル ● データの変化を知る機能 ? テーブル定義変更検知?通知 16 Web アプリ OLTP DB 分析 DB Web アプリ OLTP DB Web アプリ OLTP DB メタデータ可視化Web リクルートのほぼ全サイトで導入 OLTP DB, 分析DBの両方から情報を収集
17.
(C) Recruit Holdings
Co.,Ltd. All rights reserved. データフロー管理 ■ データとジョブの関係を可視化 ● データ数:7000 ジョブ数:800 ■ 用途 ● 障害発生時の影響調査 ● 処理設計時のインプット ■ 管理方法 ● YAMLをgitで管理 17 データマー ト ETL マート化 データマ ート マート化 DWH src src ETL レポート アプリケーション ジョブコントローラ 独自Webアプリを開発
18.
(C) Recruit Holdings
Co.,Ltd. All rights reserved. データ品質管理 ■ データ品質 ● データの鮮度 ● データの正確性(欠損、重複はないか) ● など ■ できていること ● アプリケーション個別に件数チェック、重複チェック ■ やりたいこと ● プラットフォーム全体でデータ品質管理プラットフォームを準備 ● データの重要度によってデータ品質チェックの量を変える 18
19.
(C) Recruit Holdings
Co.,Ltd. All rights reserved. BigQuery の使い所
20.
(C) Recruit Holdings
Co.,Ltd. All rights reserved. 分析用SQLエンジンの進化 20 RDB(OLTP) RDB(DWH) SQL on Hadoop Redshift ? MPP ? 専用のハードウェア ? 大量のディスク ? ロード?抽出?集計 に特化 ? 汎用的なハードウ ェア ? 無限にスケール ? UPDATE / DELETEを捨てる ? クエリ毎にリソー スの動的割当 Impara Athena 2004年 (Google) 2012年 (Google) BigQuery
21.
(C) Recruit Holdings
Co.,Ltd. All rights reserved. BigQueryとは ■ BigQuery とは ● Google がHadoop(Hive)を進化させて作った分散SQLエンジン ● クエリ課金 ● 速度が別格(1TBを1秒でスキャン) ● GROUP BYやJOIN等の重い処理は、処理量に合わせて計算ノードを動的に割り 当てて実行。利用できるノードは1000台以上 21 分散ストレージ Colossus File System シャード シャード シャード シャード シャード ミキサー ミキサー ミキサー ルート ミキサー 参考)オライリー?ジャパン社「BigQuery」
22.
(C) Recruit Holdings
Co.,Ltd. All rights reserved. BigQuery をどこで使うか カスタマ クライアント ①集客のコスト削減 ?メール?広告最適化 ?ポイント付与最適化 ③クライアント業務支援 ?レポーティング ④KPI可視化 データドリブンな意思決定支援 ②マッチング率向上 ?UI/UX改善 ?レコメンデーション
23.
(C) Recruit Holdings
Co.,Ltd. All rights reserved. BigQueryをどこで使うか ■ データ分析は二つのパターンが有る アドホック分析 ● 企画や戦略の立案社員全員が 担当のデータを見る ● ExcelやBI的なこと ● 皆がデータを見る 23 バックエンドシステム ● バッチとして実装し、 日々価値を生み出し続ける ● 夜間バッチ ● データ加工や機械学習
24.
(C) Recruit Holdings
Co.,Ltd. All rights reserved. BigQuery をどこで使うか カスタマ クライアント ①集客のコスト削減 ?メール?広告最適化 ?ポイント付与最適化 ③クライアント業務支援 ?レポーティング ②マッチング率向上 ?UI/UX改善 ?レコメンデーション バックエンドシステムがメイン
25.
(C) Recruit Holdings
Co.,Ltd. All rights reserved. BigQuery をどこで使うか カスタマ クライアント ④KPI可視化 データドリブンな意思決定支援 アドホック分析がメイン ↓ BigQueryが向いている
26.
(C) Recruit Holdings
Co.,Ltd. All rights reserved. BigQuery の使い所 Oracle Exadata Hortonworks BigQuery 出来ること SQL SQL (Hive) 機械学習 + その他 SQL クエリ速度 △ リソースは一定 △ リソースは一定 ? クエリ毎にリソースを確保 値段 ? 専用ハードウェアが必要 △ 一般的なハードウェア ? クエリ課金 扱えるデータ量 (予算内で) ? 容量あたり蓄積コスト高 △ ? 全量OK セキュリティ?安 定性 ? オンプレなので ? オンプレなので △ クラウドなので 高SLAのバッチ処理 機械学習モデルの 計算 全社員向け 公開データセット バックエンドシステム アドホック分析
27.
(C) Recruit Holdings
Co.,Ltd. All rights reserved. BigQuery がアドホック分析に向いている訳 ■ 速い ● すぐに分析結果が出る ■ データ量を気にしなくて良い ● 容量は実質無限。GCS にためておくだけなら安い。 ■ 使いやすい ● ブラウザがあればOK。クライアント環境構築が不要 ■ 従量課金 ● 使いたいときだけにコストが発生する ■ データの共有が簡単 ● 1クリックでデータ共有が可能 ● 例)全社 BigQuery に全社データから推定したユーザ属性を格納し、 各社の BigQuery からJOINしてつかってもらう
28.
(C) Recruit Holdings
Co.,Ltd. All rights reserved. GCP の活用と今後のテーマ ■ GCP 活用中 ● Google Pub/Sub を用いたユーザ行動ログに対するリアルタイム属性付与 ● Cloud Spannerを用いたメールバナー出し分けツール ● Google Cloud Datastore を用いた、全ユーザx全属性を高速に取得できるAPI開発 ■ 今後のテーマ ● BigQuery 全社公開 ● Hadoopベースの機械学習から、Dataflow + GPUベースの機械学習へ ● BigQueryにデータ品質情報が表示される画面の開発
29.
(C) Recruit Holdings
Co.,Ltd. All rights reserved. BigQueryにデータ品質情報が表示される画面(開発中)