狠狠撸

狠狠撸Share a Scribd company logo
2021年3月3日
永田 享
SAP Japan
SAP Data Intelligence - データ連携とML活用
SAP Inside Track 2021
TOKYO
発表動画 on YouTube
2
? 名前:永田 享
? 所属:SAP / CoE Platform Japan
? 役割:Consultant
o Business Technology Platform
o Data Engineering
o Data Science
? 参加目的:情報収集?交流
? 経歴:
o IaaS/PaaS開発?運用
o AIチャットボット開発
o SAP DI/HANA
? 趣味:ピアノ、スノーボード、旅行
3
参加者にセッション前質問
? 質問①:MLプロジェクトの経験は?
o 機会がない
o 今年参画予定あり
o プロジェクト中
o 経験した
? 質問②:データ連携、もしくはMLで解決したい課題は?
4
1. Data Intelligence 概要
2. データ連携
3. ML活用
4. まとめ
Data Intelligence - データ連携とML活用
5
パイプラインのオーケストレーション
既存のデータプロジェクトやデータ処理を
統合?オーケストレーション
機械学習プロジェクトの促進?自動化
高度な機械学習を統合し、データサイエンスプ
ロジェクトを促進?自動化
メタデータ管理とデータカタログ
多様なデータランドスケープをまたがった
メタデータの一元管理
SAP Data Intelligenceは、
エンタープライズにおける情報管理とAI活用プロセスを統合し、
データ主導型のイノベーションを実現するための、単一で統合されたソリューション
多様なデータ
ソースへの接続
データガバナンス
&検索
データ品質
&データ準備
パイプラインの
構築
機械学習の開発
とデプロイ
機械学習ライフ
サイクルの管理
SAP Data Intelligence 概要
6
1. Data Intelligence 概要
2. データ連携
3. ML活用
4. まとめ
Data Intelligence - データ連携とML活用
7
デモ)データ連携
? Kafkaとは?
o OSSの分散ストリーミングプラットフォーム
o 特徴:高スループット、低レイテンシ
o 起源:Linkedinが開発し、OSSとして公開
? データ連携ユースケース
SAPシステムとnon-SAPシステムの連携
Kafka
DI
CDS View
抽出?変換/加工?書き出し
8
デモ内容は以下ブログ参照
o 引用)SAP Data Intelligence – SAPシステムとnon-SAPシステムのデータ連携
デモ)データ連携
9
? 様々な場所に散らばったデータを効率よく連携?管理
? グラフィカルなパイプラインで、データの流れをわかりやすく可視化
デモ)データ連携 おさらい
10
1. Data Intelligence 概要
2. データ連携
3. ML活用
4. まとめ
Data Intelligence - データ連携とML活用
11
デモ)HANA APL連携でML活用
学習用データセット
予測対象データセット ? 機械学習
過去のデータをもとにモデルを作成し、
モデルを元に未来の事象を予測
? 今回の例
教師あり学習の分類タスク
これを予測したい
AI活用ユースケース
過去の保険申請の履歴を学習し、新たに来る申請が保険金目的の詐欺の申請かどうかを予測する。
HANA
DI
12
デモ内容は以下ブログ参照
o 引用)SAP Data IntelligenceとSAP HANA APLでML活用 – Part 1. モデル作成
o 引用)SAP Data IntelligenceとSAP HANA APLでML活用 – Part 2. モデルによる予測
デモ)HANA APL連携でML活用
13
? データ分析の知識が必要ない
? GUI操作で簡単にML活用
? 補足)APL単体だとSQL Likeな記述が必要
デモ)HANA APL連携でML活用 おさらい
SAP HANA Platform
Predictive Analysis Library (APL/PAL)
分類分析
回帰分析
クラスター分析
時系列予測
アソシエーション分析
リコメンデーション
リンク分析
外れ値検出
14
補足)データサイエンティスト向け機能も
15
1. Data Intelligence 概要
2. データ連携
3. ML活用
4. まとめ
Data Intelligence - データ連携とML活用
16
? データ管理基盤として
o SAPシステムに限らず、分散したデータを効率よく連携?管理
o グラフィカルなパイプラインで、データの流れを可視化
? AI活用基盤として
o ビジネスユーザー向け :データ分析の知識がなくても、GUI操作で簡単にML活用
o データサイエンティスト向け:Jupyterやパイプラインを利用した自由な開発と外部サービス連携
今日覚えて欲しいこと
SAP Data Intelligenceは、
エンタープライズにおけるデータ管理とAI活用プロセスを統合した、
データ主導型のイノベーションを実現するためのソリューション
17
データは重要な資産
1. 活用できそうなデータを探してみよう!
2. 散らばったデータを集めてみよう!
3. MLにかけてみよう!
テーマ:チャレンジしよう! - 行動をおこすキッカケに
いきなり完璧を目指さず、まずは簡単なサイクルを1つ回してみよう!
1サイクル回せたら大丈夫!
サイクルを繰り返し、データと分析の幅と深さを広げよう!

More Related Content

【SAP Inside Track Tokyo 2021】 SAP Data Intelligence - データ連携とML活用