狠狠撸

狠狠撸Share a Scribd company logo
Tableau から始める機械学習
ー やってみようPython連携
Tableau Japan
bashii-Tomohiro Iwahashi
Why Python連携?
2
R, SPSS,
SAS,KXEN,KNIME,
RapidMiner,DataRobot
Magellan Blocks
ビジネスの理解
データの理解
データの準備
予測モデルの作
成
モデルの評価
展開と共有
Tableau Prep
機械学習+BI
python
機械学習エンジンを
利用して予測機能を
拡張!
Tableau Desktop
Tableau Server
Tableau Desktop
データそのものの意
味を理解?ドメイン
知識と突き合わせる
楽できるところ
は楽をしていい
じゃん!!
学習データからモデルを作成する
4
教師あり機械学習
5
訓練データ
温度 湿度 年数 故障した
か
50 60 70 N
40 50 50 N
10 20 30 N
50 90 90 Y
②訓練データを学習
clf.fit(trainX,Y)
説明変数
trainX
目的
変数
Y
テストデータ
温度 湿度 年数 故障す
る?
50 60 70 ??
40 50 50 ??
③予測結果を導く
clf.predict(testX)
予測モデル 予測結果
教師アリ
温度 湿度 年数 故障する
確率?
50 60 70 90%
40 50 50 30%
①予測モデルの定義
clf = tree.DecisionTreeClassifier(…)
ビジネスの理解
データの理解
データの準備
予測モデルの作
成
モデルの評価
展開と共有
こんなデータがあります
7
説明変数
目的変数
定期預金を申し込むか申し込
まないのかを「予測」したい。
過去の経験から…
Bank Marketing (with social/economic context) (UCI Machine
Learning Repository)
とりあえず相関図を書いてみる。
8
ビジネスの理解
データの理解
データの準備
予測モデルの作
成
モデルの評価
展開と共有
Tableau Prepを使ってデータの準備
10
分布の確認
ユニオン?ジョイン?
ピボット
データ揺らぎの除
去
NULLデータの除
去
ビジネスの理解
データの理解
データの準備
予測モデルの作
成
モデルの評価
展開と共有
過去のデータから何らかのルールが見つけられるのでは?? 決定木
12
ビジネスの理解
データの理解
データの準備
予測モデルの作
成
モデルの評価
展開と共有
申し込み=Yの多い領域は?
14
15
当っている
当っている
予測No 予測Yes
実際No
実際Yes
予測No 予測Yes
実際No
実際Yes
当っている
当っている
作成したモデルを使って予測する
16
① CSVまたはDBからの取り込み
機械学習連携方法
? 2018 Tableau Software. All Rights Reserved
② 外部サービスとの連携 計算式として取得
Tabpy
温度 湿度 年数 故障?
50 60 70 Y
40 50 50 N
予測結果をバッチで
作成しTableauから
接続
予測結果をリアルタ
イムで取得したい
計算式からPython
を呼び出して、結果を
所定の位置に表示す
る
18
Tabpyって何ですか?
? 一番簡単なTabpyサンプル → 足し算
外部連携を使いま
すよ!返り値は
REALですよ。
実行されるpython
コード _arg に
Tableau からの
データが入る
Tableau から代入
するメジャーを指
定
19
List型で
Tableau に返
しますよ
表計算として
利用するので
集計になりま
すよ。
訓練データ
温度 湿度 年数 申込み
50 60 70 N
40 50 50 N
10 20 30 N
50 90 90 Y
説明変数
目的
変数
テストデータ
温度 湿度 年数 申込み
50 60 70 ??
40 50 50 ??
②予測の実施
予測モデル
予測結果
温度 湿度 年数 故障す
る?
50 60 70 Y
40 50 50 N
①予測モデルの作成
説明変数
予測モデルを作成す
るフェーズ
訓練データ
温度 湿度 年数 申込み
50 60 70 N
40 50 50 N
10 20 30 N
50 90 90 Y
説明変数
目的
変数
テストデータ
温度 湿度 年数 申込み
50 60 70 ??
40 50 50 ??
予測モデル
予測結果
説明変数
①予測モデルの作成
②予測結果を得る
温度 湿度 年数 故障す
る?
50 60 70 Y
40 50 50 N
予測モデルを利用し
て実際に予測する
フェーズ
訓練データ
テストデータ
温度 湿度 年数
50 60 70
40 50 50
デプロイ済み
予測モデル
Tabpy Server
温度 湿度 年数 申込み
50 60 70 Y
40 50 50 N
Tableau
予測結果
Tabpy Client事前に学習して
あるモデルを利用
するだけ
tabpy.query(‘def_x’ , …)
def_x
Tabpy Clientを利用した予測モデルの利用
事前に訓練デー
タをもとに学習を
しておく
Tabpy Serverにモデルをデプロイする
23
デプロイされたモデルをTableauから利用する
24
予測ができれば???可視化ができる!
25
予測ができれば次のビ
ジネスアクションに繫
げられる。
予測確率を
色で表現
参考リンク
26
ブログ: Tableauから始めるデータサイエンス
? 決定木モデルを使った機械学習とデータマイニングプロセスを体
験しよう!
? 過去データから学習して置いたモデルをTabpy Clientから呼び出
して予測結果を可視化する
? Tabpy Clientを使ってあらかじめ定義した関数をTableauから呼
ぶ
? GitHub-Tabpy

More Related Content

罢补产濒别补耻から始める机械学习ーやってみよう笔测迟丑辞苍连携冲2019-05-23