狠狠撸

狠狠撸Share a Scribd company logo
Nanae Matsushima
Product Consultant
Presented by:
深く調べる:
Tableau による高密度データの解析
Alan Eldridge
Sales Consulting Manager
? 高密度のデータ
? 基本的なグラフ
? キーとなる統計量
? 対処方法
? 高密度の空間データ
? 透明度の変更
? データの分割
? 空間ビニング
アジェンダ
Tableau Conference On Tokyo 2015_Tableauによる高密度データの解析_Go Deep Interpreting Dense Data with Tableau
ニューヨーク市のタクシーの乗車場所
– 41GBに及ぶデータ(CSV)
– 2.3GB(TDE)
– 1.56億を超える膨大なデータ
高密度の空間データ
データの視覚化によって
2つのことが明らかになる
– ニューヨーク市の
タクシー利用客は多い
– あまりにも多くの点が
重なり合っているため、
実際のパターンが
まったく見えてこない
どのようなパターンが見られるか?
– 透明度 10%
解決策1:透明度を下げる
データ量がやはり多すぎる???
1 日の時間の経過とともにどうパターンが変化するのか?
– 未明 (12-3)
– 明け方 (3-6)
– 朝の通勤時間帯 (6-9)
– 日中 (9-4)
– 夕方の通勤時間帯 (4-7)
– 夜 (7-10)
– 深夜 (10-12)
解決策2:データ量の削減
未明
(12-3)
明け方
(3-6)
朝の通勤時間帯
(6-9)
日中
(9-4)
夕方の通勤時間帯
(4-7)
夜
(7-10)
深夜
(10-12)
まだ密度が高すぎる???
同じ大きさと形の「ビン」に
集めてデータを簡素化
? なぜ空間ビニングなのか?
– 点が重なり合って密度がわからず、
ベースマップさえ見えない可能性があるため
? 基本的には、多角形でヒートマップを作成
解決策3:空間ビニング
– 緯度経度を四捨五入し、小数第 2 位まで求める (0.xx)
– 四捨五入した座標に基づき 四角いグリッドでプロット
四角形:緯度経度を四捨五入
– ビンのサイズを変更
– 細かい四角にするなら、四捨五入の桁数を調整
四角形:緯度経度を四捨五入
0.xx ~850 m x 1110 m 0.xxx ~85m x 111m
? 小さい値はフィルター
四角形:集計データのクリーンアップ
フィルターなし フィルターあり
四角形:ズームして見てみると???
0.xxx or ~85m x 110m
– 2 つの計算フィールド
? HexbinX
? HexbinY
– 各ポイントの六角形の
ビンの中心X、Y
六角形:Hexbin 作成
? サイズを変更するには、
スケール係数を変更するか、パラメーター使って変更
六角形:Hexbin 作成(詳細)
これらのスケール係数が六角形の大きさを決める
– 緯度と経度にスケール係数を掛ける
– 全体の計算をスケール係数で割る
? 1より大きい場合は、より小さいサイズのビンを作成
? 1より小さい場合は、より大きなサイズのビンを作成
六角形: Hexbin 作成(詳細)
月曜の12am – 3am
六角形: Hexbinを使った結果
土曜の12am – 3am
? Tableau の地図は、メルカトル図法を採用
? 緯度/経度を使ってHexbin (六角形のビン)を作成
六角形:地図投影法
1. 緯度/経度を 、メルカトル図法の座標に変換
2. 変換したメルカトル図法から、HexbinX とHexbinY で作成
3. メルカトル図法の座標を、緯度/経度に変換
4. マッピング
見た目ほど難しくはありません…
六角形:地図投影法
ステップ1: 緯度/経度 -> メルカトル図法
六角形:地図投影法
? 経緯度は(λ, φ)
? R: 地球の半径(Radius)
? 緯度/経度はラジアンで表示
ステップ2: Hexbin を作成
? パラメーターでビンの辺の長さを設定してもよい
– メルカトル図法はメートル表示
六角形:地図投影法
ステップ3: ビンの中心 (x,y) を緯度/経度に変換し直す
– メルカトル図法への変換の単純反転
六角形:地図投影法
ステップ4: マッピングする
六角形:地図投影法
ただし、軸の値に注意
– 1つのユニットの距離は、X 軸、Y 軸とも同じである必要がある
六角形:この方法は散布図にも有効
4階:PARTNER EXPO
へぜひお越しください!
Nanae Matsushima
nmatsushima@tableau.com
Alan Eldridge
aeldridge@tableau.com

More Related Content

Tableau Conference On Tokyo 2015_Tableauによる高密度データの解析_Go Deep Interpreting Dense Data with Tableau