SQL Server 使いのための Azure Synapse Analytics - Spark 入門Daiyu Hatakeyama
?
Japan SQL Server Users Group - 第35回 SQL Server 2019勉強会 - Azure Synapese Analytics - SQL Pool 入門 のセッション資料です。
Spark の位置づけ。Synapse の中での入門編の使い方。そして、Synapse ならではの価値について触れてます。
M08_あなたの知らない Azure インフラの世界 [Microsoft Japan Digital Days]日本マイクロソフト株式会社
?
日本マイクロソフト株式会社
カスタマーサクセス事業本部 エンタープライズアーキテクト統括本部 クラウドアーキテクト技術本部 クラウドソリューションアーキテクト
真壁 徹
Azure は日々進化を続けており、「Azure、三日会わざれば刮目して見よ」と言ってもいいでしょう。このセッションでは、Azure のデータセンタ、仮想マシン、ネットワーク、ストレージといったコアインフラストラクチャに関する「意外に知られていない」技術や実装を、様々な実験を通じてご紹介します。学びはじめの人だけでなく、長く利用しているユーザも、その進化をお楽しみください。
【Microsoft Japan Digital Daysについて】
Microsoft Japan Digital Days は、お客様が競争力を高め、市場の変化に迅速に対応し、より多くのことを達成することを目的とした、日本マイクロソフトがお届けする最大級のデジタル イベントです。4 日間にわたる本イベントでは、一人一人の生産性や想像力を高め、クラウド時代の組織をデザインするモダンワークの最新事例や、変化の波をうまく乗り切り、企業の持続的な発展に必要なビジネスレジリエンス経営を支えるテクノロジの最新機能および、企業の競争優位性に欠かせないクラウド戦略のビジョンなどデジタル時代に必要な情報をお届けいたしました。(2021年10月11日~14日開催)
オープンコミュニティ「要求開発アライアンス」(http://www.openthology.org)の2012年12月定例会発表資料です。
Open Community "Requirement Development Alliance" 2012/12 regular meeting of the presentation materials.
Azure Synapse Analytics is Azure SQL Data Warehouse evolved: a limitless analytics service, that brings together enterprise data warehousing and Big Data analytics into a single service. It gives you the freedom to query data on your terms, using either serverless on-demand or provisioned resources, at scale. Azure Synapse brings these two worlds together with a unified experience to ingest, prepare, manage, and serve data for immediate business intelligence and machine learning needs. This is a huge deck with lots of screenshots so you can see exactly how it works.
M08_あなたの知らない Azure インフラの世界 [Microsoft Japan Digital Days]日本マイクロソフト株式会社
?
日本マイクロソフト株式会社
カスタマーサクセス事業本部 エンタープライズアーキテクト統括本部 クラウドアーキテクト技術本部 クラウドソリューションアーキテクト
真壁 徹
Azure は日々進化を続けており、「Azure、三日会わざれば刮目して見よ」と言ってもいいでしょう。このセッションでは、Azure のデータセンタ、仮想マシン、ネットワーク、ストレージといったコアインフラストラクチャに関する「意外に知られていない」技術や実装を、様々な実験を通じてご紹介します。学びはじめの人だけでなく、長く利用しているユーザも、その進化をお楽しみください。
【Microsoft Japan Digital Daysについて】
Microsoft Japan Digital Days は、お客様が競争力を高め、市場の変化に迅速に対応し、より多くのことを達成することを目的とした、日本マイクロソフトがお届けする最大級のデジタル イベントです。4 日間にわたる本イベントでは、一人一人の生産性や想像力を高め、クラウド時代の組織をデザインするモダンワークの最新事例や、変化の波をうまく乗り切り、企業の持続的な発展に必要なビジネスレジリエンス経営を支えるテクノロジの最新機能および、企業の競争優位性に欠かせないクラウド戦略のビジョンなどデジタル時代に必要な情報をお届けいたしました。(2021年10月11日~14日開催)
オープンコミュニティ「要求開発アライアンス」(http://www.openthology.org)の2012年12月定例会発表資料です。
Open Community "Requirement Development Alliance" 2012/12 regular meeting of the presentation materials.
Azure Synapse Analytics is Azure SQL Data Warehouse evolved: a limitless analytics service, that brings together enterprise data warehousing and Big Data analytics into a single service. It gives you the freedom to query data on your terms, using either serverless on-demand or provisioned resources, at scale. Azure Synapse brings these two worlds together with a unified experience to ingest, prepare, manage, and serve data for immediate business intelligence and machine learning needs. This is a huge deck with lots of screenshots so you can see exactly how it works.
【ウェブ セミナー】AI / アナリティクスを支えるビッグデータ基盤 Azure Data Lake [実践編]Hideo Takagi
?
2018/3/8【ウェブ セミナー】AI / アナリティクスを支えるビッグデータ基盤 Azure Data Lake [実践編]
https://info.microsoft.com/JA-AABD-WBNR-FY18-03Mar-08-BigdatainfrastructuresupportingAI-MCW0002861_01Registration-ForminBody.html?ls=Website&lsd=AzureWebsite
13. 13
SELECT COUNT_BIG(*)
FROM FactInternetSales;
SELECT SUM(*)
FROM FactInternetSales;
SELECT COUNT_BIG(*)
FROM FactInternetSales;
SELECT COUNT_BIG(*)
FROM FactInternetSales;
SELECT COUNT_BIG(*)
FROM FactInternetSales;
SELECT COUNT_BIG(*)
FROM FactInternetSales;
Compute
Control
15. 15
ラウンドロビン ハッシュ 複製 (Replicated table)
? 全てのディストリビューションに
均等にランダムに分散
? 指定した列のハッシュ値に基
づいて分散
? テーブルをすべてのコンピュー
トのディストリビューションに配
置
DISTRIBUTION = ROUND_ROBIN DISTRIBUTION = HASH(Key) DISTRIBUTION = REPLICATE
Public preview (2017/7/26 現在)
16. 16
均一にすべてのディストリビューションに
CREATE TABLE (…)
WITH DISTRIBUTION = ROUND_ROBIN
Dist_DB_1
Dist_DB_2
Dist_DB_3
Dist_DB_4
ID Name City Balance
201 Bob Madison $3,000
105 Sue San Fran $110
933 Sue Seattle $40,000
150 George Seattle $60
220 Sally Mtn View $990
86 Bob New York $2,300
201 Bob …
105 Sue …
150 Geoge …
220 Sally …
86 Bob …
933 Sue …
482 John …
115 Asad …
201 Bob Madison $3,000
105 Sue San Fran $110
933 Sue Seattle $40,000
150 George Seattle $60
220 Sally Mtn View $990
86 Bob New York $2,300
18. 18
ID UserID Name Tran
201 123 Bob $3,000
105 324 Sue $110
933 324 Sue $40,000
150 45 George $60
220 154 Sally $990
86 123 Bob $2,300
201 123 Bob $3,000
105 324 Sue $110
933 324 Sue $40,000
150 45 George $60
220 154 Sally $990
86 123 Bob $2,300
Dist_DB_1
Dist_DB_2
Dist_DB_3
Dist_DB_4
同じキーは同じディストリビューションに
123 Bob …
324 Sue …
45 Geoge …
154 Sally …
123 Bob …
324 Sue …
CREATE TABLE (…)
WITH DISTRIBUTION = HASH(UserID)
22. する
22
vs_key color ord
11 Red 15
32 Blue 20
54 Yellow 22
68 Purple 17
ss_key vid qty
1 2 5
3 32 10
5 6 12
7 78 7
vs_key color ord
2 Red 13
4 Blue 21
6 Yellow 27
8 Green 11
ss_key vid qty
2 11 3
4 4 11
6 54 17
8 8 1
HASH(vs_key) HASH(ss_key)
11, 15, 3
2, 13, 5
11, 15, 3 : 2, 13, 5
SELECT vs_key, a.ord ,b.qty
FROM vendor_sales a
JOIN store_sales b ON a.vs_key = b.vid
WHERE a.color = 'Red'
23. しない
23
ws_key color Qty
1 Red 15
3 Blue 20
5 Yellow 22
7 Green 17
ss_key color Qty
1 Red 5
3 Blue 10
5 Yellow 12
7 Green 7
ws_key color Qty
2 Red 13
4 Blue 21
6 Yellow 27
8 Green 11
ss_key color Qty
2 Red 3
4 Blue 11
6 Yellow 17
8 Green 1
HASH(ws_key) HASH(ss_key)
Red, 5
Red, 3
Red, 5 : Red, 3
SELECT a.color, b.Qty
FROM web_sales a
JOIN store_sales b ON a.ws_key = b.ss_key
WHERE a.color = 'Red'