[db tech showcase Tokyo 2017] D33: Deep Learningや、Analyticsのワークロードを加速するには-Ten...Insight Technology, Inc.
?
Deep Learningでは、GPUを用いた、コンピューティング環境を用意される事が多いですが、こちらを加速させる足回りについてはあまり意識されてきていませんでした。また、SparkでのAnalyticsについても、Pipeline処理の高速化が可能となりました。ピュアストレージが最新のユースケースのご紹介も兼ねて、AI時代のワークロードを実現する方法をお伝えします。
[db tech showcase Tokyo 2017] D33: Deep Learningや、Analyticsのワークロードを加速するには-Ten...Insight Technology, Inc.
?
Deep Learningでは、GPUを用いた、コンピューティング環境を用意される事が多いですが、こちらを加速させる足回りについてはあまり意識されてきていませんでした。また、SparkでのAnalyticsについても、Pipeline処理の高速化が可能となりました。ピュアストレージが最新のユースケースのご紹介も兼ねて、AI時代のワークロードを実現する方法をお伝えします。
第2回NHNテクノロジーカンファレンスで発表した資料ですー。
References: LINE Storage: Storing billions of rows in Sharded-Redis and HBase per Month (http://tech.naver.jp/blog/?p=1420), I posted this entry in 2012.3.
This document discusses the application of PostgreSQL in a large social infrastructure project involving smart meter management. It describes three main missions: (1) loading 10 million datasets within 10 minutes, (2) saving data for 24 months, and (3) stabilizing performance for large scale SELECT statements. Various optimizations are discussed to achieve these missions, including data modeling, performance tuning, reducing data size, and controlling execution plans. The results showed that all three missions were successfully completed by applying PostgreSQL expertise and customizing it for the large-scale requirements of the project.
This is the presentation which I explain at the Japanese Java Users Conference Annual Technology Conference is called JJUG CCC 2025 Spring.
In this presentation, I introduced the development productivity using GitHub Copilot. And How to implement Enterprise AI Java application by using LangChain4j. Finally I introduced easy of use and install the SLM(Small Language Model) on your edge device by using Azure AI Foundry Local.
7. ? 2018 NTT DATA Corporation 7
Router Based Federation (RBF)
? Router
? クライアントから送られてきたリクエストを、正しいNameNodeにプロキシする
? State Store
? Mount tableの管理
subcluster 0
R
NN
DN DN DN
subcluster 1
R
NN
DN DN DN
subcluster 2
R
NN
DN DN DN
StateStore(ZK)
clientC
8. ? 2018 NTT DATA Corporation 8
RBF deployments
? Microsoft
? 23K servers
? 8 subclusters
? 28 NameNodes
? 28 Routers
? Uber
? 2 routers
? 1 data center
9. ? 2018 NTT DATA Corporation 9
Routerによるレイテンシの影響
? NN と 4NN+12R を比較してみると、
? レイテンシは4倍程度に増加 (read metadataリクエストなので、最悪ケース)
? 単位時間あたりに処理できるリクエスト数は4倍弱に
10. ? 2018 NTT DATA Corporation 10
開発状況
? アクティブに開発が続いている
? Phase 1 (HDFS-10467, 2016/5~2017/10, 22/22 subtasks)
? Phase 2 (HDFS-12165, 2017/10~, 66/86 subtasks)
? New features
? WebHDFS
? Federated quotas
? On-going work
? Mount points across subclusters (HDFS-13224)
? Rebalancer (HDFS-13123)
11. ? 2018 NTT DATA Corporation 11
Mount points across subclusters
? マウントポイントとsubclusterは1対1対応
? 1対N対応させることで、容量やNameNodeへのリクエストの偏りが解消できる
? どうやって割り当てるか
? Consistent hashing
? HASH (ディレクトリ1階層目のハッシュ), HASH_ALL (フルパスのハッシュ)
? LOCAL
? RANDOM
? 制約
? ファイルを探すために複数のクラスタを辿る必要がある (consistent hashing以外)
? renameがクラスタ跨ぎになる可能性があり、非効率
? trunkにマージ済
13. ? 2018 NTT DATA Corporation 13
Future plan
? Uber
? Observer NameNode (HDFS-12943)
? RBF
? Upgrade to 3.x and use Erasure-Coding
? Auto rebalancing between hot and warm clusters
? Microsoft
? Federating federation!!!