狠狠撸

狠狠撸Share a Scribd company logo
? 2018 NTT DATA Corporation
2018/7/20
技術革新統括本部 システム技術本部
鯵坂 明
HDFS router based federation
? 2018 NTT DATA Corporation 2
本日紹介するセッション
? HDFS router based federation
? Microsoft, Uberの共同発表
? 資料: /Hadoop_Summit/hdfs-router-based-federation
? HDFS BoF
? 2018 NTT DATA Corporation 3
従来のNameNode Federation
? HDFSクラスタを複数束ねて、1つのHDFSクラスタに見せるための仕組み
? NameNodeの限界を緩和するために、開発された
? Uberでは、現在これを利用して、1つのDCごとに3つのクラスタに分割している
? Main production HDFS cluster
? HBase cluster
? Tmp cluster (Hive scratch directory, YARN application logs, etc.)
? 2018 NTT DATA Corporation 4
従来のNameNode Federation
? クライアントにViewFileSystemの設定を記述
<property>
<!-- デフォルトでViewFileSystemを利用 -->
<name>fs.defaultFS</name>
<value>viewfs://cluster</value>
</property>
<property>
<name>fs.viewfs.mounttable.cluster.link./data</name>
<value>hdfs://ns1/data</value>
</property>
<property>
<name>fs.viewfs.mounttable.cluster.link./project</name>
<value>hdfs://ns2/project</value>
</property>
<property>
<name>fs.viewfs.mounttable.cluster.link./user</name>
<value>hdfs://ns3/user</value>
</property>
<property>
<name>fs.viewfs.mounttable.cluster.link./tmp</name>
<value>hdfs://ns4/tmp</value>
</property>
<property>
<!-- フォールバック先の指定-->
<name>fs.viewfs.mounttable.cluster.linkFallback</name>
<value>hdfs://ns5/</value>
</property>
ns5
ns4
ns1 ns2 ns3
? 2018 NTT DATA Corporation 5
従来のNameNode Federation
? クライアントが実行するコマンド
? 実際の処理内容
$ hdfs dfs –ls /data/sampledata.txt
$ hdfs dfs –ls hdfs://ns1/data/sampledata.txt
ns5
ns4
ns1 ns2 ns3
クライアント側で透過的に変換
? 2018 NTT DATA Corporation 6
従来のNameNode Federationの問題点
? ViewFileSystemの設定管理
? 全てのクライアントに全く同じ設定を実施する必要がある
? 設定変更は全てのクライアントに影響
? Subcluster間のリバランスが手動
? 解決策
? Mount tableを中央集権的に管理する
? Routing layerを加える
? 2018 NTT DATA Corporation 7
Router Based Federation (RBF)
? Router
? クライアントから送られてきたリクエストを、正しいNameNodeにプロキシする
? State Store
? Mount tableの管理
subcluster 0
R
NN
DN DN DN
subcluster 1
R
NN
DN DN DN
subcluster 2
R
NN
DN DN DN
StateStore(ZK)
clientC
? 2018 NTT DATA Corporation 8
RBF deployments
? Microsoft
? 23K servers
? 8 subclusters
? 28 NameNodes
? 28 Routers
? Uber
? 2 routers
? 1 data center
? 2018 NTT DATA Corporation 9
Routerによるレイテンシの影響
? NN と 4NN+12R を比較してみると、
? レイテンシは4倍程度に増加 (read metadataリクエストなので、最悪ケース)
? 単位時間あたりに処理できるリクエスト数は4倍弱に
? 2018 NTT DATA Corporation 10
開発状況
? アクティブに開発が続いている
? Phase 1 (HDFS-10467, 2016/5~2017/10, 22/22 subtasks)
? Phase 2 (HDFS-12165, 2017/10~, 66/86 subtasks)
? New features
? WebHDFS
? Federated quotas
? On-going work
? Mount points across subclusters (HDFS-13224)
? Rebalancer (HDFS-13123)
? 2018 NTT DATA Corporation 11
Mount points across subclusters
? マウントポイントとsubclusterは1対1対応
? 1対N対応させることで、容量やNameNodeへのリクエストの偏りが解消できる
? どうやって割り当てるか
? Consistent hashing
? HASH (ディレクトリ1階層目のハッシュ), HASH_ALL (フルパスのハッシュ)
? LOCAL
? RANDOM
? 制約
? ファイルを探すために複数のクラスタを辿る必要がある (consistent hashing以外)
? renameがクラスタ跨ぎになる可能性があり、非効率
? trunkにマージ済
? 2018 NTT DATA Corporation 12
On-going work: Rebalancer
? 現状では、偏りが発生した場合にはリバランスさせる必要がある
? リバランスは現状手動でやるしかない上に、煩雑
? リバランス対象のディレクトリをread-only化する
? データコピー
? Mount tableの修正
? Read-onlyの解除
? 旧データの削除
? 偏りを自動で特定し、自動でリバランスしてくれると、運用が非常に楽になる
開発状況
? JIRAにはdesign documentが置いてあるだけの状態
? Rebalancer を実装して、その評価をした論文がある
? Scaling Distributed File Systems in Resource-Harvesting Datacenters [ATC ‘17]
? 2018 NTT DATA Corporation 13
Future plan
? Uber
? Observer NameNode (HDFS-12943)
? RBF
? Upgrade to 3.x and use Erasure-Coding
? Auto rebalancing between hot and warm clusters
? Microsoft
? Federating federation!!!
? 2018 NTT DATA Corporation 14
HDFS BoF
? 開発者が集まって、各自話したいことを話す
? アジェンダはその場で決まる
? 2018 NTT DATA Corporation 15
HDFS BoF
? その場で書かれたアジェンダ
? 開発者が多いシリコンバレー開催だからこその集まり具合 (HDFSで20人くらいいて、大半はコミッタ)
? 他のカンファレンスにはない、Dataworks Summitの醍醐味だと思う
? 来年は東海岸開催なので、集まりが悪くならないか不安
? 2018 NTT DATA Corporation

More Related Content

What's hot (20)

ポスト?ラムダアーキテクチャの切り札? Apache Hudi(NTTデータ テクノロジーカンファレンス 2020 発表資料)
ポスト?ラムダアーキテクチャの切り札? Apache Hudi(NTTデータ テクノロジーカンファレンス 2020 発表資料)ポスト?ラムダアーキテクチャの切り札? Apache Hudi(NTTデータ テクノロジーカンファレンス 2020 発表資料)
ポスト?ラムダアーキテクチャの切り札? Apache Hudi(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTT DATA Technology & Innovation
?
[db tech showcase Tokyo 2015] B34:データの仮想化を具体化するIBMのロジカルデータウェアハウス by 日本アイ?ビー?エ...
[db tech showcase Tokyo 2015] B34:データの仮想化を具体化するIBMのロジカルデータウェアハウス by 日本アイ?ビー?エ...[db tech showcase Tokyo 2015] B34:データの仮想化を具体化するIBMのロジカルデータウェアハウス by 日本アイ?ビー?エ...
[db tech showcase Tokyo 2015] B34:データの仮想化を具体化するIBMのロジカルデータウェアハウス by 日本アイ?ビー?エ...
Insight Technology, Inc.
?
Apache Hadoop and YARN, current development status
Apache Hadoop and YARN, current development statusApache Hadoop and YARN, current development status
Apache Hadoop and YARN, current development status
NTT DATA OSS Professional Services
?
サポートメンバは見た! Hadoopバグワースト10 (adoop / Spark Conference Japan 2016 ライトニングトーク発表資料)
サポートメンバは見た! Hadoopバグワースト10 (adoop / Spark Conference Japan 2016 ライトニングトーク発表資料)サポートメンバは見た! Hadoopバグワースト10 (adoop / Spark Conference Japan 2016 ライトニングトーク発表資料)
サポートメンバは見た! Hadoopバグワースト10 (adoop / Spark Conference Japan 2016 ライトニングトーク発表資料)
NTT DATA OSS Professional Services
?
20170303 java9 hadoop
20170303 java9 hadoop20170303 java9 hadoop
20170303 java9 hadoop
NTT DATA OSS Professional Services
?
HDFS新機能総まとめin 2015 (日本Hadoopユーザー会 ライトニングトーク@Cloudera World Tokyo 2015 講演資料)
HDFS新機能総まとめin 2015 (日本Hadoopユーザー会 ライトニングトーク@Cloudera World Tokyo 2015 講演資料)HDFS新機能総まとめin 2015 (日本Hadoopユーザー会 ライトニングトーク@Cloudera World Tokyo 2015 講演資料)
HDFS新機能総まとめin 2015 (日本Hadoopユーザー会 ライトニングトーク@Cloudera World Tokyo 2015 講演資料)
NTT DATA OSS Professional Services
?
[db tech showcase Tokyo 2017] D33: Deep Learningや、Analyticsのワークロードを加速するには-Ten...
[db tech showcase Tokyo 2017] D33: Deep Learningや、Analyticsのワークロードを加速するには-Ten...[db tech showcase Tokyo 2017] D33: Deep Learningや、Analyticsのワークロードを加速するには-Ten...
[db tech showcase Tokyo 2017] D33: Deep Learningや、Analyticsのワークロードを加速するには-Ten...
Insight Technology, Inc.
?
SIerとオープンソースの美味しい関係 ~コミュニティの力を活かして世界を目指そう~
SIerとオープンソースの美味しい関係 ~コミュニティの力を活かして世界を目指そう~SIerとオープンソースの美味しい関係 ~コミュニティの力を活かして世界を目指そう~
SIerとオープンソースの美味しい関係 ~コミュニティの力を活かして世界を目指そう~
NTT DATA OSS Professional Services
?
Hadoop 2.6の最新機能(Cloudera World Tokyo 2014 LT講演資料)
Hadoop 2.6の最新機能(Cloudera World Tokyo 2014 LT講演資料)Hadoop 2.6の最新機能(Cloudera World Tokyo 2014 LT講演資料)
Hadoop 2.6の最新機能(Cloudera World Tokyo 2014 LT講演資料)
NTT DATA OSS Professional Services
?
Apache Hadoopに見るJavaミドルウェアのcompatibility(Open Developers Conference 2020 Onli...
Apache Hadoopに見るJavaミドルウェアのcompatibility(Open Developers Conference 2020 Onli...Apache Hadoopに見るJavaミドルウェアのcompatibility(Open Developers Conference 2020 Onli...
Apache Hadoopに見るJavaミドルウェアのcompatibility(Open Developers Conference 2020 Onli...
NTT DATA Technology & Innovation
?
贬补诲辞辞辫2.6の最新机能+
贬补诲辞辞辫2.6の最新机能+贬补诲辞辞辫2.6の最新机能+
贬补诲辞辞辫2.6の最新机能+
NTT DATA OSS Professional Services
?
分散処理基盤Apache Hadoopの現状と、NTTデータのHadoopに対する取り組み
分散処理基盤Apache Hadoopの現状と、NTTデータのHadoopに対する取り組み分散処理基盤Apache Hadoopの現状と、NTTデータのHadoopに対する取り組み
分散処理基盤Apache Hadoopの現状と、NTTデータのHadoopに対する取り組み
NTT DATA OSS Professional Services
?
[db tech showcase Tokyo 2016] B31: Spark Summit 2016@SFに参加してきたので最新事例などを紹介しつつデ...
[db tech showcase Tokyo 2016] B31: Spark Summit 2016@SFに参加してきたので最新事例などを紹介しつつデ...[db tech showcase Tokyo 2016] B31: Spark Summit 2016@SFに参加してきたので最新事例などを紹介しつつデ...
[db tech showcase Tokyo 2016] B31: Spark Summit 2016@SFに参加してきたので最新事例などを紹介しつつデ...
Insight Technology, Inc.
?
Oracle Cloudで始める、DBエンジニアのためのHadoop超入門(db tech showcase 2016 Oracle セッション資料)
Oracle Cloudで始める、DBエンジニアのためのHadoop超入門(db tech showcase 2016 Oracle セッション資料)Oracle Cloudで始める、DBエンジニアのためのHadoop超入門(db tech showcase 2016 Oracle セッション資料)
Oracle Cloudで始める、DBエンジニアのためのHadoop超入門(db tech showcase 2016 Oracle セッション資料)
オラクルエンジニア通信
?
Apache Hadoop HDFSの最新機能の紹介(2018)#dbts2018
Apache Hadoop HDFSの最新機能の紹介(2018)#dbts2018Apache Hadoop HDFSの最新機能の紹介(2018)#dbts2018
Apache Hadoop HDFSの最新機能の紹介(2018)#dbts2018
驰补丑辞辞!デベロッパーネットワーク
?
データインターフェースとしてのHadoop ~HDFSとクラウドストレージと私~ (NTTデータ テクノロジーカンファレンス 2019 講演資料、2019...
データインターフェースとしてのHadoop ~HDFSとクラウドストレージと私~ (NTTデータ テクノロジーカンファレンス 2019 講演資料、2019...データインターフェースとしてのHadoop ~HDFSとクラウドストレージと私~ (NTTデータ テクノロジーカンファレンス 2019 講演資料、2019...
データインターフェースとしてのHadoop ~HDFSとクラウドストレージと私~ (NTTデータ テクノロジーカンファレンス 2019 講演資料、2019...
NTT DATA Technology & Innovation
?
最新版贬补诲辞辞辫クラスタを运用して得られたもの
最新版贬补诲辞辞辫クラスタを运用して得られたもの最新版贬补诲辞辞辫クラスタを运用して得られたもの
最新版贬补诲辞辞辫クラスタを运用して得られたもの
cyberagent
?
20190314 PGStrom Arrow_Fdw
20190314 PGStrom Arrow_Fdw20190314 PGStrom Arrow_Fdw
20190314 PGStrom Arrow_Fdw
Kohei KaiGai
?
Apache Hadoopの現在と未来
Apache Hadoopの現在と未来Apache Hadoopの現在と未来
Apache Hadoopの現在と未来
驰补丑辞辞!デベロッパーネットワーク
?
Hadoop ecosystem NTTDATA osc15tk
Hadoop ecosystem NTTDATA osc15tkHadoop ecosystem NTTDATA osc15tk
Hadoop ecosystem NTTDATA osc15tk
NTT DATA OSS Professional Services
?
ポスト?ラムダアーキテクチャの切り札? Apache Hudi(NTTデータ テクノロジーカンファレンス 2020 発表資料)
ポスト?ラムダアーキテクチャの切り札? Apache Hudi(NTTデータ テクノロジーカンファレンス 2020 発表資料)ポスト?ラムダアーキテクチャの切り札? Apache Hudi(NTTデータ テクノロジーカンファレンス 2020 発表資料)
ポスト?ラムダアーキテクチャの切り札? Apache Hudi(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTT DATA Technology & Innovation
?
[db tech showcase Tokyo 2015] B34:データの仮想化を具体化するIBMのロジカルデータウェアハウス by 日本アイ?ビー?エ...
[db tech showcase Tokyo 2015] B34:データの仮想化を具体化するIBMのロジカルデータウェアハウス by 日本アイ?ビー?エ...[db tech showcase Tokyo 2015] B34:データの仮想化を具体化するIBMのロジカルデータウェアハウス by 日本アイ?ビー?エ...
[db tech showcase Tokyo 2015] B34:データの仮想化を具体化するIBMのロジカルデータウェアハウス by 日本アイ?ビー?エ...
Insight Technology, Inc.
?
サポートメンバは見た! Hadoopバグワースト10 (adoop / Spark Conference Japan 2016 ライトニングトーク発表資料)
サポートメンバは見た! Hadoopバグワースト10 (adoop / Spark Conference Japan 2016 ライトニングトーク発表資料)サポートメンバは見た! Hadoopバグワースト10 (adoop / Spark Conference Japan 2016 ライトニングトーク発表資料)
サポートメンバは見た! Hadoopバグワースト10 (adoop / Spark Conference Japan 2016 ライトニングトーク発表資料)
NTT DATA OSS Professional Services
?
HDFS新機能総まとめin 2015 (日本Hadoopユーザー会 ライトニングトーク@Cloudera World Tokyo 2015 講演資料)
HDFS新機能総まとめin 2015 (日本Hadoopユーザー会 ライトニングトーク@Cloudera World Tokyo 2015 講演資料)HDFS新機能総まとめin 2015 (日本Hadoopユーザー会 ライトニングトーク@Cloudera World Tokyo 2015 講演資料)
HDFS新機能総まとめin 2015 (日本Hadoopユーザー会 ライトニングトーク@Cloudera World Tokyo 2015 講演資料)
NTT DATA OSS Professional Services
?
[db tech showcase Tokyo 2017] D33: Deep Learningや、Analyticsのワークロードを加速するには-Ten...
[db tech showcase Tokyo 2017] D33: Deep Learningや、Analyticsのワークロードを加速するには-Ten...[db tech showcase Tokyo 2017] D33: Deep Learningや、Analyticsのワークロードを加速するには-Ten...
[db tech showcase Tokyo 2017] D33: Deep Learningや、Analyticsのワークロードを加速するには-Ten...
Insight Technology, Inc.
?
SIerとオープンソースの美味しい関係 ~コミュニティの力を活かして世界を目指そう~
SIerとオープンソースの美味しい関係 ~コミュニティの力を活かして世界を目指そう~SIerとオープンソースの美味しい関係 ~コミュニティの力を活かして世界を目指そう~
SIerとオープンソースの美味しい関係 ~コミュニティの力を活かして世界を目指そう~
NTT DATA OSS Professional Services
?
Hadoop 2.6の最新機能(Cloudera World Tokyo 2014 LT講演資料)
Hadoop 2.6の最新機能(Cloudera World Tokyo 2014 LT講演資料)Hadoop 2.6の最新機能(Cloudera World Tokyo 2014 LT講演資料)
Hadoop 2.6の最新機能(Cloudera World Tokyo 2014 LT講演資料)
NTT DATA OSS Professional Services
?
Apache Hadoopに見るJavaミドルウェアのcompatibility(Open Developers Conference 2020 Onli...
Apache Hadoopに見るJavaミドルウェアのcompatibility(Open Developers Conference 2020 Onli...Apache Hadoopに見るJavaミドルウェアのcompatibility(Open Developers Conference 2020 Onli...
Apache Hadoopに見るJavaミドルウェアのcompatibility(Open Developers Conference 2020 Onli...
NTT DATA Technology & Innovation
?
分散処理基盤Apache Hadoopの現状と、NTTデータのHadoopに対する取り組み
分散処理基盤Apache Hadoopの現状と、NTTデータのHadoopに対する取り組み分散処理基盤Apache Hadoopの現状と、NTTデータのHadoopに対する取り組み
分散処理基盤Apache Hadoopの現状と、NTTデータのHadoopに対する取り組み
NTT DATA OSS Professional Services
?
[db tech showcase Tokyo 2016] B31: Spark Summit 2016@SFに参加してきたので最新事例などを紹介しつつデ...
[db tech showcase Tokyo 2016] B31: Spark Summit 2016@SFに参加してきたので最新事例などを紹介しつつデ...[db tech showcase Tokyo 2016] B31: Spark Summit 2016@SFに参加してきたので最新事例などを紹介しつつデ...
[db tech showcase Tokyo 2016] B31: Spark Summit 2016@SFに参加してきたので最新事例などを紹介しつつデ...
Insight Technology, Inc.
?
Oracle Cloudで始める、DBエンジニアのためのHadoop超入門(db tech showcase 2016 Oracle セッション資料)
Oracle Cloudで始める、DBエンジニアのためのHadoop超入門(db tech showcase 2016 Oracle セッション資料)Oracle Cloudで始める、DBエンジニアのためのHadoop超入門(db tech showcase 2016 Oracle セッション資料)
Oracle Cloudで始める、DBエンジニアのためのHadoop超入門(db tech showcase 2016 Oracle セッション資料)
オラクルエンジニア通信
?
データインターフェースとしてのHadoop ~HDFSとクラウドストレージと私~ (NTTデータ テクノロジーカンファレンス 2019 講演資料、2019...
データインターフェースとしてのHadoop ~HDFSとクラウドストレージと私~ (NTTデータ テクノロジーカンファレンス 2019 講演資料、2019...データインターフェースとしてのHadoop ~HDFSとクラウドストレージと私~ (NTTデータ テクノロジーカンファレンス 2019 講演資料、2019...
データインターフェースとしてのHadoop ~HDFSとクラウドストレージと私~ (NTTデータ テクノロジーカンファレンス 2019 講演資料、2019...
NTT DATA Technology & Innovation
?
最新版贬补诲辞辞辫クラスタを运用して得られたもの
最新版贬补诲辞辞辫クラスタを运用して得られたもの最新版贬补诲辞辞辫クラスタを运用して得られたもの
最新版贬补诲辞辞辫クラスタを运用して得られたもの
cyberagent
?
20190314 PGStrom Arrow_Fdw
20190314 PGStrom Arrow_Fdw20190314 PGStrom Arrow_Fdw
20190314 PGStrom Arrow_Fdw
Kohei KaiGai
?

Similar to HDFS Router-based federation (20)

NTTデータ流 Hadoop活用のすすめ ~インフラ構築?運用の勘所~
NTTデータ流 Hadoop活用のすすめ ~インフラ構築?運用の勘所~NTTデータ流 Hadoop活用のすすめ ~インフラ構築?運用の勘所~
NTTデータ流 Hadoop活用のすすめ ~インフラ構築?運用の勘所~
NTT DATA OSS Professional Services
?
sparksql-hive-bench-by-nec-hwx-at-hcj16
sparksql-hive-bench-by-nec-hwx-at-hcj16sparksql-hive-bench-by-nec-hwx-at-hcj16
sparksql-hive-bench-by-nec-hwx-at-hcj16
Yifeng Jiang
?
HDFS Supportaiblity Improvements
HDFS Supportaiblity ImprovementsHDFS Supportaiblity Improvements
HDFS Supportaiblity Improvements
Cloudera Japan
?
Yahoo! JAPANのOracle構成-2017年版
Yahoo! JAPANのOracle構成-2017年版Yahoo! JAPANのOracle構成-2017年版
Yahoo! JAPANのOracle構成-2017年版
驰补丑辞辞!デベロッパーネットワーク
?
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
Developers Summit
?
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
Cloudera Japan
?
Apache Big Data Miami 2017 - Hadoop Source Code Reading #23 #hadoopreading
Apache Big Data Miami 2017 - Hadoop Source Code Reading #23 #hadoopreadingApache Big Data Miami 2017 - Hadoop Source Code Reading #23 #hadoopreading
Apache Big Data Miami 2017 - Hadoop Source Code Reading #23 #hadoopreading
驰补丑辞辞!デベロッパーネットワーク
?
Cloudera大阪セミナー 20130219
Cloudera大阪セミナー 20130219Cloudera大阪セミナー 20130219
Cloudera大阪セミナー 20130219
Cloudera Japan
?
Yahoo! JAPANのOracle構成-2017年版
Yahoo! JAPANのOracle構成-2017年版Yahoo! JAPANのOracle構成-2017年版
Yahoo! JAPANのOracle構成-2017年版
Makoto Sato
?
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
NTT DATA OSS Professional Services
?
HBaseCon 2012 参加レポート
HBaseCon 2012 参加レポートHBaseCon 2012 参加レポート
HBaseCon 2012 参加レポート
NTT DATA OSS Professional Services
?
Hadoop Compatible File Systems (Azure編) (セミナー「Big Data Developerに贈る第二弾 ‐ Azur...
Hadoop Compatible File Systems (Azure編) (セミナー「Big Data Developerに贈る第二弾 ‐ Azur...Hadoop Compatible File Systems (Azure編) (セミナー「Big Data Developerに贈る第二弾 ‐ Azur...
Hadoop Compatible File Systems (Azure編) (セミナー「Big Data Developerに贈る第二弾 ‐ Azur...
NTT DATA Technology & Innovation
?
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
Insight Technology, Inc.
?
Osc2012 spring HBase Report
Osc2012 spring HBase ReportOsc2012 spring HBase Report
Osc2012 spring HBase Report
Seiichiro Ishida
?
HBase at LINE
HBase at LINEHBase at LINE
HBase at LINE
Shun Nakamura
?
HBase at LINE
HBase at LINEHBase at LINE
HBase at LINE
LINE Corporation (Tech Unit)
?
Gmo media.inc 第9回西日本ossの普及を考える会
Gmo media.inc 第9回西日本ossの普及を考える会Gmo media.inc 第9回西日本ossの普及を考える会
Gmo media.inc 第9回西日本ossの普及を考える会
Dai Utsui
?
HBase Across the World #LINE_DM
HBase Across the World #LINE_DMHBase Across the World #LINE_DM
HBase Across the World #LINE_DM
Cloudera Japan
?
Evolution of Impala #hcj2014
Evolution of Impala #hcj2014Evolution of Impala #hcj2014
Evolution of Impala #hcj2014
Cloudera Japan
?
NTTデータ流 Hadoop活用のすすめ ~インフラ構築?運用の勘所~
NTTデータ流 Hadoop活用のすすめ ~インフラ構築?運用の勘所~NTTデータ流 Hadoop活用のすすめ ~インフラ構築?運用の勘所~
NTTデータ流 Hadoop活用のすすめ ~インフラ構築?運用の勘所~
NTT DATA OSS Professional Services
?
sparksql-hive-bench-by-nec-hwx-at-hcj16
sparksql-hive-bench-by-nec-hwx-at-hcj16sparksql-hive-bench-by-nec-hwx-at-hcj16
sparksql-hive-bench-by-nec-hwx-at-hcj16
Yifeng Jiang
?
HDFS Supportaiblity Improvements
HDFS Supportaiblity ImprovementsHDFS Supportaiblity Improvements
HDFS Supportaiblity Improvements
Cloudera Japan
?
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
Developers Summit
?
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
Cloudera Japan
?
Cloudera大阪セミナー 20130219
Cloudera大阪セミナー 20130219Cloudera大阪セミナー 20130219
Cloudera大阪セミナー 20130219
Cloudera Japan
?
Yahoo! JAPANのOracle構成-2017年版
Yahoo! JAPANのOracle構成-2017年版Yahoo! JAPANのOracle構成-2017年版
Yahoo! JAPANのOracle構成-2017年版
Makoto Sato
?
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
NTT DATA OSS Professional Services
?
Hadoop Compatible File Systems (Azure編) (セミナー「Big Data Developerに贈る第二弾 ‐ Azur...
Hadoop Compatible File Systems (Azure編) (セミナー「Big Data Developerに贈る第二弾 ‐ Azur...Hadoop Compatible File Systems (Azure編) (セミナー「Big Data Developerに贈る第二弾 ‐ Azur...
Hadoop Compatible File Systems (Azure編) (セミナー「Big Data Developerに贈る第二弾 ‐ Azur...
NTT DATA Technology & Innovation
?
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
Insight Technology, Inc.
?
Gmo media.inc 第9回西日本ossの普及を考える会
Gmo media.inc 第9回西日本ossの普及を考える会Gmo media.inc 第9回西日本ossの普及を考える会
Gmo media.inc 第9回西日本ossの普及を考える会
Dai Utsui
?
HBase Across the World #LINE_DM
HBase Across the World #LINE_DMHBase Across the World #LINE_DM
HBase Across the World #LINE_DM
Cloudera Japan
?
Evolution of Impala #hcj2014
Evolution of Impala #hcj2014Evolution of Impala #hcj2014
Evolution of Impala #hcj2014
Cloudera Japan
?
Ad

More from NTT DATA OSS Professional Services (18)

Global Top 5 を目指す NTT DATA の確かで意外な技術力
Global Top 5 を目指す NTT DATA の確かで意外な技術力Global Top 5 を目指す NTT DATA の確かで意外な技術力
Global Top 5 を目指す NTT DATA の確かで意外な技術力
NTT DATA OSS Professional Services
?
Spark SQL - The internal -
Spark SQL - The internal -Spark SQL - The internal -
Spark SQL - The internal -
NTT DATA OSS Professional Services
?
Structured Streaming - The Internal -
Structured Streaming - The Internal -Structured Streaming - The Internal -
Structured Streaming - The Internal -
NTT DATA OSS Professional Services
?
ブロックチェーンの仕组みと动向(入门编)
ブロックチェーンの仕组みと动向(入门编)ブロックチェーンの仕组みと动向(入门编)
ブロックチェーンの仕组みと动向(入门编)
NTT DATA OSS Professional Services
?
Application of postgre sql to large social infrastructure jp
Application of postgre sql to large social infrastructure jpApplication of postgre sql to large social infrastructure jp
Application of postgre sql to large social infrastructure jp
NTT DATA OSS Professional Services
?
Application of postgre sql to large social infrastructure
Application of postgre sql to large social infrastructureApplication of postgre sql to large social infrastructure
Application of postgre sql to large social infrastructure
NTT DATA OSS Professional Services
?
Apache Hadoop 2.8.0 の新機能 (抜粋)
Apache Hadoop 2.8.0 の新機能 (抜粋)Apache Hadoop 2.8.0 の新機能 (抜粋)
Apache Hadoop 2.8.0 の新機能 (抜粋)
NTT DATA OSS Professional Services
?
データ活用をもっともっと円滑に! ~データ処理?分析基盤編を少しだけ~
データ活用をもっともっと円滑に!~データ処理?分析基盤編を少しだけ~データ活用をもっともっと円滑に!~データ処理?分析基盤編を少しだけ~
データ活用をもっともっと円滑に! ~データ処理?分析基盤編を少しだけ~
NTT DATA OSS Professional Services
?
商用ミドルウェアの笔耻辫辫别迟化で気を付けたい5つのこと
商用ミドルウェアの笔耻辫辫别迟化で気を付けたい5つのこと商用ミドルウェアの笔耻辫辫别迟化で気を付けたい5つのこと
商用ミドルウェアの笔耻辫辫别迟化で気を付けたい5つのこと
NTT DATA OSS Professional Services
?
今からはじめるPuppet 2016 ~ インフラエンジニアのたしなみ ~
今からはじめるPuppet 2016 ~ インフラエンジニアのたしなみ ~今からはじめるPuppet 2016 ~ インフラエンジニアのたしなみ ~
今からはじめるPuppet 2016 ~ インフラエンジニアのたしなみ ~
NTT DATA OSS Professional Services
?
Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)
Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)
Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)
NTT DATA OSS Professional Services
?
Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)
Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)
Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)
NTT DATA OSS Professional Services
?
PostgreSQLでpg_bigmを使って日本語全文検索 (MySQLとPostgreSQLの日本語全文検索勉強会 発表資料)
PostgreSQLでpg_bigmを使って日本語全文検索 (MySQLとPostgreSQLの日本語全文検索勉強会 発表資料)PostgreSQLでpg_bigmを使って日本語全文検索 (MySQLとPostgreSQLの日本語全文検索勉強会 発表資料)
PostgreSQLでpg_bigmを使って日本語全文検索 (MySQLとPostgreSQLの日本語全文検索勉強会 発表資料)
NTT DATA OSS Professional Services
?
本当にあったHadoopの恐い話 Blockはどこへきえた? (Hadoop / Spark Conference Japan 2016 ライトニングトー...
本当にあったHadoopの恐い話Blockはどこへきえた? (Hadoop / Spark Conference Japan 2016 ライトニングトー...本当にあったHadoopの恐い話Blockはどこへきえた? (Hadoop / Spark Conference Japan 2016 ライトニングトー...
本当にあったHadoopの恐い話 Blockはどこへきえた? (Hadoop / Spark Conference Japan 2016 ライトニングトー...
NTT DATA OSS Professional Services
?
Apache Spark超入門 (Hadoop / Spark Conference Japan 2016 講演資料)
Apache Spark超入門 (Hadoop / Spark Conference Japan 2016 講演資料)Apache Spark超入門 (Hadoop / Spark Conference Japan 2016 講演資料)
Apache Spark超入門 (Hadoop / Spark Conference Japan 2016 講演資料)
NTT DATA OSS Professional Services
?
Hadoopのメンテナンスリリースバージョンをリリースしてみた (日本Hadoopユーザー会 ライトニングトーク@Cloudera World Tokyo...
Hadoopのメンテナンスリリースバージョンをリリースしてみた (日本Hadoopユーザー会 ライトニングトーク@Cloudera World Tokyo...Hadoopのメンテナンスリリースバージョンをリリースしてみた (日本Hadoopユーザー会 ライトニングトーク@Cloudera World Tokyo...
Hadoopのメンテナンスリリースバージョンをリリースしてみた (日本Hadoopユーザー会 ライトニングトーク@Cloudera World Tokyo...
NTT DATA OSS Professional Services
?
笔辞蝉迟驳谤别厂蚕尝コミュニティに飞び込もう
笔辞蝉迟驳谤别厂蚕尝コミュニティに飞び込もう笔辞蝉迟驳谤别厂蚕尝コミュニティに飞び込もう
笔辞蝉迟驳谤别厂蚕尝コミュニティに飞び込もう
NTT DATA OSS Professional Services
?
SIプロジェクトでのインフラ自動化の事例 (第1回 Puppetユーザ会 発表資料)
SIプロジェクトでのインフラ自動化の事例 (第1回 Puppetユーザ会 発表資料)SIプロジェクトでのインフラ自動化の事例 (第1回 Puppetユーザ会 発表資料)
SIプロジェクトでのインフラ自動化の事例 (第1回 Puppetユーザ会 発表資料)
NTT DATA OSS Professional Services
?
Global Top 5 を目指す NTT DATA の確かで意外な技術力
Global Top 5 を目指す NTT DATA の確かで意外な技術力Global Top 5 を目指す NTT DATA の確かで意外な技術力
Global Top 5 を目指す NTT DATA の確かで意外な技術力
NTT DATA OSS Professional Services
?
データ活用をもっともっと円滑に! ~データ処理?分析基盤編を少しだけ~
データ活用をもっともっと円滑に!~データ処理?分析基盤編を少しだけ~データ活用をもっともっと円滑に!~データ処理?分析基盤編を少しだけ~
データ活用をもっともっと円滑に! ~データ処理?分析基盤編を少しだけ~
NTT DATA OSS Professional Services
?
商用ミドルウェアの笔耻辫辫别迟化で気を付けたい5つのこと
商用ミドルウェアの笔耻辫辫别迟化で気を付けたい5つのこと商用ミドルウェアの笔耻辫辫别迟化で気を付けたい5つのこと
商用ミドルウェアの笔耻辫辫别迟化で気を付けたい5つのこと
NTT DATA OSS Professional Services
?
今からはじめるPuppet 2016 ~ インフラエンジニアのたしなみ ~
今からはじめるPuppet 2016 ~ インフラエンジニアのたしなみ ~今からはじめるPuppet 2016 ~ インフラエンジニアのたしなみ ~
今からはじめるPuppet 2016 ~ インフラエンジニアのたしなみ ~
NTT DATA OSS Professional Services
?
Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)
Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)
Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)
NTT DATA OSS Professional Services
?
Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)
Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)
Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)
NTT DATA OSS Professional Services
?
PostgreSQLでpg_bigmを使って日本語全文検索 (MySQLとPostgreSQLの日本語全文検索勉強会 発表資料)
PostgreSQLでpg_bigmを使って日本語全文検索 (MySQLとPostgreSQLの日本語全文検索勉強会 発表資料)PostgreSQLでpg_bigmを使って日本語全文検索 (MySQLとPostgreSQLの日本語全文検索勉強会 発表資料)
PostgreSQLでpg_bigmを使って日本語全文検索 (MySQLとPostgreSQLの日本語全文検索勉強会 発表資料)
NTT DATA OSS Professional Services
?
本当にあったHadoopの恐い話 Blockはどこへきえた? (Hadoop / Spark Conference Japan 2016 ライトニングトー...
本当にあったHadoopの恐い話Blockはどこへきえた? (Hadoop / Spark Conference Japan 2016 ライトニングトー...本当にあったHadoopの恐い話Blockはどこへきえた? (Hadoop / Spark Conference Japan 2016 ライトニングトー...
本当にあったHadoopの恐い話 Blockはどこへきえた? (Hadoop / Spark Conference Japan 2016 ライトニングトー...
NTT DATA OSS Professional Services
?
Apache Spark超入門 (Hadoop / Spark Conference Japan 2016 講演資料)
Apache Spark超入門 (Hadoop / Spark Conference Japan 2016 講演資料)Apache Spark超入門 (Hadoop / Spark Conference Japan 2016 講演資料)
Apache Spark超入門 (Hadoop / Spark Conference Japan 2016 講演資料)
NTT DATA OSS Professional Services
?
Hadoopのメンテナンスリリースバージョンをリリースしてみた (日本Hadoopユーザー会 ライトニングトーク@Cloudera World Tokyo...
Hadoopのメンテナンスリリースバージョンをリリースしてみた (日本Hadoopユーザー会 ライトニングトーク@Cloudera World Tokyo...Hadoopのメンテナンスリリースバージョンをリリースしてみた (日本Hadoopユーザー会 ライトニングトーク@Cloudera World Tokyo...
Hadoopのメンテナンスリリースバージョンをリリースしてみた (日本Hadoopユーザー会 ライトニングトーク@Cloudera World Tokyo...
NTT DATA OSS Professional Services
?
笔辞蝉迟驳谤别厂蚕尝コミュニティに飞び込もう
笔辞蝉迟驳谤别厂蚕尝コミュニティに飞び込もう笔辞蝉迟驳谤别厂蚕尝コミュニティに飞び込もう
笔辞蝉迟驳谤别厂蚕尝コミュニティに飞び込もう
NTT DATA OSS Professional Services
?
SIプロジェクトでのインフラ自動化の事例 (第1回 Puppetユーザ会 発表資料)
SIプロジェクトでのインフラ自動化の事例 (第1回 Puppetユーザ会 発表資料)SIプロジェクトでのインフラ自動化の事例 (第1回 Puppetユーザ会 発表資料)
SIプロジェクトでのインフラ自動化の事例 (第1回 Puppetユーザ会 発表資料)
NTT DATA OSS Professional Services
?
Ad

Recently uploaded (6)

20250611_話題のDevin、エンプラ開発で〇人分の仕事はできるのか !?
20250611_話題のDevin、エンプラ開発で〇人分の仕事はできるのか !?20250611_話題のDevin、エンプラ開発で〇人分の仕事はできるのか !?
20250611_話題のDevin、エンプラ開発で〇人分の仕事はできるのか !?
Masaki Yamakawa
?
PR業務に 地味に効く! AI活用実践集 ――毎日使ってわかった20の使いどころ
PR業務に 地味に効く! AI活用実践集 ――毎日使ってわかった20の使いどころPR業務に 地味に効く! AI活用実践集 ――毎日使ってわかった20の使いどころ
PR業務に 地味に効く! AI活用実践集 ――毎日使ってわかった20の使いどころ
maeri111b
?
Azure OpenAI と LangChain4j を使用した LLM Java エンタープライズ?アプリケーションの 構築方法の紹介
Azure OpenAI と LangChain4j を使用したLLM Java エンタープライズ?アプリケーションの構築方法の紹介Azure OpenAI と LangChain4j を使用したLLM Java エンタープライズ?アプリケーションの構築方法の紹介
Azure OpenAI と LangChain4j を使用した LLM Java エンタープライズ?アプリケーションの 構築方法の紹介
Yoshio Terada
?
イミュータブルデータモデルの導入実験と結果(JJUG CCC 2025 Spring)
イミュータブルデータモデルの導入実験と結果(JJUG CCC 2025 Spring)イミュータブルデータモデルの導入実験と結果(JJUG CCC 2025 Spring)
イミュータブルデータモデルの導入実験と結果(JJUG CCC 2025 Spring)
kiyokawa0702yuuma
?
AIVIDEO MAG JUNE2025 FIRST TEST---------
AIVIDEO MAG JUNE2025 FIRST TEST---------AIVIDEO MAG JUNE2025 FIRST TEST---------
AIVIDEO MAG JUNE2025 FIRST TEST---------
1pcity Studios, Inc
?
厂补测补办补贬补测补蝉丑颈冲既存データセットの活用事例に基づく新规データセットの活用方法推荐に関する検讨冲诲别颈尘2025
厂补测补办补贬补测补蝉丑颈冲既存データセットの活用事例に基づく新规データセットの活用方法推荐に関する検讨冲诲别颈尘2025厂补测补办补贬补测补蝉丑颈冲既存データセットの活用事例に基づく新规データセットの活用方法推荐に関する検讨冲诲别颈尘2025
厂补测补办补贬补测补蝉丑颈冲既存データセットの活用事例に基づく新规データセットの活用方法推荐に関する検讨冲诲别颈尘2025
Matsushita Laboratory
?
20250611_話題のDevin、エンプラ開発で〇人分の仕事はできるのか !?
20250611_話題のDevin、エンプラ開発で〇人分の仕事はできるのか !?20250611_話題のDevin、エンプラ開発で〇人分の仕事はできるのか !?
20250611_話題のDevin、エンプラ開発で〇人分の仕事はできるのか !?
Masaki Yamakawa
?
PR業務に 地味に効く! AI活用実践集 ――毎日使ってわかった20の使いどころ
PR業務に 地味に効く! AI活用実践集 ――毎日使ってわかった20の使いどころPR業務に 地味に効く! AI活用実践集 ――毎日使ってわかった20の使いどころ
PR業務に 地味に効く! AI活用実践集 ――毎日使ってわかった20の使いどころ
maeri111b
?
Azure OpenAI と LangChain4j を使用した LLM Java エンタープライズ?アプリケーションの 構築方法の紹介
Azure OpenAI と LangChain4j を使用したLLM Java エンタープライズ?アプリケーションの構築方法の紹介Azure OpenAI と LangChain4j を使用したLLM Java エンタープライズ?アプリケーションの構築方法の紹介
Azure OpenAI と LangChain4j を使用した LLM Java エンタープライズ?アプリケーションの 構築方法の紹介
Yoshio Terada
?
イミュータブルデータモデルの導入実験と結果(JJUG CCC 2025 Spring)
イミュータブルデータモデルの導入実験と結果(JJUG CCC 2025 Spring)イミュータブルデータモデルの導入実験と結果(JJUG CCC 2025 Spring)
イミュータブルデータモデルの導入実験と結果(JJUG CCC 2025 Spring)
kiyokawa0702yuuma
?
AIVIDEO MAG JUNE2025 FIRST TEST---------
AIVIDEO MAG JUNE2025 FIRST TEST---------AIVIDEO MAG JUNE2025 FIRST TEST---------
AIVIDEO MAG JUNE2025 FIRST TEST---------
1pcity Studios, Inc
?
厂补测补办补贬补测补蝉丑颈冲既存データセットの活用事例に基づく新规データセットの活用方法推荐に関する検讨冲诲别颈尘2025
厂补测补办补贬补测补蝉丑颈冲既存データセットの活用事例に基づく新规データセットの活用方法推荐に関する検讨冲诲别颈尘2025厂补测补办补贬补测补蝉丑颈冲既存データセットの活用事例に基づく新规データセットの活用方法推荐に関する検讨冲诲别颈尘2025
厂补测补办补贬补测补蝉丑颈冲既存データセットの活用事例に基づく新规データセットの活用方法推荐に関する検讨冲诲别颈尘2025
Matsushita Laboratory
?

HDFS Router-based federation

  • 1. ? 2018 NTT DATA Corporation 2018/7/20 技術革新統括本部 システム技術本部 鯵坂 明 HDFS router based federation
  • 2. ? 2018 NTT DATA Corporation 2 本日紹介するセッション ? HDFS router based federation ? Microsoft, Uberの共同発表 ? 資料: /Hadoop_Summit/hdfs-router-based-federation ? HDFS BoF
  • 3. ? 2018 NTT DATA Corporation 3 従来のNameNode Federation ? HDFSクラスタを複数束ねて、1つのHDFSクラスタに見せるための仕組み ? NameNodeの限界を緩和するために、開発された ? Uberでは、現在これを利用して、1つのDCごとに3つのクラスタに分割している ? Main production HDFS cluster ? HBase cluster ? Tmp cluster (Hive scratch directory, YARN application logs, etc.)
  • 4. ? 2018 NTT DATA Corporation 4 従来のNameNode Federation ? クライアントにViewFileSystemの設定を記述 <property> <!-- デフォルトでViewFileSystemを利用 --> <name>fs.defaultFS</name> <value>viewfs://cluster</value> </property> <property> <name>fs.viewfs.mounttable.cluster.link./data</name> <value>hdfs://ns1/data</value> </property> <property> <name>fs.viewfs.mounttable.cluster.link./project</name> <value>hdfs://ns2/project</value> </property> <property> <name>fs.viewfs.mounttable.cluster.link./user</name> <value>hdfs://ns3/user</value> </property> <property> <name>fs.viewfs.mounttable.cluster.link./tmp</name> <value>hdfs://ns4/tmp</value> </property> <property> <!-- フォールバック先の指定--> <name>fs.viewfs.mounttable.cluster.linkFallback</name> <value>hdfs://ns5/</value> </property> ns5 ns4 ns1 ns2 ns3
  • 5. ? 2018 NTT DATA Corporation 5 従来のNameNode Federation ? クライアントが実行するコマンド ? 実際の処理内容 $ hdfs dfs –ls /data/sampledata.txt $ hdfs dfs –ls hdfs://ns1/data/sampledata.txt ns5 ns4 ns1 ns2 ns3 クライアント側で透過的に変換
  • 6. ? 2018 NTT DATA Corporation 6 従来のNameNode Federationの問題点 ? ViewFileSystemの設定管理 ? 全てのクライアントに全く同じ設定を実施する必要がある ? 設定変更は全てのクライアントに影響 ? Subcluster間のリバランスが手動 ? 解決策 ? Mount tableを中央集権的に管理する ? Routing layerを加える
  • 7. ? 2018 NTT DATA Corporation 7 Router Based Federation (RBF) ? Router ? クライアントから送られてきたリクエストを、正しいNameNodeにプロキシする ? State Store ? Mount tableの管理 subcluster 0 R NN DN DN DN subcluster 1 R NN DN DN DN subcluster 2 R NN DN DN DN StateStore(ZK) clientC
  • 8. ? 2018 NTT DATA Corporation 8 RBF deployments ? Microsoft ? 23K servers ? 8 subclusters ? 28 NameNodes ? 28 Routers ? Uber ? 2 routers ? 1 data center
  • 9. ? 2018 NTT DATA Corporation 9 Routerによるレイテンシの影響 ? NN と 4NN+12R を比較してみると、 ? レイテンシは4倍程度に増加 (read metadataリクエストなので、最悪ケース) ? 単位時間あたりに処理できるリクエスト数は4倍弱に
  • 10. ? 2018 NTT DATA Corporation 10 開発状況 ? アクティブに開発が続いている ? Phase 1 (HDFS-10467, 2016/5~2017/10, 22/22 subtasks) ? Phase 2 (HDFS-12165, 2017/10~, 66/86 subtasks) ? New features ? WebHDFS ? Federated quotas ? On-going work ? Mount points across subclusters (HDFS-13224) ? Rebalancer (HDFS-13123)
  • 11. ? 2018 NTT DATA Corporation 11 Mount points across subclusters ? マウントポイントとsubclusterは1対1対応 ? 1対N対応させることで、容量やNameNodeへのリクエストの偏りが解消できる ? どうやって割り当てるか ? Consistent hashing ? HASH (ディレクトリ1階層目のハッシュ), HASH_ALL (フルパスのハッシュ) ? LOCAL ? RANDOM ? 制約 ? ファイルを探すために複数のクラスタを辿る必要がある (consistent hashing以外) ? renameがクラスタ跨ぎになる可能性があり、非効率 ? trunkにマージ済
  • 12. ? 2018 NTT DATA Corporation 12 On-going work: Rebalancer ? 現状では、偏りが発生した場合にはリバランスさせる必要がある ? リバランスは現状手動でやるしかない上に、煩雑 ? リバランス対象のディレクトリをread-only化する ? データコピー ? Mount tableの修正 ? Read-onlyの解除 ? 旧データの削除 ? 偏りを自動で特定し、自動でリバランスしてくれると、運用が非常に楽になる 開発状況 ? JIRAにはdesign documentが置いてあるだけの状態 ? Rebalancer を実装して、その評価をした論文がある ? Scaling Distributed File Systems in Resource-Harvesting Datacenters [ATC ‘17]
  • 13. ? 2018 NTT DATA Corporation 13 Future plan ? Uber ? Observer NameNode (HDFS-12943) ? RBF ? Upgrade to 3.x and use Erasure-Coding ? Auto rebalancing between hot and warm clusters ? Microsoft ? Federating federation!!!
  • 14. ? 2018 NTT DATA Corporation 14 HDFS BoF ? 開発者が集まって、各自話したいことを話す ? アジェンダはその場で決まる
  • 15. ? 2018 NTT DATA Corporation 15 HDFS BoF ? その場で書かれたアジェンダ ? 開発者が多いシリコンバレー開催だからこその集まり具合 (HDFSで20人くらいいて、大半はコミッタ) ? 他のカンファレンスにはない、Dataworks Summitの醍醐味だと思う ? 来年は東海岸開催なので、集まりが悪くならないか不安
  • 16. ? 2018 NTT DATA Corporation