狠狠撸

狠狠撸Share a Scribd company logo
Hadoop Summit 2012

 Sho Shimauchi, Cloudera
       @shiumachi
お前誰よ?
? Sho Shimauchi ( @shiumachi )
? Cloudera 株式会社カスタマーオペレーショ
  ンズエンジニア
? 問い合わせ担当
Hadoop Summit
? サンノゼで開催された、世界最大の
  Hadoop イベントの一つ
? 今年は2,200 人参加
何聞いてきたの?
? プラットフォーム周り中心(YARN, HDFS HA,
  HBase …)
? 今日はこれらのスライドを元に、
  Hadoop/HBase の現状と今後について紹介
  します
APACHE HADOOP MAPREDUCE:
WHAT'S NEXT?
Apache Hadoop MapReduce: What's Next?

? スピーカー: Arun Murthy (Hortonworks)
? MapReduce1 から MapReduce2(YARN)、そ
  して今後の開発予定について語ったセッ
  ション
Hadoop 1.x MapReduce
? ご存知 MapReduce
? 非常に安定、 Enterprise Ready
? 以下の点で課題
  – map/reduce間でのタスクスロットの共有
  – 非MapReduce アルゴリズムのサポート
  – スケーラビリティ(Max 4,000ノード、 40,000
    タスク同時実行)
YARN
? Yet Another Resource Negociator
? ターゲット
  – 6,000 - 10,000 ノード
  – 100,000 以上のタスクの同時実行
  – 10,000 ジョブの同時実行
? hadoop-2.0.0-alpha で使用可能
? 性能は倍以上
今後の予定
? メモリ以外のリソースアロケーション
  MAPREDUCE-4327
? プリエンプション MAPREDUCE-3938
? cgroup などを使った Container アイソレー
  ション MAPREDUCE-4334
? HBase の YARN 対応 HBASE-4329, HBASE-4047
? プラガブルソート MAPREDUCE-4039,
  MAPREDUCE-2454
? プラガブルシャッフル MAPREDUCE-4049
まとめ
? YARNは「汎用」分散処理基盤に向けて一
  歩踏み出したもの
? 今までの Hadoop からさらに先に進んでい
  る
? これからの進化に要注目!
IMPROVING HBASE AVAILABILITY
AND REPAIR
Improving HBase Availability and Repair

? スピーカー Jonathan Hsieh, Jeff
  Bean(Cloudera)
? HBase の可用性にフォーカスしてしゃべっ
  たセッション
? コプロセッサ(0.92で採用)の話はないです
HBase
? フォールトトレラント
 – コンポーネントに障害が発生しても、データ
   の損失なく復旧できること
? 高可用性
 – コンポーネントに障害が発生しても、データ
   の損失なく高速に復旧できること


ゴール: ダウンタイムを短くする!
HBase のダウンタイム



         計画停止




  障害停止
HBase 障害の内訳

メタデータ障
   害
  28%           設定ミス
                 44%




HW/NW障害
   16%
             要パッチ
              12%
Conservative First!
? 不安定な機能は使わないでください
? 非推奨の構成?設定?運用はしないでく
  ださい
? HBase を使って冒険してもいいですが
  HBase で冒険しないでください
HBase 0.92 + Hadoop 2.0
? HDFS HA による高可用性の確保
? 分散ログスプリッティングによるリカバ
  リーの高速化
 – 100ノードの場合、9時間が5.4分(100倍)
 – ダウンタイムの削減=可用性の向上
HBase 0.96 + Hadoop 2.x (計画)
? 計画停止時間の削減
? オンラインスキーマ変更 HBASE-1730
? ローリングアップデート
 – バージョン間互換性が必須
   ? HBase のバージョン間互換性 HBASE-5305
   ? HDFS のバージョン間互換性 HADOOP-7307
まとめ
? HBase は一貫性と可用性の両立を目指して
  進化中
? 一方で運用はまだまだ課題が多い
? 対策
 – Conservative First! 用法をよく守って正しく使
   いましょう
 – HBase 本読みましょう(もうすぐ日本語版出る)
 – お金あるならサポート買ってね!
HDFS NAMENODE HIGH
AVAILABILITY
信頼性、保守性、可用性
? reliability 信頼性 = MTBF/(1 + MTBF)
  – MTBF: 平均故障間隔
  – 1ヶ月に1回壊れるより1年に1回の方が信頼性が高
    い
? maintainability 保守性 = 1 / (1 + MTTR)
  – MTTR: 平均復旧時間
  – 素早く復旧する方が保守性が高い
? availability 可用性 = MTTF / MTBF
  – MTTF: 平均故障時間
  – MTBF = MTTF + MTTR
  – 信頼性と保守性が高いと可用性も高い
信頼性
? データの信頼性
 – 10クラスタ、20,000ノード上の3.29億ブロッ
   クのうち19ブロックがロスト(2009年)
  ? ※同一ファイルのブロックが全てロストする確率
    はほぼ0
 – 1700万ブロック中1ブロック(約4PB)
 – 原因となったバグは既に修正済み


      信頼性は十分高い
可用性
? 18ヶ月で、25クラスタの間で22回の障害
 – 1クラスタあたり年間0.58回の障害
 – HAが役に立っただろうと考えられるのはうち
   8回の障害(0.23回分)
? 計画停止
 – 設定変更のたびに再起動
 – アップデート時も当然再起動
保守性
? NN起動時間: 通常1-2分、大クラスタだと
  15分
 – 計画停止するたびにこれだけの時間停止する
   →MTTR増える(保守性下がる)
 – 日本で主流のHeartbeat + DRBD も、この部分
   は回避できてない
? DNの保守性
 – 大クラスタ: 1日1DNに障害発生、ディスクは
   もっと高頻度
 – 3ヶ月に1回の割合で一斉に補修?入れ替え
HDFS HAのデザイン
? NN外からのサービス監視とリーダー選出
 – ZKFC と Zookeeper
 – マニュアルフェイルオーバならZK不要
? ActとStandby両方にブロックレポート送信
 – 再起動時のブロックレポート収集が必要ない
? クライアントサイドもフェイルオーバに
  対応
? edits のみ共有ストレージに置く必要があ
  る
 – 将来的に ZooKeeper (BookKeeper)で管理する予
   定(HDFS-3077)
まとめ
? HDFS HA はかなり可用性を上げる
? 障害対策はもちろん、HDFSのアップグ
  レードや設定変更時の再起動にも有効

More Related Content

What's hot (20)

PDF
笔贬笔で大规模ブラウザゲームを开発してわかったこと
Kentaro Matsui
?
PDF
Osc2011 Do
Kazuhisa Hara
?
PDF
ファイルサーバーをクラウド化したい
mokudai masayuki
?
PPTX
Cloudera大阪セミナー 20130219
Cloudera Japan
?
PPTX
AWSとmod_pagespeedで 楽々サクサク高速化!!
aasakawa
?
PDF
HDFS HA セミナー #hadoop
Cloudera Japan
?
PDF
WordPress アジュール部 ハンズオン
Masaki Takeda
?
PDF
File Server on Azure IaaS
junichi anno
?
PPTX
100億超メッセージ/日のサービスを 支えるHBase運用におけるチャレンジ
LINE Corporation
?
PDF
20130413 JAWS-UG北陸 美人CDP
真吾 吉田
?
PDF
今日から使える颁辞耻肠丑产补蝉别システムアーキテクチャデザインパターン集
Couchbase Japan KK
?
PPTX
础辫补肠丑别チューニング
ii012014
?
PDF
Couchbase server入門
Yusuke Komatsu
?
PPTX
Cloudera Impala Seminar Jan. 8 2013
Cloudera Japan
?
PDF
Web体験を向上させる無料CDN 「rapid start」× stripe決済
Katsuhisa Ogawa
?
PDF
2012/6/10 Webのパフォーマンスを考える @ 【第三回】初心者向けホームページ勉強会
tama200x Kobayashi
?
PPTX
クラウドで運用するCouchbase Server
Kazumi Hirose
?
PDF
佐野裕章 Virident 社製半導体ストレージ flash max の検証
Hiroaki Sano
?
PDF
20130330 JAWS-UG広島 美人CDP
真吾 吉田
?
PDF
スマートフォン×颁补蝉蝉补苍诲谤补によるハイパフォーマンス基盘の构筑事例
terurou
?
笔贬笔で大规模ブラウザゲームを开発してわかったこと
Kentaro Matsui
?
Osc2011 Do
Kazuhisa Hara
?
ファイルサーバーをクラウド化したい
mokudai masayuki
?
Cloudera大阪セミナー 20130219
Cloudera Japan
?
AWSとmod_pagespeedで 楽々サクサク高速化!!
aasakawa
?
HDFS HA セミナー #hadoop
Cloudera Japan
?
WordPress アジュール部 ハンズオン
Masaki Takeda
?
File Server on Azure IaaS
junichi anno
?
100億超メッセージ/日のサービスを 支えるHBase運用におけるチャレンジ
LINE Corporation
?
20130413 JAWS-UG北陸 美人CDP
真吾 吉田
?
今日から使える颁辞耻肠丑产补蝉别システムアーキテクチャデザインパターン集
Couchbase Japan KK
?
础辫补肠丑别チューニング
ii012014
?
Couchbase server入門
Yusuke Komatsu
?
Cloudera Impala Seminar Jan. 8 2013
Cloudera Japan
?
Web体験を向上させる無料CDN 「rapid start」× stripe決済
Katsuhisa Ogawa
?
2012/6/10 Webのパフォーマンスを考える @ 【第三回】初心者向けホームページ勉強会
tama200x Kobayashi
?
クラウドで運用するCouchbase Server
Kazumi Hirose
?
佐野裕章 Virident 社製半導体ストレージ flash max の検証
Hiroaki Sano
?
20130330 JAWS-UG広島 美人CDP
真吾 吉田
?
スマートフォン×颁补蝉蝉补苍诲谤补によるハイパフォーマンス基盘の构筑事例
terurou
?

Viewers also liked (18)

PDF
Code complete ch22_developper_test
Sho Shimauchi
?
PDF
Clarity Profile
Rajesh Pandey
?
ODP
Decotai Shiumachi 091206
Sho Shimauchi
?
PDF
Data-Intensive Text Processing with MapReduce ch4
Sho Shimauchi
?
PDF
Data-Intensive Text Processing with MapReduce ch6.1
Sho Shimauchi
?
ODP
Programming Collective Intelligence 100111
Sho Shimauchi
?
ODP
Decotai Shiumachi 091228
Sho Shimauchi
?
PPTX
Incredere
MinuneMica Project
?
PDF
Cloudera Impala #pyfes 2012.11.24
Sho Shimauchi
?
ODP
Programming Collective Intelligence 100131
Sho Shimauchi
?
PPTX
My Immortal
MinuneMica Project
?
PPTX
Calendar 2010
MinuneMica Project
?
PDF
使い捨て python コードの書き方
Sho Shimauchi
?
PDF
Fabric + Amazon EC2で快適サポート生活 #PyFes
Sho Shimauchi
?
ODP
Hadoop for programmer
Sho Shimauchi
?
PPTX
Mantra Tara Verde
MinuneMica Project
?
PPT
Christmas Spirit in Romania
MinuneMica Project
?
PPTX
浅野高等学校 2015年度 卒业生讲演
Sho Shimauchi
?
Code complete ch22_developper_test
Sho Shimauchi
?
Clarity Profile
Rajesh Pandey
?
Decotai Shiumachi 091206
Sho Shimauchi
?
Data-Intensive Text Processing with MapReduce ch4
Sho Shimauchi
?
Data-Intensive Text Processing with MapReduce ch6.1
Sho Shimauchi
?
Programming Collective Intelligence 100111
Sho Shimauchi
?
Decotai Shiumachi 091228
Sho Shimauchi
?
Cloudera Impala #pyfes 2012.11.24
Sho Shimauchi
?
Programming Collective Intelligence 100131
Sho Shimauchi
?
My Immortal
MinuneMica Project
?
Calendar 2010
MinuneMica Project
?
使い捨て python コードの書き方
Sho Shimauchi
?
Fabric + Amazon EC2で快適サポート生活 #PyFes
Sho Shimauchi
?
Hadoop for programmer
Sho Shimauchi
?
Mantra Tara Verde
MinuneMica Project
?
Christmas Spirit in Romania
MinuneMica Project
?
浅野高等学校 2015年度 卒业生讲演
Sho Shimauchi
?
Ad

Similar to Hadoop summit 2012 report (20)

PDF
Osc2012 spring HBase Report
Seiichiro Ishida
?
PDF
分散処理基盤Apache Hadoopの現状と、NTTデータのHadoopに対する取り組み
NTT DATA OSS Professional Services
?
PDF
NTTデータ流 Hadoop活用のすすめ ~インフラ構築?運用の勘所~
NTT DATA OSS Professional Services
?
PDF
第25回 Hadoopソースコードリーディング 「HBase 最新情報」
Toshihiro Suzuki
?
PDF
HBase Meetup Tokyo Summer 2015 #hbasejp
Cloudera Japan
?
PDF
Hadoop Trends & Hadoop on EC2
Yifeng Jiang
?
PPTX
贬补诲辞辞辫トレーニング番外编 ?间违えられやすい贬补诲辞辞辫の7つの仕様?
Cloudera Japan
?
PDF
Yifeng hadoop-present-public
Yifeng Jiang
?
PDF
HBase Across the World #LINE_DM
Cloudera Japan
?
PDF
Apache Hadoopの現在と未来
驰补丑辞辞!デベロッパーネットワーク
?
PDF
HDFS新機能総まとめin 2015 (日本Hadoopユーザー会 ライトニングトーク@Cloudera World Tokyo 2015 講演資料)
NTT DATA OSS Professional Services
?
PDF
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料)
hamaken
?
PDF
Hadoop ecosystem NTTDATA osc15tk
NTT DATA OSS Professional Services
?
PDF
分散処理基盤Apache Hadoop入門とHadoopエコシステムの最新技術動向 (オープンソースカンファレンス 2015 Tokyo/Spring 講...
NTT DATA OSS Professional Services
?
PDF
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
NTT DATA OSS Professional Services
?
PDF
Apache Hadoop HDFSの最新機能の紹介(2018)#dbts2018
驰补丑辞辞!デベロッパーネットワーク
?
PDF
Strata + Hadoop World 2014 レポート #cwt2014
Cloudera Japan
?
PPT
Hadoop ~Yahoo! JAPANの活用について~
驰补丑辞辞!デベロッパーネットワーク
?
PDF
OSC2012 OSC.DB Hadoop
Shinichi YAMASHITA
?
PPT
Hadoop~Yahoo! JAPANの活用について~
驰补丑辞辞!デベロッパーネットワーク
?
Osc2012 spring HBase Report
Seiichiro Ishida
?
分散処理基盤Apache Hadoopの現状と、NTTデータのHadoopに対する取り組み
NTT DATA OSS Professional Services
?
NTTデータ流 Hadoop活用のすすめ ~インフラ構築?運用の勘所~
NTT DATA OSS Professional Services
?
第25回 Hadoopソースコードリーディング 「HBase 最新情報」
Toshihiro Suzuki
?
HBase Meetup Tokyo Summer 2015 #hbasejp
Cloudera Japan
?
Hadoop Trends & Hadoop on EC2
Yifeng Jiang
?
贬补诲辞辞辫トレーニング番外编 ?间违えられやすい贬补诲辞辞辫の7つの仕様?
Cloudera Japan
?
Yifeng hadoop-present-public
Yifeng Jiang
?
HBase Across the World #LINE_DM
Cloudera Japan
?
HDFS新機能総まとめin 2015 (日本Hadoopユーザー会 ライトニングトーク@Cloudera World Tokyo 2015 講演資料)
NTT DATA OSS Professional Services
?
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料)
hamaken
?
Hadoop ecosystem NTTDATA osc15tk
NTT DATA OSS Professional Services
?
分散処理基盤Apache Hadoop入門とHadoopエコシステムの最新技術動向 (オープンソースカンファレンス 2015 Tokyo/Spring 講...
NTT DATA OSS Professional Services
?
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
NTT DATA OSS Professional Services
?
Apache Hadoop HDFSの最新機能の紹介(2018)#dbts2018
驰补丑辞辞!デベロッパーネットワーク
?
Strata + Hadoop World 2014 レポート #cwt2014
Cloudera Japan
?
Hadoop ~Yahoo! JAPANの活用について~
驰补丑辞辞!デベロッパーネットワーク
?
OSC2012 OSC.DB Hadoop
Shinichi YAMASHITA
?
Hadoop~Yahoo! JAPANの活用について~
驰补丑辞辞!デベロッパーネットワーク
?
Ad

Hadoop summit 2012 report

  • 1. Hadoop Summit 2012 Sho Shimauchi, Cloudera @shiumachi
  • 2. お前誰よ? ? Sho Shimauchi ( @shiumachi ) ? Cloudera 株式会社カスタマーオペレーショ ンズエンジニア ? 問い合わせ担当
  • 3. Hadoop Summit ? サンノゼで開催された、世界最大の Hadoop イベントの一つ ? 今年は2,200 人参加
  • 4. 何聞いてきたの? ? プラットフォーム周り中心(YARN, HDFS HA, HBase …) ? 今日はこれらのスライドを元に、 Hadoop/HBase の現状と今後について紹介 します
  • 6. Apache Hadoop MapReduce: What's Next? ? スピーカー: Arun Murthy (Hortonworks) ? MapReduce1 から MapReduce2(YARN)、そ して今後の開発予定について語ったセッ ション
  • 7. Hadoop 1.x MapReduce ? ご存知 MapReduce ? 非常に安定、 Enterprise Ready ? 以下の点で課題 – map/reduce間でのタスクスロットの共有 – 非MapReduce アルゴリズムのサポート – スケーラビリティ(Max 4,000ノード、 40,000 タスク同時実行)
  • 8. YARN ? Yet Another Resource Negociator ? ターゲット – 6,000 - 10,000 ノード – 100,000 以上のタスクの同時実行 – 10,000 ジョブの同時実行 ? hadoop-2.0.0-alpha で使用可能 ? 性能は倍以上
  • 9. 今後の予定 ? メモリ以外のリソースアロケーション MAPREDUCE-4327 ? プリエンプション MAPREDUCE-3938 ? cgroup などを使った Container アイソレー ション MAPREDUCE-4334 ? HBase の YARN 対応 HBASE-4329, HBASE-4047 ? プラガブルソート MAPREDUCE-4039, MAPREDUCE-2454 ? プラガブルシャッフル MAPREDUCE-4049
  • 10. まとめ ? YARNは「汎用」分散処理基盤に向けて一 歩踏み出したもの ? 今までの Hadoop からさらに先に進んでい る ? これからの進化に要注目!
  • 12. Improving HBase Availability and Repair ? スピーカー Jonathan Hsieh, Jeff Bean(Cloudera) ? HBase の可用性にフォーカスしてしゃべっ たセッション ? コプロセッサ(0.92で採用)の話はないです
  • 13. HBase ? フォールトトレラント – コンポーネントに障害が発生しても、データ の損失なく復旧できること ? 高可用性 – コンポーネントに障害が発生しても、データ の損失なく高速に復旧できること ゴール: ダウンタイムを短くする!
  • 14. HBase のダウンタイム 計画停止 障害停止
  • 15. HBase 障害の内訳 メタデータ障 害 28% 設定ミス 44% HW/NW障害 16% 要パッチ 12%
  • 16. Conservative First! ? 不安定な機能は使わないでください ? 非推奨の構成?設定?運用はしないでく ださい ? HBase を使って冒険してもいいですが HBase で冒険しないでください
  • 17. HBase 0.92 + Hadoop 2.0 ? HDFS HA による高可用性の確保 ? 分散ログスプリッティングによるリカバ リーの高速化 – 100ノードの場合、9時間が5.4分(100倍) – ダウンタイムの削減=可用性の向上
  • 18. HBase 0.96 + Hadoop 2.x (計画) ? 計画停止時間の削減 ? オンラインスキーマ変更 HBASE-1730 ? ローリングアップデート – バージョン間互換性が必須 ? HBase のバージョン間互換性 HBASE-5305 ? HDFS のバージョン間互換性 HADOOP-7307
  • 19. まとめ ? HBase は一貫性と可用性の両立を目指して 進化中 ? 一方で運用はまだまだ課題が多い ? 対策 – Conservative First! 用法をよく守って正しく使 いましょう – HBase 本読みましょう(もうすぐ日本語版出る) – お金あるならサポート買ってね!
  • 21. 信頼性、保守性、可用性 ? reliability 信頼性 = MTBF/(1 + MTBF) – MTBF: 平均故障間隔 – 1ヶ月に1回壊れるより1年に1回の方が信頼性が高 い ? maintainability 保守性 = 1 / (1 + MTTR) – MTTR: 平均復旧時間 – 素早く復旧する方が保守性が高い ? availability 可用性 = MTTF / MTBF – MTTF: 平均故障時間 – MTBF = MTTF + MTTR – 信頼性と保守性が高いと可用性も高い
  • 22. 信頼性 ? データの信頼性 – 10クラスタ、20,000ノード上の3.29億ブロッ クのうち19ブロックがロスト(2009年) ? ※同一ファイルのブロックが全てロストする確率 はほぼ0 – 1700万ブロック中1ブロック(約4PB) – 原因となったバグは既に修正済み 信頼性は十分高い
  • 23. 可用性 ? 18ヶ月で、25クラスタの間で22回の障害 – 1クラスタあたり年間0.58回の障害 – HAが役に立っただろうと考えられるのはうち 8回の障害(0.23回分) ? 計画停止 – 設定変更のたびに再起動 – アップデート時も当然再起動
  • 24. 保守性 ? NN起動時間: 通常1-2分、大クラスタだと 15分 – 計画停止するたびにこれだけの時間停止する →MTTR増える(保守性下がる) – 日本で主流のHeartbeat + DRBD も、この部分 は回避できてない ? DNの保守性 – 大クラスタ: 1日1DNに障害発生、ディスクは もっと高頻度 – 3ヶ月に1回の割合で一斉に補修?入れ替え
  • 25. HDFS HAのデザイン ? NN外からのサービス監視とリーダー選出 – ZKFC と Zookeeper – マニュアルフェイルオーバならZK不要 ? ActとStandby両方にブロックレポート送信 – 再起動時のブロックレポート収集が必要ない ? クライアントサイドもフェイルオーバに 対応 ? edits のみ共有ストレージに置く必要があ る – 将来的に ZooKeeper (BookKeeper)で管理する予 定(HDFS-3077)
  • 26. まとめ ? HDFS HA はかなり可用性を上げる ? 障害対策はもちろん、HDFSのアップグ レードや設定変更時の再起動にも有効