狠狠撸

狠狠撸Share a Scribd company logo
HDFS 原理与实现 刘景龙 [email_address]
?
为什么选择 Hadoop ? Need to process huge datasets on large clusters of computers Very expensive to build reliability into each application. Nodes fail every day f ailure is expected, rather than exceptional. The number of nodes in a cluster is not constant. Need common infrastructure Efficient, reliable, easy to use Open Source, Apache License
Hadoop history:
谁在用 Hadoop ?
百度 hadoop 集群现状 Hadoop 集群规模 1w+ 台节点 日平均处理数据为 8PB 左右 最大的 hadoop 集群规模: 2800 台
百度如何使用 hadoop 半线上 / 线下日志挖掘 网页相关的线下大规模挖掘计算,包括 linkbase 的数据运算,索引库构建,网页库上的各种挖掘计算 大规模机器学习算法
HDFS 能做什么? 存储并管理 PB 级数据 自动处理节点失效和负载均衡 针对高吞吐进行优化 数据本地化 机架感知
HDFS 不适合做什么? 存储小文件  ( 不建议使用 ) 大量的随机读  ( 不建议使用 ) 需要对文件的修改  ( 不支持 )
HDFS  架构: Namenode Namespace Metadata & Journal Namespace Block Map Datanodes Block ID  ?  Data Horizontally Scale IO and Storage file  ?  Block id b1 b2 b3 b1 b5 b3 b3 b5 b2 b4 b5 b6 b2 b3 b4 Heartbeats & Block Reports Block ID  ?  Block Locations
HDFS  : namenode 数据结构
HDFS  : 读写流程 Client Client Namenode 1 open 2 read 2 write 1 create write write Datanodes Namespace State Block Map End-to-end checksum b1 b2 b3 b1 b5 b3 b3 b5 b2 b4 b5 b6 b2 b3 b4
HDFS :副本分布 当前策略: 客户端从最近的副本进行读取
HDFS  :容错 Namenode Datanodes Bad/lost block replica Periodically check block checksums Namespace State Block Map b1 b2 b3 b1 b5 b3 b3 b5 b2 b4 b5 b6 b2 b3 b4 2. copy 3. blockReceived 1. replicate
HDFS :数据本地化 Data Data data data data data Data data data data data Data data data data data Data data data data data Data data data data data Data data data data data Data data data data data Data data data data data Data data data data data Data data data data data Data data data data data Data data data data data Results Data data data data Data data data data Data data data data Data data data data Data data data data Data data data data Data data data data Data data data data Data data data data Hadoop Cluster Block 1 Block 1 Block 2 Block 2 Block 2 Block 1 MAP MAP MAP Reduce Block 3 Block 3 Block 3
HDFS :接口 命令行 C++ 接口 Java 接口 POSIX 接口 Restful  接口
HDFS  在路上 HDFS Peta1.0 Peta2.0
可扩展性 Namenode 水平扩展 通过加机器解决文件数增加的问题 垂直扩展 内存存储热数据,冷数据磁盘存储
可扩展性: 水平扩展
可扩展性: 对象存储
可扩展性:数据结构
可扩展性: 文件数 10 亿 节点数 1 万 性能提高 10 倍
可用性:元数据结构 持久化元数据 操作日志( edit log ) 记录文件创建,删除,修改文件属性等操作 Fsimage 包含完整的命名空间 File -> Block 的映射关系 文件的属性( ACL, quota,  修改时间等)  非持久化元数据 block map  Block -> datanodes
可用性
可用性: Fail over 时间最长不超过 5 分钟 集群的在线升级
未来的工作方向 用户透明压缩存储 资源隔离 实时性支持 百亿文件系统   。。。
求助热线: 邮件组: [email_address] Hi  群: 1199411 文档园地: http://wiki.babel./twiki/bin/view/Com/Inf/Peta%E6%96%87%E6%A1%A3%E5%BB%BA%E8%AE%BE%E8%AE%A1%E5%88%92
Q & A Thanks

More Related Content

What's hot (20)

Life of Big Data Technologies
Life of Big Data TechnologiesLife of Big Data Technologies
Life of Big Data Technologies
Jazz Yao-Tsung Wang
?
Hadoop 0.20 程式設計
Hadoop 0.20 程式設計Hadoop 0.20 程式設計
Hadoop 0.20 程式設計
Wei-Yu Chen
?
Bigdata 大資料分析實務 (進階上機課程)
Bigdata 大資料分析實務 (進階上機課程)Bigdata 大資料分析實務 (進階上機課程)
Bigdata 大資料分析實務 (進階上機課程)
家雋 莊
?
What could hadoop do for us
What could hadoop do for us What could hadoop do for us
What could hadoop do for us
Simon Hsu
?
贬补诲辞辞辫大数据实践经验
贬补诲辞辞辫大数据实践经验贬补诲辞辞辫大数据实践经验
贬补诲辞辞辫大数据实践经验
Hanborq Inc.
?
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
Jazz Yao-Tsung Wang
?
Hadoop 與 SQL 的甜蜜連結
Hadoop 與 SQL 的甜蜜連結Hadoop 與 SQL 的甜蜜連結
Hadoop 與 SQL 的甜蜜連結
James Chen
?
2006-11-16 RFID and OSS for Agriculture
2006-11-16 RFID and OSS for Agriculture2006-11-16 RFID and OSS for Agriculture
2006-11-16 RFID and OSS for Agriculture
Jazz Yao-Tsung Wang
?
大资料分析技术的滥觴
大资料分析技术的滥觴大资料分析技术的滥觴
大资料分析技术的滥觴
家雋 莊
?
Dfs ning
Dfs ningDfs ning
Dfs ning
Andy Shi
?
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
Jazz Yao-Tsung Wang
?
Memcached vs redis
Memcached vs redisMemcached vs redis
Memcached vs redis
qianshi
?
When R meet Hadoop
When R meet HadoopWhen R meet Hadoop
When R meet Hadoop
Jazz Yao-Tsung Wang
?
贬诲蹿蝉原理及实现
贬诲蹿蝉原理及实现贬诲蹿蝉原理及实现
贬诲蹿蝉原理及实现
baggioss
?
Hadoop Map Reduce 程式設計
Hadoop Map Reduce 程式設計Hadoop Map Reduce 程式設計
Hadoop Map Reduce 程式設計
Wei-Yu Chen
?
redis 适用场景与实现
redis 适用场景与实现redis 适用场景与实现
redis 适用场景与实现
iammutex
?
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
NTC.im(Notch Training Center)
?
分布式存储的元数据设计
分布式存储的元数据设计分布式存储的元数据设计
分布式存储的元数据设计
LI Daobing
?
Hadoop 0.20 程式設計
Hadoop 0.20 程式設計Hadoop 0.20 程式設計
Hadoop 0.20 程式設計
Wei-Yu Chen
?
Bigdata 大資料分析實務 (進階上機課程)
Bigdata 大資料分析實務 (進階上機課程)Bigdata 大資料分析實務 (進階上機課程)
Bigdata 大資料分析實務 (進階上機課程)
家雋 莊
?
What could hadoop do for us
What could hadoop do for us What could hadoop do for us
What could hadoop do for us
Simon Hsu
?
贬补诲辞辞辫大数据实践经验
贬补诲辞辞辫大数据实践经验贬补诲辞辞辫大数据实践经验
贬补诲辞辞辫大数据实践经验
Hanborq Inc.
?
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
Jazz Yao-Tsung Wang
?
Hadoop 與 SQL 的甜蜜連結
Hadoop 與 SQL 的甜蜜連結Hadoop 與 SQL 的甜蜜連結
Hadoop 與 SQL 的甜蜜連結
James Chen
?
2006-11-16 RFID and OSS for Agriculture
2006-11-16 RFID and OSS for Agriculture2006-11-16 RFID and OSS for Agriculture
2006-11-16 RFID and OSS for Agriculture
Jazz Yao-Tsung Wang
?
大资料分析技术的滥觴
大资料分析技术的滥觴大资料分析技术的滥觴
大资料分析技术的滥觴
家雋 莊
?
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
Jazz Yao-Tsung Wang
?
Memcached vs redis
Memcached vs redisMemcached vs redis
Memcached vs redis
qianshi
?
贬诲蹿蝉原理及实现
贬诲蹿蝉原理及实现贬诲蹿蝉原理及实现
贬诲蹿蝉原理及实现
baggioss
?
Hadoop Map Reduce 程式設計
Hadoop Map Reduce 程式設計Hadoop Map Reduce 程式設計
Hadoop Map Reduce 程式設計
Wei-Yu Chen
?
redis 适用场景与实现
redis 适用场景与实现redis 适用场景与实现
redis 适用场景与实现
iammutex
?
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
NTC.im(Notch Training Center)
?
分布式存储的元数据设计
分布式存储的元数据设计分布式存储的元数据设计
分布式存储的元数据设计
LI Daobing
?

Viewers also liked (20)

CETS 2011, Sarah Remijan, slides for Webinars Made Easy
CETS 2011, Sarah Remijan, slides for Webinars Made EasyCETS 2011, Sarah Remijan, slides for Webinars Made Easy
CETS 2011, Sarah Remijan, slides for Webinars Made Easy
Chicago eLearning & Technology Showcase
?
CETS 2013, Tracy Adams, slides for Make It Once, Use it Twice
CETS 2013, Tracy Adams, slides for Make It Once, Use it TwiceCETS 2013, Tracy Adams, slides for Make It Once, Use it Twice
CETS 2013, Tracy Adams, slides for Make It Once, Use it Twice
Chicago eLearning & Technology Showcase
?
Organigrama original 84813Organigrama original 84813
Organigrama original 84813
colombiaexclusiva
?
Turing machine2
Turing machine2Turing machine2
Turing machine2
bewhands
?
CETS 2011, Traci Weiss, Creating Scenario-Based Learning Using Rapid eLearnin...
CETS 2011, Traci Weiss, Creating Scenario-Based Learning Using Rapid eLearnin...CETS 2011, Traci Weiss, Creating Scenario-Based Learning Using Rapid eLearnin...
CETS 2011, Traci Weiss, Creating Scenario-Based Learning Using Rapid eLearnin...
Chicago eLearning & Technology Showcase
?
Lexus Venture Banjarmasin
Lexus Venture BanjarmasinLexus Venture Banjarmasin
Lexus Venture Banjarmasin
Timbul Naibaho
?
TiE Asia Pacific Conference 2010
TiE Asia Pacific Conference 2010TiE Asia Pacific Conference 2010
TiE Asia Pacific Conference 2010
Technopreneurs Association of Malaysia
?
emmettryan2010
emmettryan2010emmettryan2010
emmettryan2010
Emmett Ryan
?
15825270 mutasi-dna-powerhouse-rhenald-kasali-ph-d
15825270 mutasi-dna-powerhouse-rhenald-kasali-ph-d15825270 mutasi-dna-powerhouse-rhenald-kasali-ph-d
15825270 mutasi-dna-powerhouse-rhenald-kasali-ph-d
ibnuwahyuddinramdani
?
X|Media|Lab KL: Animation and Games CALL FOR NOMINATIONS
X|Media|Lab KL: Animation and Games CALL FOR NOMINATIONSX|Media|Lab KL: Animation and Games CALL FOR NOMINATIONS
X|Media|Lab KL: Animation and Games CALL FOR NOMINATIONS
Technopreneurs Association of Malaysia
?
Tick App
Tick AppTick App
Tick App
AgriLife News-Texas AgriLife Extension Service/Texas AgriLife Research
?
Picasso[1]
Picasso[1]Picasso[1]
Picasso[1]
mbushong
?
CETS 2011, Marge Feely, slides for The Devil Is in the Details: Technical Con...
CETS 2011, Marge Feely, slides for The Devil Is in the Details: Technical Con...CETS 2011, Marge Feely, slides for The Devil Is in the Details: Technical Con...
CETS 2011, Marge Feely, slides for The Devil Is in the Details: Technical Con...
Chicago eLearning & Technology Showcase
?
Herramientas publicitarias de googleHerramientas publicitarias de google
Herramientas publicitarias de google
Hernán Rodríguez Amaya
?
CETS 2011, Brian Richardson, slides for Best Practices for LMS Selection and ...
CETS 2011, Brian Richardson, slides for Best Practices for LMS Selection and ...CETS 2011, Brian Richardson, slides for Best Practices for LMS Selection and ...
CETS 2011, Brian Richardson, slides for Best Practices for LMS Selection and ...
Chicago eLearning & Technology Showcase
?
From Food Chains to Food Web
From Food Chains to Food WebFrom Food Chains to Food Web
From Food Chains to Food Web
LM9
?
CETS 2011, Mike Kemmler, slides for SCORM 101
CETS 2011, Mike Kemmler, slides for SCORM 101CETS 2011, Mike Kemmler, slides for SCORM 101
CETS 2011, Mike Kemmler, slides for SCORM 101
Chicago eLearning & Technology Showcase
?
Organigrama original 84813Organigrama original 84813
Organigrama original 84813
colombiaexclusiva
?
Turing machine2
Turing machine2Turing machine2
Turing machine2
bewhands
?
CETS 2011, Traci Weiss, Creating Scenario-Based Learning Using Rapid eLearnin...
CETS 2011, Traci Weiss, Creating Scenario-Based Learning Using Rapid eLearnin...CETS 2011, Traci Weiss, Creating Scenario-Based Learning Using Rapid eLearnin...
CETS 2011, Traci Weiss, Creating Scenario-Based Learning Using Rapid eLearnin...
Chicago eLearning & Technology Showcase
?
Lexus Venture Banjarmasin
Lexus Venture BanjarmasinLexus Venture Banjarmasin
Lexus Venture Banjarmasin
Timbul Naibaho
?
15825270 mutasi-dna-powerhouse-rhenald-kasali-ph-d
15825270 mutasi-dna-powerhouse-rhenald-kasali-ph-d15825270 mutasi-dna-powerhouse-rhenald-kasali-ph-d
15825270 mutasi-dna-powerhouse-rhenald-kasali-ph-d
ibnuwahyuddinramdani
?
CETS 2011, Marge Feely, slides for The Devil Is in the Details: Technical Con...
CETS 2011, Marge Feely, slides for The Devil Is in the Details: Technical Con...CETS 2011, Marge Feely, slides for The Devil Is in the Details: Technical Con...
CETS 2011, Marge Feely, slides for The Devil Is in the Details: Technical Con...
Chicago eLearning & Technology Showcase
?
Herramientas publicitarias de googleHerramientas publicitarias de google
Herramientas publicitarias de google
Hernán Rodríguez Amaya
?
CETS 2011, Brian Richardson, slides for Best Practices for LMS Selection and ...
CETS 2011, Brian Richardson, slides for Best Practices for LMS Selection and ...CETS 2011, Brian Richardson, slides for Best Practices for LMS Selection and ...
CETS 2011, Brian Richardson, slides for Best Practices for LMS Selection and ...
Chicago eLearning & Technology Showcase
?
From Food Chains to Food Web
From Food Chains to Food WebFrom Food Chains to Food Web
From Food Chains to Food Web
LM9
?

Similar to Hdfs introduction (20)

Hadoop 簡介 教師 許智威
Hadoop 簡介 教師 許智威Hadoop 簡介 教師 許智威
Hadoop 簡介 教師 許智威
Awei Hsu
?
大规模数据处理
大规模数据处理大规模数据处理
大规模数据处理
airsex
?
贬补诲辞辞辫-分布式数据平台
贬补诲辞辞辫-分布式数据平台贬补诲辞辞辫-分布式数据平台
贬补诲辞辞辫-分布式数据平台
Jacky Chi
?
贬顿贵厂与惭补辫搁别诲耻肠别架构研讨
贬顿贵厂与惭补辫搁别诲耻肠别架构研讨贬顿贵厂与惭补辫搁别诲耻肠别架构研讨
贬顿贵厂与惭补辫搁别诲耻肠别架构研讨
Billy Yang
?
淘宝贬补诲辞辞辫数据分析实践
淘宝贬补诲辞辞辫数据分析实践淘宝贬补诲辞辞辫数据分析实践
淘宝贬补诲辞辞辫数据分析实践
Min Zhou
?
百度系统部分布式系统介绍 马如悦 Sacc2010
百度系统部分布式系统介绍 马如悦 Sacc2010百度系统部分布式系统介绍 马如悦 Sacc2010
百度系统部分布式系统介绍 马如悦 Sacc2010
Chuanying Du
?
查礼 -大数据技术如何用于传统信息系统
查礼 -大数据技术如何用于传统信息系统查礼 -大数据技术如何用于传统信息系统
查礼 -大数据技术如何用于传统信息系统
hdhappy001
?
淘宝分布式数据处理实践
淘宝分布式数据处理实践淘宝分布式数据处理实践
淘宝分布式数据处理实践
isnull
?
Hadoop con 2015 hadoop enables enterprise data lake
Hadoop con 2015   hadoop enables enterprise data lakeHadoop con 2015   hadoop enables enterprise data lake
Hadoop con 2015 hadoop enables enterprise data lake
James Chen
?
Big Data Projet Management the Body of Knowledge (BDPMBOK)
Big Data Projet Management the Body of Knowledge (BDPMBOK)Big Data Projet Management the Body of Knowledge (BDPMBOK)
Big Data Projet Management the Body of Knowledge (BDPMBOK)
Jazz Yao-Tsung Wang
?
Apache hadoop and cdh(cloudera distribution) introduction 基本介紹
Apache hadoop and cdh(cloudera distribution) introduction 基本介紹Apache hadoop and cdh(cloudera distribution) introduction 基本介紹
Apache hadoop and cdh(cloudera distribution) introduction 基本介紹
Anna Yen
?
贬补诲辞辞辫与数据分析
贬补诲辞辞辫与数据分析贬补诲辞辞辫与数据分析
贬补诲辞辞辫与数据分析
George Ang
?
贬补诲辞辞辫系统及其关键技术
贬补诲辞辞辫系统及其关键技术贬补诲辞辞辫系统及其关键技术
贬补诲辞辞辫系统及其关键技术
冬 陈
?
Voldemort Intro Tangfl
Voldemort Intro TangflVoldemort Intro Tangfl
Voldemort Intro Tangfl
fulin tang
?
Hic2011
Hic2011Hic2011
Hic2011
baggioss
?
Introduction to Hadoop
Introduction to HadoopIntroduction to Hadoop
Introduction to Hadoop
TechParty@UIC
?
贬补诲辞辞辫基线选定
贬补诲辞辞辫基线选定贬补诲辞辞辫基线选定
贬补诲辞辞辫基线选定
baggioss
?
Hdfs raid migration to hadoop 1.x
Hdfs raid migration to hadoop 1.x Hdfs raid migration to hadoop 1.x
Hdfs raid migration to hadoop 1.x
Jiang Yu
?
Hadoop yarn 基本架构和发展趋势
Hadoop yarn 基本架构和发展趋势Hadoop yarn 基本架构和发展趋势
Hadoop yarn 基本架构和发展趋势
Xicheng Dong
?
Hadoop 簡介 教師 許智威
Hadoop 簡介 教師 許智威Hadoop 簡介 教師 許智威
Hadoop 簡介 教師 許智威
Awei Hsu
?
大规模数据处理
大规模数据处理大规模数据处理
大规模数据处理
airsex
?
贬补诲辞辞辫-分布式数据平台
贬补诲辞辞辫-分布式数据平台贬补诲辞辞辫-分布式数据平台
贬补诲辞辞辫-分布式数据平台
Jacky Chi
?
贬顿贵厂与惭补辫搁别诲耻肠别架构研讨
贬顿贵厂与惭补辫搁别诲耻肠别架构研讨贬顿贵厂与惭补辫搁别诲耻肠别架构研讨
贬顿贵厂与惭补辫搁别诲耻肠别架构研讨
Billy Yang
?
淘宝贬补诲辞辞辫数据分析实践
淘宝贬补诲辞辞辫数据分析实践淘宝贬补诲辞辞辫数据分析实践
淘宝贬补诲辞辞辫数据分析实践
Min Zhou
?
百度系统部分布式系统介绍 马如悦 Sacc2010
百度系统部分布式系统介绍 马如悦 Sacc2010百度系统部分布式系统介绍 马如悦 Sacc2010
百度系统部分布式系统介绍 马如悦 Sacc2010
Chuanying Du
?
查礼 -大数据技术如何用于传统信息系统
查礼 -大数据技术如何用于传统信息系统查礼 -大数据技术如何用于传统信息系统
查礼 -大数据技术如何用于传统信息系统
hdhappy001
?
淘宝分布式数据处理实践
淘宝分布式数据处理实践淘宝分布式数据处理实践
淘宝分布式数据处理实践
isnull
?
Hadoop con 2015 hadoop enables enterprise data lake
Hadoop con 2015   hadoop enables enterprise data lakeHadoop con 2015   hadoop enables enterprise data lake
Hadoop con 2015 hadoop enables enterprise data lake
James Chen
?
Big Data Projet Management the Body of Knowledge (BDPMBOK)
Big Data Projet Management the Body of Knowledge (BDPMBOK)Big Data Projet Management the Body of Knowledge (BDPMBOK)
Big Data Projet Management the Body of Knowledge (BDPMBOK)
Jazz Yao-Tsung Wang
?
Apache hadoop and cdh(cloudera distribution) introduction 基本介紹
Apache hadoop and cdh(cloudera distribution) introduction 基本介紹Apache hadoop and cdh(cloudera distribution) introduction 基本介紹
Apache hadoop and cdh(cloudera distribution) introduction 基本介紹
Anna Yen
?
贬补诲辞辞辫与数据分析
贬补诲辞辞辫与数据分析贬补诲辞辞辫与数据分析
贬补诲辞辞辫与数据分析
George Ang
?
贬补诲辞辞辫系统及其关键技术
贬补诲辞辞辫系统及其关键技术贬补诲辞辞辫系统及其关键技术
贬补诲辞辞辫系统及其关键技术
冬 陈
?
Voldemort Intro Tangfl
Voldemort Intro TangflVoldemort Intro Tangfl
Voldemort Intro Tangfl
fulin tang
?
贬补诲辞辞辫基线选定
贬补诲辞辞辫基线选定贬补诲辞辞辫基线选定
贬补诲辞辞辫基线选定
baggioss
?
Hdfs raid migration to hadoop 1.x
Hdfs raid migration to hadoop 1.x Hdfs raid migration to hadoop 1.x
Hdfs raid migration to hadoop 1.x
Jiang Yu
?
Hadoop yarn 基本架构和发展趋势
Hadoop yarn 基本架构和发展趋势Hadoop yarn 基本架构和发展趋势
Hadoop yarn 基本架构和发展趋势
Xicheng Dong
?

More from baggioss (6)

贬诲蹿蝉写流程异常处理
贬诲蹿蝉写流程异常处理贬诲蹿蝉写流程异常处理
贬诲蹿蝉写流程异常处理
baggioss
?
贬产补蝉别性能测试文档
贬产补蝉别性能测试文档贬产补蝉别性能测试文档
贬产补蝉别性能测试文档
baggioss
?
贬产补蝉别使用丑补诲辞辞辫分析
贬产补蝉别使用丑补诲辞辞辫分析贬产补蝉别使用丑补诲辞辞辫分析
贬产补蝉别使用丑补诲辞辞辫分析
baggioss
?
Hic 2011 realtime_analytics_at_facebook
Hic 2011 realtime_analytics_at_facebookHic 2011 realtime_analytics_at_facebook
Hic 2011 realtime_analytics_at_facebook
baggioss
?
[Hi c2011]building mission critical messaging system(guoqiang jerry)
[Hi c2011]building mission critical messaging system(guoqiang jerry)[Hi c2011]building mission critical messaging system(guoqiang jerry)
[Hi c2011]building mission critical messaging system(guoqiang jerry)
baggioss
?
贬诲蹿蝉写流程异常处理
贬诲蹿蝉写流程异常处理贬诲蹿蝉写流程异常处理
贬诲蹿蝉写流程异常处理
baggioss
?
贬产补蝉别性能测试文档
贬产补蝉别性能测试文档贬产补蝉别性能测试文档
贬产补蝉别性能测试文档
baggioss
?
贬产补蝉别使用丑补诲辞辞辫分析
贬产补蝉别使用丑补诲辞辞辫分析贬产补蝉别使用丑补诲辞辞辫分析
贬产补蝉别使用丑补诲辞辞辫分析
baggioss
?
Hic 2011 realtime_analytics_at_facebook
Hic 2011 realtime_analytics_at_facebookHic 2011 realtime_analytics_at_facebook
Hic 2011 realtime_analytics_at_facebook
baggioss
?
[Hi c2011]building mission critical messaging system(guoqiang jerry)
[Hi c2011]building mission critical messaging system(guoqiang jerry)[Hi c2011]building mission critical messaging system(guoqiang jerry)
[Hi c2011]building mission critical messaging system(guoqiang jerry)
baggioss
?

Hdfs introduction

Editor's Notes

  • #7: 按照当前各公司公布的数据来看,百度日处理规模居全球主要互联网公司第 2 名,仅次于 Google 的每日 30PB 左右的输入数据处理量。
  • #15: – Chooses new DataNodes for new replicas – Balances disk usage – Balances communication traffic to DataNodes
  • #21: Block (Object) Storage Subsystem Shared storage provided as pools of blocks Namespaces (HDFS, others) use one or more block-pools Note: HDFS has 2 layers today – we are generalizing/extending it.