狠狠撸

狠狠撸Share a Scribd company logo
实时计算架构 北疯
产物介绍
产物 数据魔方全属性查询  2010.12~ 淘词  2011.6~ 淘宝指数 ( 开发中 )
prom 海量数据实时计算框架  - prom 2010.8  开始开发 2010.12  上线 通用性强,支持任何计算规则
数据规模 T 级数据量 百万级记录实时计算分析 存储于 hbase
特点 多维度 实时 (3s 内响应 ) 海量数据
架构变迁
第一版 redis +  tokyocabinet 2010.12 ~ 2011.6 mget 随机读取明细
第二版 HBase 2011.5~ 明细数据冗余 带宽瓶颈、 server 工作繁忙
第三版 HBase 本地计算 (region 端 ) 2011.6~ 扩展 client  -> region   开发、运维复杂
HBase 的使用
定义表 两个列族 (index 和 data) index 一般保存 id 列表 data 保存 id 明细列表
数据储存 云梯 Hbase Hbase Hbase …… 索引:交易 id 列表 属性对 交易 1 (二进制,定长) 交易 2
计算流程 rowkey: 商务定位  [0,2] regionserver 求 SUM(alipay) 属性 属性值 笔记本尺寸 13 寸 笔记本定位 商务定位 查索引 节点 1 1, 2,  3,  4,  5, 6,   7, 8,  9 节点 2 1,  2,  3, 4,  5, 6,  7 节点 2 1,  2,  4 , 6, 7 本地 SUM 运算( Hbase 扩展 ) 汇总计算 写入缓存
java 客户端 HTable HTablePool Get Result
java 客户端
例子
缓存 总结果 单日结果 集合交集偏移量 索引(内部缓存)
例子 http://weibo.com/app/detail/5k1grQ
总结 冗余顺序读 替代 批量随机读 通用性  vs  性能  定长、 byte
下一步 全部采用 hbase 本地计算 抽取框架  提高性能
Q&A thanks blog  :  www.yiihsia.com weibo  :  http://weibo.com/neihan e-mail  :  [email_address]

More Related Content

Similar to 基于贬产补蝉别的实时计算分享 (20)

Delta Lake Architecture: Delta Lake + Apache Spark Structured Streaming
Delta Lake Architecture: Delta Lake + Apache Spark Structured StreamingDelta Lake Architecture: Delta Lake + Apache Spark Structured Streaming
Delta Lake Architecture: Delta Lake + Apache Spark Structured Streaming
Xiao Li
?
基于丑产补蝉别的实时计算框架辫谤辞尘(20111114)
基于丑产补蝉别的实时计算框架辫谤辞尘(20111114)基于丑产补蝉别的实时计算框架辫谤辞尘(20111114)
基于丑产补蝉别的实时计算框架辫谤辞尘(20111114)
yiihsia
?
Hbase在淘宝的应用与优化 修改
Hbase在淘宝的应用与优化 修改Hbase在淘宝的应用与优化 修改
Hbase在淘宝的应用与优化 修改
yp_fangdong
?
Big Data Projet Management the Body of Knowledge (BDPMBOK)
Big Data Projet Management the Body of Knowledge (BDPMBOK)Big Data Projet Management the Body of Knowledge (BDPMBOK)
Big Data Projet Management the Body of Knowledge (BDPMBOK)
Jazz Yao-Tsung Wang
?
Ocean base海量结构化数据存储系统 hadoop in china
Ocean base海量结构化数据存储系统 hadoop in chinaOcean base海量结构化数据存储系统 hadoop in china
Ocean base海量结构化数据存储系统 hadoop in china
knuthocean
?
淘宝网架构变迁和挑战(翱谤补肠濒别架构师日)
淘宝网架构变迁和挑战(翱谤补肠濒别架构师日)淘宝网架构变迁和挑战(翱谤补肠濒别架构师日)
淘宝网架构变迁和挑战(翱谤补肠濒别架构师日)
vanadies10
?
20130626联动优势数据访问层顿础尝架构和实践5(刘胜)数据分片和分页
20130626联动优势数据访问层顿础尝架构和实践5(刘胜)数据分片和分页20130626联动优势数据访问层顿础尝架构和实践5(刘胜)数据分片和分页
20130626联动优势数据访问层顿础尝架构和实践5(刘胜)数据分片和分页
liu sheng
?
罢补辞产补辞图片存储与肠诲苍系统到服务
罢补辞产补辞图片存储与肠诲苍系统到服务罢补辞产补辞图片存储与肠诲苍系统到服务
罢补辞产补辞图片存储与肠诲苍系统到服务
Wensong Zhang
?
淘宝对象存储与颁诲苍系统到服务
淘宝对象存储与颁诲苍系统到服务淘宝对象存储与颁诲苍系统到服务
淘宝对象存储与颁诲苍系统到服务
drewz lin
?
开源+自主开发 - 淘宝软件基础设施构建实践
开源+自主开发  - 淘宝软件基础设施构建实践开源+自主开发  - 淘宝软件基础设施构建实践
开源+自主开发 - 淘宝软件基础设施构建实践
Wensong Zhang
?
搁别诲颈蝉分享
搁别诲颈蝉分享搁别诲颈蝉分享
搁别诲颈蝉分享
yiihsia
?
Trinity BDM - 橋接傳統與未來
Trinity BDM - 橋接傳統與未來Trinity BDM - 橋接傳統與未來
Trinity BDM - 橋接傳統與未來
Etu Solution
?
Java@taobao
Java@taobaoJava@taobao
Java@taobao
vanadies10
?
淘宝分布式数据处理实践
淘宝分布式数据处理实践淘宝分布式数据处理实践
淘宝分布式数据处理实践
isnull
?
贬测辫别谤颈辞苍基础架构
贬测辫别谤颈辞苍基础架构贬测辫别谤颈辞苍基础架构
贬测辫别谤颈辞苍基础架构
Jack Wong
?
E tom ngoss规范及siebel系统在电信行业的应用 陈永林
E tom ngoss规范及siebel系统在电信行业的应用 陈永林E tom ngoss规范及siebel系统在电信行业的应用 陈永林
E tom ngoss规范及siebel系统在电信行业的应用 陈永林
corlin chen
?
20120613联动优势数据访问层顿础尝架构和实践4(刘胜)最新特性
20120613联动优势数据访问层顿础尝架构和实践4(刘胜)最新特性20120613联动优势数据访问层顿础尝架构和实践4(刘胜)最新特性
20120613联动优势数据访问层顿础尝架构和实践4(刘胜)最新特性
liu sheng
?
Ocean base 千亿级海量数据库-日照
Ocean base 千亿级海量数据库-日照Ocean base 千亿级海量数据库-日照
Ocean base 千亿级海量数据库-日照
Shaoning Pan
?
Data Engineering in Taiwan: PAST, NOW and FUTURE
Data Engineering in Taiwan: PAST, NOW and FUTUREData Engineering in Taiwan: PAST, NOW and FUTURE
Data Engineering in Taiwan: PAST, NOW and FUTURE
Jazz Yao-Tsung Wang
?
Delta Lake Architecture: Delta Lake + Apache Spark Structured Streaming
Delta Lake Architecture: Delta Lake + Apache Spark Structured StreamingDelta Lake Architecture: Delta Lake + Apache Spark Structured Streaming
Delta Lake Architecture: Delta Lake + Apache Spark Structured Streaming
Xiao Li
?
基于丑产补蝉别的实时计算框架辫谤辞尘(20111114)
基于丑产补蝉别的实时计算框架辫谤辞尘(20111114)基于丑产补蝉别的实时计算框架辫谤辞尘(20111114)
基于丑产补蝉别的实时计算框架辫谤辞尘(20111114)
yiihsia
?
Hbase在淘宝的应用与优化 修改
Hbase在淘宝的应用与优化 修改Hbase在淘宝的应用与优化 修改
Hbase在淘宝的应用与优化 修改
yp_fangdong
?
Big Data Projet Management the Body of Knowledge (BDPMBOK)
Big Data Projet Management the Body of Knowledge (BDPMBOK)Big Data Projet Management the Body of Knowledge (BDPMBOK)
Big Data Projet Management the Body of Knowledge (BDPMBOK)
Jazz Yao-Tsung Wang
?
Ocean base海量结构化数据存储系统 hadoop in china
Ocean base海量结构化数据存储系统 hadoop in chinaOcean base海量结构化数据存储系统 hadoop in china
Ocean base海量结构化数据存储系统 hadoop in china
knuthocean
?
淘宝网架构变迁和挑战(翱谤补肠濒别架构师日)
淘宝网架构变迁和挑战(翱谤补肠濒别架构师日)淘宝网架构变迁和挑战(翱谤补肠濒别架构师日)
淘宝网架构变迁和挑战(翱谤补肠濒别架构师日)
vanadies10
?
20130626联动优势数据访问层顿础尝架构和实践5(刘胜)数据分片和分页
20130626联动优势数据访问层顿础尝架构和实践5(刘胜)数据分片和分页20130626联动优势数据访问层顿础尝架构和实践5(刘胜)数据分片和分页
20130626联动优势数据访问层顿础尝架构和实践5(刘胜)数据分片和分页
liu sheng
?
罢补辞产补辞图片存储与肠诲苍系统到服务
罢补辞产补辞图片存储与肠诲苍系统到服务罢补辞产补辞图片存储与肠诲苍系统到服务
罢补辞产补辞图片存储与肠诲苍系统到服务
Wensong Zhang
?
淘宝对象存储与颁诲苍系统到服务
淘宝对象存储与颁诲苍系统到服务淘宝对象存储与颁诲苍系统到服务
淘宝对象存储与颁诲苍系统到服务
drewz lin
?
开源+自主开发 - 淘宝软件基础设施构建实践
开源+自主开发  - 淘宝软件基础设施构建实践开源+自主开发  - 淘宝软件基础设施构建实践
开源+自主开发 - 淘宝软件基础设施构建实践
Wensong Zhang
?
搁别诲颈蝉分享
搁别诲颈蝉分享搁别诲颈蝉分享
搁别诲颈蝉分享
yiihsia
?
Trinity BDM - 橋接傳統與未來
Trinity BDM - 橋接傳統與未來Trinity BDM - 橋接傳統與未來
Trinity BDM - 橋接傳統與未來
Etu Solution
?
淘宝分布式数据处理实践
淘宝分布式数据处理实践淘宝分布式数据处理实践
淘宝分布式数据处理实践
isnull
?
贬测辫别谤颈辞苍基础架构
贬测辫别谤颈辞苍基础架构贬测辫别谤颈辞苍基础架构
贬测辫别谤颈辞苍基础架构
Jack Wong
?
E tom ngoss规范及siebel系统在电信行业的应用 陈永林
E tom ngoss规范及siebel系统在电信行业的应用 陈永林E tom ngoss规范及siebel系统在电信行业的应用 陈永林
E tom ngoss规范及siebel系统在电信行业的应用 陈永林
corlin chen
?
20120613联动优势数据访问层顿础尝架构和实践4(刘胜)最新特性
20120613联动优势数据访问层顿础尝架构和实践4(刘胜)最新特性20120613联动优势数据访问层顿础尝架构和实践4(刘胜)最新特性
20120613联动优势数据访问层顿础尝架构和实践4(刘胜)最新特性
liu sheng
?
Ocean base 千亿级海量数据库-日照
Ocean base 千亿级海量数据库-日照Ocean base 千亿级海量数据库-日照
Ocean base 千亿级海量数据库-日照
Shaoning Pan
?
Data Engineering in Taiwan: PAST, NOW and FUTURE
Data Engineering in Taiwan: PAST, NOW and FUTUREData Engineering in Taiwan: PAST, NOW and FUTURE
Data Engineering in Taiwan: PAST, NOW and FUTURE
Jazz Yao-Tsung Wang
?

基于贬产补蝉别的实时计算分享