狠狠撸

狠狠撸Share a Scribd company logo
? 版权所有 2010 EMC Corporation。保留所有权利。   1
大数据,大机遇
                                      陶波博士
                                      EMC中国研发中心首席技术官


? 版权所有 2010 EMC Corporation。保留所有权利。                    2
要实现阶段性变革、革命性变
                                      革,需要时机、技术、人才…的
                                      独特融合,以及对我们行业进行
                                      重大变革的运气。这种事情不会
                                      常常发生。

                                      Steve Jobs,1995 年


? 版权所有 2011 EMC Corporation。保留所有权利。                       3
大数据是一场革命性变革
                个人计算机                 互联网   大数据




? 版权所有 2011 EMC Corporation。保留所有权利。               4
!!!                               !!!
 “大数据无关乎大小,
  而关乎自由度”
                                                                                     !!!
                    — Techcrunch                      这是                       !!!


                                      大数据
                                            “发现:‘大数据’比卷
                                        !!! 更卓绝”
                                                                        “大数据! 它真实
                                                                         存在,实时提供,
                                                 时代...
                                                            — Gartner
                                                                         并且正在改变您的
                              “总数据: 比大数                                  世界”
                               据更‘大’”                                          — IDB
                                                      !!!
               !!!                      — 451 Group                     !!!
? 版权所有 2011 EMC Corporation。保留所有权利。                                                        5
EMC 大数据“堆栈”
4         协作                                      执行
                                           EMC Documentum xCP
                                                                        ?

3         实时                                      分析
                                      EMC Greenplum + Hadoop + Chorus


2       结构化与
        非结构化



1       PB 规模                                    存储
                                            EMC Isilon + Atmos


? 版权所有 2011 EMC Corporation。保留所有权利。                                         6
大数据正在改变公司存储




                                      EB
                      大数
                      据源




                                           基于文件:年复合增长率 60.7%   基于数据块:年复合增长率 21.8%
                                           至 2012 年,销售的总存储容量的 80% 将用于基于文件的数据
                                           来源:IDC




? 版权所有 2011 EMC Corporation。保留所有权利。                                                 7
大数据要求:
                                      容量和性能具有极大的可扩
                                      展性。


? 版权所有 2011 EMC Corporation。保留所有权利。                  8
纵向扩展的体系结构不适合大数据
 服务器




                                      可扩展性
                                      性能
 网络




                                      管理
                                      可用性
                                      成本
 存储




? 版权所有 2011 EMC Corporation。保留所有权利。          9
体系结构转变 — 为大数据横向扩展
 服务器




                                      可扩展性
                                      性能
 网络




                                      管理
                                      可用性
                                      成本
 存储




? 版权所有 2011 EMC Corporation。保留所有权利。          10
Isilon:横向扩展 NAS 创新
巨大的可扩展性
单个文件系统中超过 15 PB
无可比拟的性能
高达 85 GB/s 的吞吐量和高于 1.2M 的 IOPS
应用程序与工作流整合
业界领先的可靠性和自我修复能力                            应用程序




                                      性能
管理简便

                                           可扩展性




? 版权所有 2011 EMC Corporation。保留所有权利。               11
核心创新...为客户提供价值
Isilon 的 OneFS 横向扩展操作系统




                                 单一文件系统,单卷...高达 15 PB 以上
                                 原始存储利用率超过 80%
                                 最高的性能,完全对称的群集
                                 易于管理和扩展
                                 多层单一文件系统/单群集
                                 跨所有产物的单个统一平台



? 版权所有 2011 EMC Corporation。保留所有权利。                        12
File Striping: Writing a File




? 版权所有 2011 EMC Corporation。保留所有权利。   13
Isilon 解决方案适用于...



     公司 IT 扩展工作                       公司共享基础架构                               高性能计算
                                                       行业解决方案
     流

     ? 大规模主目录                         ? 私有云           ? 媒体和娱乐                ? 定量财务
     ? 大规模文件归档                        ? 第 3 层服务器虚拟化   ? 生命科学                 ? 地震处理
     ? 灾难恢复与业务连续性                     ? 存储整合          ? Internet 与 Web 2.0   ? 研究与分析
                                                      ? EDA 与软件开发            ? 生命信息学




? 版权所有 2011 EMC Corporation。保留所有权利。                                                    14
技术的聚合使大树据分析成为现实

                                                    聚合
                                  Web              (亦即“云”)


                                                             网络
                  创新




                                        X86
                                                     虚拟化

                                                      存储


                                              时间


? 版权所有 2011 EMC Corporation。保留所有权利。                               15
我们还需要什么?


? 版权所有 2011 EMC Corporation。保留所有权利。   16
我们需要...

                                       数据科学家
                                         创新
                                         社区
                      和               完整的大数据分析堆栈



? 版权所有 2011 EMC Corporation。保留所有权利。                17
? 版权所有 2011 EMC Corporation。保留所有权利。   18
EMC HADOOP
                                      非结构化。
                                      实时。
                                      公司就绪。

? 版权所有 2011 EMC Corporation。保留所有权利。                19
Greenplum HD 产物系列
? Greenplum HD 社区版:
      – 经认证的满堆栈,100% 开源
      – 虚拟机装置
      – 所有核心功能开发反过来又有助于 Apache Hadoop
? Greenplum HD 公司版:
      – 与众不同、混合分布、具有高级功能
      – 集成、经测试、加固型
      – 与 Hadoop、HBase、HDFS API 百分百兼容
? Greenplum HD Data Computing Appliance:
      – 优化装置配置
      – 消除复杂性,简化部署和管理
      – 与 Greenplum Database 无缝集成


? 版权所有 2011 EMC Corporation。保留所有权利。        20
Greenplum HD 技术创新

                 可插拔 I/O                 实时处理              容错

             ? Isilon OneFS           ? 低延迟读/写操作        ? 消除名称节点的单点
                                      ? 实时数据交互和分析         故障
             ? Atmos
                                        处理              ? 作业跟踪器及其他关
             ? Cassandra                                  键组件
                                      ? 与 Cassandra 和
             ? MapR                     MapR 集成
             ? 提高效率和性能




? 版权所有 2011 EMC Corporation。保留所有权利。                                   21
GREENPLUM HD
                                      DATA
                                      COMPUTING
                                      APPLIANCE 与
                                      Greenplum Database
                                      Apache Hadoop 强强联合



? 版权所有 2011 EMC Corporation。保留所有权利。                        22
Greenplum Chorus: 首创公司数据云平台
? 主要功能
   – 自我服务式生成数据库
   – 数据服务
   – 合作分析
? Chorus 部署在VMware云计算平台和
  Greenplum数据库上
? Chorus极大地加速从数据中提取信息的过
  程




? 版权所有 2011 EMC Corporation。保留所有权利。   23
? 版权所有 2011 EMC Corporation。保留所有权利。   24
自我服务可以快速开始一个新的项目
                       自我服务可以快速开始一个新的项目
                       o 生成数据库服务器 , 单节点或多节点
                       o 生成数据库服务器 , 单节点或多节点
                       o 生成沙盒用于分析.
                       o 生成沙盒用于分析.
                       o 方便地导入数据.
                       o 方便地导入数据.




? 版权所有 2011 EMC Corporation。保留所有权利。           25
创建合作环境对大数据做深度分析
                 创建合作环境对大数据做深度分析
                 o 创立项目工作空间 共享文档,数据和工作流程.
                 o 创立项目工作空间 共享文档,数据和工作流程.
                 o 在沙盒中实施工作流程和管理相关变更.
                 o 在沙盒中实施工作流程和管理相关变更.
                 o 控制数据的权限.
                 o 控制数据的权限.
                 o 从in-database analytics functions中导入函数
                 o 从in-database analytics functions中导入函数




? 版权所有 2011 EMC Corporation。保留所有权利。                        26
EDC 成功实例: T-Mobile

                                                                             Enterprise Data Cloud

                100 TB EDW
                                                                                 1 Petabyte EDC
Customer Challenges                                              EDC: Greenplum Database + Chorus
    – 100TB Teradata EDW focused on operational                   – Extracted data from EDW and others source systems
      reporting and financial consolidation                         to quickly assemble new analytic mart
    – EDW is single source of truth, under heavy                  – Generated a social graph from call detail records and
                                                                    subscriber data
      governance and control
                                                                  – Within 2 weeks uncovered behavior where
    – Unable to support all of the critical initiatives around      “connected” subscribers where 7X more likely to
      data surrounding the business                                 churn than average user
    – Customer loyalty and churn the #1 business initiative       – Deployed1PB production EDC with GP to power their
                                                                    analytic initiatives
      from the CEO on down


 ? 版权所有 2011 EMC Corporation。保留所有权利。                                                                                        27
构建完整的大数据分析堆栈

                                          分析工具集
                                       (业务分析、BI、统计等)

                                      Greenplum Chorus
                                       针对数据的公司协作平台

                          Greenplum Data Computing Appliance
                                         专用于大数据分析


           Greenplum Database                            Greenplum HD
                     公司版与社区版                          Hadoop 公司版与社区版
          世界上可扩展性最强的 MPP 数据库平台                      针对非结构化数据的公司分析平台




? 版权所有 2011 EMC Corporation。保留所有权利。                                     28
表彰大数据创新者
                                      www.DataHeroAwards.com




? 版权所有 2011 EMC Corporation。保留所有权利。                            29
“数据英雄奖”得主
Silver Spring Networks — 能源类




? 版权所有 2011 EMC Corporation。保留所有权利。   30
“数据英雄奖”得主
Vivek Kundra,美国首席信息官 — 远见奖




? 版权所有 2011 EMC Corporation。保留所有权利。   31
大数据 = 大机遇


? 版权所有 2011 EMC Corporation。保留所有权利。   32
了解详实EMC?Greenplum?数据计算应用
装置 (DCA)?的实际性能和功能:

请访问 www.bigdatafw.com下载ESG 白皮书,

?ESG实验室验证报告
‐EMC?Greenplum?数据计算应用装置 ?



? 版权所有 2011 EMC Corporation。保留所有权利。   33
谢谢大家


? 版权所有 2011 EMC Corporation。保留所有权利。          34
? 版权所有 2011 EMC Corporation。保留所有权利。   35
Ad

Recommended

Big Data World Forum
Big Data World Forum
bigdatawf
?
医药公司的数字化转型 - 逻辑数据结构策略
医药公司的数字化转型 - 逻辑数据结构策略
Denodo
?
How Enterprises Leverage Data to Overcome Business Challenges During Coronavirus
How Enterprises Leverage Data to Overcome Business Challenges During Coronavirus
Denodo
?
Modernising Data Architecture for Data Driven Insights (Chinese)
Modernising Data Architecture for Data Driven Insights (Chinese)
Denodo
?
Can data virtualization uphold performance with complex queries? (Chinese)
Can data virtualization uphold performance with complex queries? (Chinese)
Denodo
?
数据科学运营:公司人工智能之旅
数据科学运营:公司人工智能之旅
Denodo
?
如何集中数据治理,摆脱安全性和合规性困扰
如何集中数据治理,摆脱安全性和合规性困扰
Denodo
?
如何快速实现数据编织架构
如何快速实现数据编织架构
Denodo
?
Big Data Taiwan 2014 Opening: Converge . Discover . Monetize
Big Data Taiwan 2014 Opening: Converge . Discover . Monetize
Etu Solution
?
揭开数据虚拟化的神秘面纱
揭开数据虚拟化的神秘面纱
Denodo
?
Data & AI Driven Digital Transformation
Data & AI Driven Digital Transformation
Sky shi
?
数据挖掘理论与实践
数据挖掘理论与实践
medcl
?
Leverage Modern Enterprise Architecture To Speed Up Work Resumption
Leverage Modern Enterprise Architecture To Speed Up Work Resumption
Denodo
?
现代数据集成解决方案及应用案例介绍(下)
现代数据集成解决方案及应用案例介绍(下)
Denodo
?
Advanced Analytics and Machine Learning with Data Virtualization (Chinese)
Advanced Analytics and Machine Learning with Data Virtualization (Chinese)
Denodo
?
Emc keynote 1130 1200
Emc keynote 1130 1200
Chiou-Nan Chen
?
Centralizing Data Security with Data Virtualization (Chinese)
Centralizing Data Security with Data Virtualization (Chinese)
Denodo
?
Big Data 102 - Crossovers 成長之旅導覽 (Keynote for Big Data Taiwan 2013)
Big Data 102 - Crossovers 成長之旅導覽 (Keynote for Big Data Taiwan 2013)
Fred Chiang
?
Lean data innovation methodology
Lean data innovation methodology
Sky shi
?
Trinity BDM - 橋接傳統與未來
Trinity BDM - 橋接傳統與未來
Etu Solution
?
数据服务和现代数据生态系统
数据服务和现代数据生态系统
Denodo
?
Keynote: What Is the next Big Data?
Keynote: What Is the next Big Data?
Etu Solution
?
2012 雲端產業介紹
2012 雲端產業介紹
Sitg Yao
?
台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖
台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖
Etu Solution
?
物联网与工业4.0情境分析
物联网与工业4.0情境分析
Kenny Huang Ph.D.
?
Hadoop
Hadoop
leo_xibo
?
Etu DW Offload 解放資料倉儲的運算效能
Etu DW Offload 解放資料倉儲的運算效能
Etu Solution
?
现代数据集成解决方案及应用案例介绍(上)
现代数据集成解决方案及应用案例介绍(上)
Denodo
?
Emc keynote 0930 0945
Emc keynote 0930 0945
Chiou-Nan Chen
?
云存储与虚拟化分论坛 生活在云端 蔡礼洪 Emc
云存储与虚拟化分论坛 生活在云端 蔡礼洪 Emc
Riquelme624
?

More Related Content

What's hot (20)

Big Data Taiwan 2014 Opening: Converge . Discover . Monetize
Big Data Taiwan 2014 Opening: Converge . Discover . Monetize
Etu Solution
?
揭开数据虚拟化的神秘面纱
揭开数据虚拟化的神秘面纱
Denodo
?
Data & AI Driven Digital Transformation
Data & AI Driven Digital Transformation
Sky shi
?
数据挖掘理论与实践
数据挖掘理论与实践
medcl
?
Leverage Modern Enterprise Architecture To Speed Up Work Resumption
Leverage Modern Enterprise Architecture To Speed Up Work Resumption
Denodo
?
现代数据集成解决方案及应用案例介绍(下)
现代数据集成解决方案及应用案例介绍(下)
Denodo
?
Advanced Analytics and Machine Learning with Data Virtualization (Chinese)
Advanced Analytics and Machine Learning with Data Virtualization (Chinese)
Denodo
?
Emc keynote 1130 1200
Emc keynote 1130 1200
Chiou-Nan Chen
?
Centralizing Data Security with Data Virtualization (Chinese)
Centralizing Data Security with Data Virtualization (Chinese)
Denodo
?
Big Data 102 - Crossovers 成長之旅導覽 (Keynote for Big Data Taiwan 2013)
Big Data 102 - Crossovers 成長之旅導覽 (Keynote for Big Data Taiwan 2013)
Fred Chiang
?
Lean data innovation methodology
Lean data innovation methodology
Sky shi
?
Trinity BDM - 橋接傳統與未來
Trinity BDM - 橋接傳統與未來
Etu Solution
?
数据服务和现代数据生态系统
数据服务和现代数据生态系统
Denodo
?
Keynote: What Is the next Big Data?
Keynote: What Is the next Big Data?
Etu Solution
?
2012 雲端產業介紹
2012 雲端產業介紹
Sitg Yao
?
台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖
台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖
Etu Solution
?
物联网与工业4.0情境分析
物联网与工业4.0情境分析
Kenny Huang Ph.D.
?
Hadoop
Hadoop
leo_xibo
?
Etu DW Offload 解放資料倉儲的運算效能
Etu DW Offload 解放資料倉儲的運算效能
Etu Solution
?
现代数据集成解决方案及应用案例介绍(上)
现代数据集成解决方案及应用案例介绍(上)
Denodo
?
Big Data Taiwan 2014 Opening: Converge . Discover . Monetize
Big Data Taiwan 2014 Opening: Converge . Discover . Monetize
Etu Solution
?
揭开数据虚拟化的神秘面纱
揭开数据虚拟化的神秘面纱
Denodo
?
Data & AI Driven Digital Transformation
Data & AI Driven Digital Transformation
Sky shi
?
数据挖掘理论与实践
数据挖掘理论与实践
medcl
?
Leverage Modern Enterprise Architecture To Speed Up Work Resumption
Leverage Modern Enterprise Architecture To Speed Up Work Resumption
Denodo
?
现代数据集成解决方案及应用案例介绍(下)
现代数据集成解决方案及应用案例介绍(下)
Denodo
?
Advanced Analytics and Machine Learning with Data Virtualization (Chinese)
Advanced Analytics and Machine Learning with Data Virtualization (Chinese)
Denodo
?
Centralizing Data Security with Data Virtualization (Chinese)
Centralizing Data Security with Data Virtualization (Chinese)
Denodo
?
Big Data 102 - Crossovers 成長之旅導覽 (Keynote for Big Data Taiwan 2013)
Big Data 102 - Crossovers 成長之旅導覽 (Keynote for Big Data Taiwan 2013)
Fred Chiang
?
Lean data innovation methodology
Lean data innovation methodology
Sky shi
?
Trinity BDM - 橋接傳統與未來
Trinity BDM - 橋接傳統與未來
Etu Solution
?
数据服务和现代数据生态系统
数据服务和现代数据生态系统
Denodo
?
Keynote: What Is the next Big Data?
Keynote: What Is the next Big Data?
Etu Solution
?
2012 雲端產業介紹
2012 雲端產業介紹
Sitg Yao
?
台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖
台灣 Hadoop Big Data 2014 趨勢預測與企業策略藍圖
Etu Solution
?
物联网与工业4.0情境分析
物联网与工业4.0情境分析
Kenny Huang Ph.D.
?
Etu DW Offload 解放資料倉儲的運算效能
Etu DW Offload 解放資料倉儲的運算效能
Etu Solution
?
现代数据集成解决方案及应用案例介绍(上)
现代数据集成解决方案及应用案例介绍(上)
Denodo
?

Similar to Big Data World Forum (20)

Emc keynote 0930 0945
Emc keynote 0930 0945
Chiou-Nan Chen
?
云存储与虚拟化分论坛 生活在云端 蔡礼洪 Emc
云存储与虚拟化分论坛 生活在云端 蔡礼洪 Emc
Riquelme624
?
云存储与虚拟化分论坛 生活在云端 蔡礼洪
云存储与虚拟化分论坛 生活在云端 蔡礼洪
drewz lin
?
102 1530-1600
102 1530-1600
Chiou-Nan Chen
?
Bdwf11 netezza james_zheng
Bdwf11 netezza james_zheng
bigdatawf
?
础濒迟颈产补蝉别介绍
础濒迟颈产补蝉别介绍
小新 制造
?
Vplex
Vplex
xigua_521
?
公司邮件系统的私有云架构教战守则
公司邮件系统的私有云架构教战守则
OFMKT
?
云的基石:Net app存储平台
云的基石:Net app存储平台
ITband
?
Zh tw introduction_to_cloud_computing
Zh tw introduction_to_cloud_computing
TrendProgContest13
?
Big Data 101 一 一個充滿意圖與關聯世界的具體實現
Big Data 101 一 一個充滿意圖與關聯世界的具體實現
Fred Chiang
?
Dell
Dell
Vishal Goyal
?
昆腾技术白皮书- 重新设计备份和恢复,适应未来虚拟化和整合的需求
昆腾技术白皮书- 重新设计备份和恢复,适应未来虚拟化和整合的需求
samanthaleee
?
Linux运维趋势 第15期 虚拟化管理软件选型
Linux运维趋势 第15期 虚拟化管理软件选型
51CTO
?
云计算在电信业务中的应用分析 罗圣美
云计算在电信业务中的应用分析 罗圣美
Riquelme624
?
20141128(刘胜)鲍罢颁2014分布式和云服务的思考与实践——支付清算行业分布式架构的探索
20141128(刘胜)鲍罢颁2014分布式和云服务的思考与实践——支付清算行业分布式架构的探索
liu sheng
?
适应业务需求的甲骨文存储解决方案及产物演示
适应业务需求的甲骨文存储解决方案及产物演示
ITband
?
公司应用与互联网的融合
公司应用与互联网的融合
Jacky Chi
?
Cloud Computing for Bioinformatics
Cloud Computing for Bioinformatics
Jazz Yao-Tsung Wang
?
利用统一存储获得无与伦比的速度,简化系统,并节省更多
利用统一存储获得无与伦比的速度,简化系统,并节省更多
ITband
?
云存储与虚拟化分论坛 生活在云端 蔡礼洪 Emc
云存储与虚拟化分论坛 生活在云端 蔡礼洪 Emc
Riquelme624
?
云存储与虚拟化分论坛 生活在云端 蔡礼洪
云存储与虚拟化分论坛 生活在云端 蔡礼洪
drewz lin
?
Bdwf11 netezza james_zheng
Bdwf11 netezza james_zheng
bigdatawf
?
础濒迟颈产补蝉别介绍
础濒迟颈产补蝉别介绍
小新 制造
?
公司邮件系统的私有云架构教战守则
公司邮件系统的私有云架构教战守则
OFMKT
?
云的基石:Net app存储平台
云的基石:Net app存储平台
ITband
?
Zh tw introduction_to_cloud_computing
Zh tw introduction_to_cloud_computing
TrendProgContest13
?
Big Data 101 一 一個充滿意圖與關聯世界的具體實現
Big Data 101 一 一個充滿意圖與關聯世界的具體實現
Fred Chiang
?
昆腾技术白皮书- 重新设计备份和恢复,适应未来虚拟化和整合的需求
昆腾技术白皮书- 重新设计备份和恢复,适应未来虚拟化和整合的需求
samanthaleee
?
Linux运维趋势 第15期 虚拟化管理软件选型
Linux运维趋势 第15期 虚拟化管理软件选型
51CTO
?
云计算在电信业务中的应用分析 罗圣美
云计算在电信业务中的应用分析 罗圣美
Riquelme624
?
20141128(刘胜)鲍罢颁2014分布式和云服务的思考与实践——支付清算行业分布式架构的探索
20141128(刘胜)鲍罢颁2014分布式和云服务的思考与实践——支付清算行业分布式架构的探索
liu sheng
?
适应业务需求的甲骨文存储解决方案及产物演示
适应业务需求的甲骨文存储解决方案及产物演示
ITband
?
公司应用与互联网的融合
公司应用与互联网的融合
Jacky Chi
?
利用统一存储获得无与伦比的速度,简化系统,并节省更多
利用统一存储获得无与伦比的速度,简化系统,并节省更多
ITband
?
Ad

Big Data World Forum

  • 1. ? 版权所有 2010 EMC Corporation。保留所有权利。 1
  • 2. 大数据,大机遇 陶波博士 EMC中国研发中心首席技术官 ? 版权所有 2010 EMC Corporation。保留所有权利。 2
  • 3. 要实现阶段性变革、革命性变 革,需要时机、技术、人才…的 独特融合,以及对我们行业进行 重大变革的运气。这种事情不会 常常发生。 Steve Jobs,1995 年 ? 版权所有 2011 EMC Corporation。保留所有权利。 3
  • 4. 大数据是一场革命性变革 个人计算机 互联网 大数据 ? 版权所有 2011 EMC Corporation。保留所有权利。 4
  • 5. !!! !!! “大数据无关乎大小, 而关乎自由度” !!! — Techcrunch 这是 !!! 大数据 “发现:‘大数据’比卷 !!! 更卓绝” “大数据! 它真实 存在,实时提供, 时代... — Gartner 并且正在改变您的 “总数据: 比大数 世界” 据更‘大’” — IDB !!! !!! — 451 Group !!! ? 版权所有 2011 EMC Corporation。保留所有权利。 5
  • 6. EMC 大数据“堆栈” 4 协作 执行 EMC Documentum xCP ? 3 实时 分析 EMC Greenplum + Hadoop + Chorus 2 结构化与 非结构化 1 PB 规模 存储 EMC Isilon + Atmos ? 版权所有 2011 EMC Corporation。保留所有权利。 6
  • 7. 大数据正在改变公司存储 EB 大数 据源 基于文件:年复合增长率 60.7% 基于数据块:年复合增长率 21.8% 至 2012 年,销售的总存储容量的 80% 将用于基于文件的数据 来源:IDC ? 版权所有 2011 EMC Corporation。保留所有权利。 7
  • 8. 大数据要求: 容量和性能具有极大的可扩 展性。 ? 版权所有 2011 EMC Corporation。保留所有权利。 8
  • 9. 纵向扩展的体系结构不适合大数据 服务器 可扩展性 性能 网络 管理 可用性 成本 存储 ? 版权所有 2011 EMC Corporation。保留所有权利。 9
  • 10. 体系结构转变 — 为大数据横向扩展 服务器 可扩展性 性能 网络 管理 可用性 成本 存储 ? 版权所有 2011 EMC Corporation。保留所有权利。 10
  • 11. Isilon:横向扩展 NAS 创新 巨大的可扩展性 单个文件系统中超过 15 PB 无可比拟的性能 高达 85 GB/s 的吞吐量和高于 1.2M 的 IOPS 应用程序与工作流整合 业界领先的可靠性和自我修复能力 应用程序 性能 管理简便 可扩展性 ? 版权所有 2011 EMC Corporation。保留所有权利。 11
  • 12. 核心创新...为客户提供价值 Isilon 的 OneFS 横向扩展操作系统 单一文件系统,单卷...高达 15 PB 以上 原始存储利用率超过 80% 最高的性能,完全对称的群集 易于管理和扩展 多层单一文件系统/单群集 跨所有产物的单个统一平台 ? 版权所有 2011 EMC Corporation。保留所有权利。 12
  • 13. File Striping: Writing a File ? 版权所有 2011 EMC Corporation。保留所有权利。 13
  • 14. Isilon 解决方案适用于... 公司 IT 扩展工作 公司共享基础架构 高性能计算 行业解决方案 流 ? 大规模主目录 ? 私有云 ? 媒体和娱乐 ? 定量财务 ? 大规模文件归档 ? 第 3 层服务器虚拟化 ? 生命科学 ? 地震处理 ? 灾难恢复与业务连续性 ? 存储整合 ? Internet 与 Web 2.0 ? 研究与分析 ? EDA 与软件开发 ? 生命信息学 ? 版权所有 2011 EMC Corporation。保留所有权利。 14
  • 15. 技术的聚合使大树据分析成为现实 聚合 Web (亦即“云”) 网络 创新 X86 虚拟化 存储 时间 ? 版权所有 2011 EMC Corporation。保留所有权利。 15
  • 16. 我们还需要什么? ? 版权所有 2011 EMC Corporation。保留所有权利。 16
  • 17. 我们需要... 数据科学家 创新 社区 和 完整的大数据分析堆栈 ? 版权所有 2011 EMC Corporation。保留所有权利。 17
  • 18. ? 版权所有 2011 EMC Corporation。保留所有权利。 18
  • 19. EMC HADOOP 非结构化。 实时。 公司就绪。 ? 版权所有 2011 EMC Corporation。保留所有权利。 19
  • 20. Greenplum HD 产物系列 ? Greenplum HD 社区版: – 经认证的满堆栈,100% 开源 – 虚拟机装置 – 所有核心功能开发反过来又有助于 Apache Hadoop ? Greenplum HD 公司版: – 与众不同、混合分布、具有高级功能 – 集成、经测试、加固型 – 与 Hadoop、HBase、HDFS API 百分百兼容 ? Greenplum HD Data Computing Appliance: – 优化装置配置 – 消除复杂性,简化部署和管理 – 与 Greenplum Database 无缝集成 ? 版权所有 2011 EMC Corporation。保留所有权利。 20
  • 21. Greenplum HD 技术创新 可插拔 I/O 实时处理 容错 ? Isilon OneFS ? 低延迟读/写操作 ? 消除名称节点的单点 ? 实时数据交互和分析 故障 ? Atmos 处理 ? 作业跟踪器及其他关 ? Cassandra 键组件 ? 与 Cassandra 和 ? MapR MapR 集成 ? 提高效率和性能 ? 版权所有 2011 EMC Corporation。保留所有权利。 21
  • 22. GREENPLUM HD DATA COMPUTING APPLIANCE 与 Greenplum Database Apache Hadoop 强强联合 ? 版权所有 2011 EMC Corporation。保留所有权利。 22
  • 23. Greenplum Chorus: 首创公司数据云平台 ? 主要功能 – 自我服务式生成数据库 – 数据服务 – 合作分析 ? Chorus 部署在VMware云计算平台和 Greenplum数据库上 ? Chorus极大地加速从数据中提取信息的过 程 ? 版权所有 2011 EMC Corporation。保留所有权利。 23
  • 24. ? 版权所有 2011 EMC Corporation。保留所有权利。 24
  • 25. 自我服务可以快速开始一个新的项目 自我服务可以快速开始一个新的项目 o 生成数据库服务器 , 单节点或多节点 o 生成数据库服务器 , 单节点或多节点 o 生成沙盒用于分析. o 生成沙盒用于分析. o 方便地导入数据. o 方便地导入数据. ? 版权所有 2011 EMC Corporation。保留所有权利。 25
  • 26. 创建合作环境对大数据做深度分析 创建合作环境对大数据做深度分析 o 创立项目工作空间 共享文档,数据和工作流程. o 创立项目工作空间 共享文档,数据和工作流程. o 在沙盒中实施工作流程和管理相关变更. o 在沙盒中实施工作流程和管理相关变更. o 控制数据的权限. o 控制数据的权限. o 从in-database analytics functions中导入函数 o 从in-database analytics functions中导入函数 ? 版权所有 2011 EMC Corporation。保留所有权利。 26
  • 27. EDC 成功实例: T-Mobile Enterprise Data Cloud 100 TB EDW 1 Petabyte EDC Customer Challenges EDC: Greenplum Database + Chorus – 100TB Teradata EDW focused on operational – Extracted data from EDW and others source systems reporting and financial consolidation to quickly assemble new analytic mart – EDW is single source of truth, under heavy – Generated a social graph from call detail records and subscriber data governance and control – Within 2 weeks uncovered behavior where – Unable to support all of the critical initiatives around “connected” subscribers where 7X more likely to data surrounding the business churn than average user – Customer loyalty and churn the #1 business initiative – Deployed1PB production EDC with GP to power their analytic initiatives from the CEO on down ? 版权所有 2011 EMC Corporation。保留所有权利。 27
  • 28. 构建完整的大数据分析堆栈 分析工具集 (业务分析、BI、统计等) Greenplum Chorus 针对数据的公司协作平台 Greenplum Data Computing Appliance 专用于大数据分析 Greenplum Database Greenplum HD 公司版与社区版 Hadoop 公司版与社区版 世界上可扩展性最强的 MPP 数据库平台 针对非结构化数据的公司分析平台 ? 版权所有 2011 EMC Corporation。保留所有权利。 28
  • 29. 表彰大数据创新者 www.DataHeroAwards.com ? 版权所有 2011 EMC Corporation。保留所有权利。 29
  • 30. “数据英雄奖”得主 Silver Spring Networks — 能源类 ? 版权所有 2011 EMC Corporation。保留所有权利。 30
  • 31. “数据英雄奖”得主 Vivek Kundra,美国首席信息官 — 远见奖 ? 版权所有 2011 EMC Corporation。保留所有权利。 31
  • 32. 大数据 = 大机遇 ? 版权所有 2011 EMC Corporation。保留所有权利。 32
  • 33. 了解详实EMC?Greenplum?数据计算应用 装置 (DCA)?的实际性能和功能: 请访问 www.bigdatafw.com下载ESG 白皮书, ?ESG实验室验证报告 ‐EMC?Greenplum?数据计算应用装置 ? ? 版权所有 2011 EMC Corporation。保留所有权利。 33
  • 34. 谢谢大家 ? 版权所有 2011 EMC Corporation。保留所有权利。 34
  • 35. ? 版权所有 2011 EMC Corporation。保留所有权利。 35