Технологии "Больших данных" все чаще находят свое место в информационных системах большинства компаний. Специалисты по работе с данными нуждаются в удобных решениях для работы с новыми технологиями в смешанных, многоплатформенных средах. Какие решения предлагает сегодня Embarcadero? Для архитекторов и специалистов по моделированию данных, администраторов БД и разработчиков серверных частей ИС. На русском языке.
Запись вебинара: http://youtu.be/sL5asNgFFG0
1 of 46
Downloaded 18 times
More Related Content
Поддержка NoSQL и платформ MongoDB, Hive и Teradata в продуктах Embarcadero
2. EMBARCADERO TECHNOLOGIES
Темы
1. СУБД сегодня
2. Большие данные
3. NoSQL: категории СУБД
4. MongoDB
5. «Горизонтальное» масштабирование БД
6. Map Reduce, Hadoop, Hive
7. Проектирование NoSQL БД
8. ER/Studio и NoSQL (demo)
6. EMBARCADERO TECHNOLOGIES
Что требуется от БД?
• Удобная для отображения моих данных
структура данных
• Скорость и возможность масштабирования
(верт. и гор. )
• Богатые и удобные средства доступа и
разработки приложений
7. EMBARCADERO TECHNOLOGIES
Что означает «масштабирование»?
• Перенос обработки как можно ближе к
данным
• Массивно-параллельная обработка
• Использование более дешевого,
стандартного оборудования, но в больших
количествах
• Оптимизация для:
запросов / чтения / вопросов / аналитики
11. EMBARCADERO TECHNOLOGIES
Терминология
ACID Atomic, Consistent, Isolated,
Durable
Атомарность, Согласованность,
Изолированность, Надежность
BASE Basically available, Soft state,
Eventual consistency
базовая доступность
гибкое состояние
согласованность в конечном счёте
Eventual consistency Согласованность в конечном счете
Schemaless Отсутствие схемы данных
Constraints / Have-to/ MUST / OBEY / Rigid /
Inflexible
Ограничения
12. EMBARCADERO TECHNOLOGIES
Мифы про «Большие данные»
• Отсутствие схемы данных
– При чтении мы все равно получаем структуру
– При записи мы можем использовать другую
• Лучше говорить о
«данных с множеством схем»
• Новая аппаратная база
• Новые технологии
13. EMBARCADERO TECHNOLOGIES
Schema для записи/ Schema на чтение
Schema для записи(RDBMS)
Директивное моделирование данных:
• Создать схему БД
• Загрузить данные в формате RDBMS
• Запросы к данным в формате RDBMS
Новые колонки должны быть добавлены ДО
ТОГО, как новые данные будут помещены в
систему.
Хорошо для Known Unknowns
(повторяемости)
14
Schema на чтение(Hadoop/NoSQL)
Описательное моделирование данных:
• Собрать данные в натуральном формате
• Создать схему
• Запросы к данным в натуральном
формате
Новые данные могут появляться в любое
время и появляться задним числом если
схема правильно описывает их
Хорошо для Unknown Unknowns
(исследования)
15. EMBARCADERO TECHNOLOGIES
Колоночные (ключзначение)
• Хранение по колонкам (one-dimensional)
• Единица значения – BLOB
• Запросы только по ключу
• Некоторые СУБД поддерживают вторичные индексы
• Схема не существует
• Update запрещены – только перезапись
• Cassandra, Redis, MemcacheD, Riak, DynamoDB, Sybase IQ
17. EMBARCADERO TECHNOLOGIES
Реляционные и документо-ориентированные
Реляционные
• Запросы по
любому полю
• Замена по месту
• Табличное хранение
• Каждое поле содержит
единственное значение
• «Жесткая» схема
• Нормализация приводит к
Joins «мелких» таблиц
• Oracle, MSSQL, MySQL,
PostgreSQL,DB2
Документные
• Многомерное
хранение
• В каждом поле
м.б. 0,1 или много
значений
• Запросы по любому полю
на любом уровне
• Гибкая изменяемая схема
• Замена значения по месту
• Требуется меньше индексов,
быстрее работает
• MongoDB, CouchDB, RethinkDB
18. EMBARCADERO TECHNOLOGIES
Реляционная модель требует нормализации
User
• Name
• Email
Address
Category
• Name
• Url
Article
• Name
• Slug
• Publish date
• Text
Tag
• Name
• Url
Comment
• Comment
• Date
• Author
User
• Name
• Email Address
Article
• Name
• Slug
• Publish date
• Text
• Author
Tag[]
• Value
Comment[]
• Comment
• Date
• Author
Category[]
• Value
В базе данных MongoDB хранятся документы
30. EMBARCADERO TECHNOLOGIES
Прямая поддержка Big Data и NoSQL – в ER/Studio XE6
• Big Data Forward / Reverse Engineering
• Сбор описаний новых источников данных
Классические No SQL
• DW, BI
• Data Vault
• Инфраструктуры
• Специализированные
• Новые источники данных
• Новые типы
• Нужны модели (нет жестких схем)
На базе PostgreSQL
MPP EDW
31. EMBARCADERO TECHNOLOGIES
Прямая поддержка Big Data и NoSQL – в ER/Studio XE6
• MongoDB
– Versions 2.4 and 2.6
• Hadoop Hive
– Versions 0.12 and 0.13
• Возможности
– Создание диаграмм
– Reverse Engineering (JSON, BSON)
– Создание DDL для Hive (без ALTER)
– Создание JSON-шаблона для MongoDB
32
33. EMBARCADERO TECHNOLOGIES
Классические СУБД и технологии Hadoop могут работать вместе
Программная
аналитика
Стандартные
Средства (SQL)
Реляционные Многоструктурные
данные
SQL
Hadoop
DW
Stagingdata
Data Warehouse
Анализ данных
Delphi, Java, C++, C#, PHP, Python,
Perl, Ruby
35. EMBARCADERO TECHNOLOGIES
Архитектура и модели в эпоху NoSQL
• Модель появляется в результате работы архитектора
• Без инструментов моделирования не обойтись
• Есть много типов моделей данных: какие именно вам нужны?
• В разных проектах модели нужны в разное время. Но они должны
быть доступны в нужное время
• Моделирование не просто проектирование схем. Это взгляд «с
высоты птичьего полета» и на перспективу
36. EMBARCADERO TECHNOLOGIES
Архитектура и модели в эпоху NoSQL
• Модели данных содержат гораздо больше, чем просто диаграммы
• Может потребоваться обучение моделированию
• Участники проекта могут не понимать модели. Обучите их
• Есть много вариантов использования NoSql. Рассмотрите все
способы
• Современные архитектуры данных чаще всего представляют
смешанные решения. Нельзя поддерживать только одну часть из
общего
37. EMBARCADERO TECHNOLOGIES
Роль архитекторов и разработчиков в проектах
• Для архитекторов данных
это означает:
– Останется место для
традиционных,
реляционных моделей
– …как и для разработчиков
– Все данные имеют свое
назначение. Множество
назначений.
– Нужно найти верное
решение для каждого
такого назначения
38. EMBARCADERO TECHNOLOGIES
Наш набор Database Tools
40
Не важно, работаете ли в команде
над масштабными моделями
данных, управляете
гетерогенными средами с
многочисленными типами СУБД
или разрабатываете оптимальный
по производительности код на SQL,
инструменты Embarcadero для
работы с БД дают существенный
рост продуктивности на еще более
расширенном наборе
поддерживаемых платформ СУБД
39. EMBARCADERO TECHNOLOGIES
Полезные ссылки
• Для более подробной информации о ER/Studio
http://www.embarcadero.com/products/er-studio
http://www.embarcadero.com/solutions/data-governance
• Демонстрационные примеры ER/Studio
http://www.embarcadero.com/quick-solution-demos
• Загрузка бесплатной пробной версии (Free Trial)
https://downloads.embarcadero.com/free/er_studio_enterprise
http://webportal.embarcadero.com (username=“PortalUser”, password=“portal*trial”)
• Примеры использования
Newmont Mining, Protective Life, Catalina Marketing, Entrust, Microsoft:
http://www.embarcadero.com/our-customers/case-studies
• Поддержка
http://www.embarcadero.com/support
• Представительство
mailto: Russia.Info@embarcadero.com
Телефон: +7(495)7084393
В социальных сетях
Facebook: http://on.fb.me/WDUQqY
LinkedIn: http://linkd.in/WDVeWu
Google+: http://bit.ly/WDVViL
Twitter: @ERStudio
46. EMBARCADERO TECHNOLOGIES
Big Data & NoSQL Resources (EMBT)
• Big Data & NoSQL Solution Webinar (recorded)
– https://www3.gotomeeting.com/register/264404974?elq=eadeadfbc4414ca1b53c906d6624f701&elqCampaignId=2703
• ER/Studio XE6 - Data Architect 10 New Features Guide - Big Data / NoSQL platforms
– http://docs.embarcadero.com/products/er_studio/erstudioDA10.0.0_EN/ERStudioDA_10.0.0_NewFeaturesGuide_EN.pdf
• Perform reverse and forward engineering with Hadoop Hive
– http://www.youtube.com/watch?v=SQSiPwbdTlA&vq=hd720&width=940&height=680
• ER/Studio Support for MongoDB
– https://www.youtube.com/watch?v=ZKbjlsa2bhI
• NoSQL and Big Data Modeling: 10 Tips for Data Modelers and Architects
– http://embt.co/1xbDJPU
– Webinar Recording (Karen Lopez) : http://buff.ly/1mpu0Uh
48