Цифровая эра требует высоких скоростей. Успевает ли за временем ваше хранилище данных? Ниже перечислены шесть основных качеств, которыми должна обладать такая платформа.
6 важнейших качеств платформы для анализа Больших данныхElizaveta Alekseevao Задумались о внедрении серьезной аналитической платформы? Отличная идея: производительная аналитика поможет ускорить принятие бизнес-решений и извлечь из данных новую ценную информацию. Узнайте, какими качествами должна обладать современная аналитическая платформа
Восемь подводных камней на пути к внедрению аналитики Больших данныхElizaveta AlekseevaПриручить Большие данные, аналитику и искусственный интеллект и добиться от них пользы для бизнеса не так-то просто. Узнайте, какие «подводные камни» ожидают тех, кто решил внедрять аналитику Больших данных, и – главное – как их преодолеть.
Электронная книга «Как IT-служба HPE научила бизнес пользоваться аналитикойYuri YashkinБольшие данные: на пути к идеалу. Электронная книга «Как IT-служба HPE научила бизнес пользоваться аналитикой»
Решения HPE Software для Больших данныхYuri YashkinАналитика Больших данных позволяет улучшить бизнеспроцессы и операционную деятельность, повысить эффективность управления рисками и добиться дополнительной экономии средств. В документе описаны восемь подводных камней на пути к внедрению аналитики Больших данных
Splunk - универсальная платформа для работы с любыми даннымиCleverDATAПрезентация Константина Ткачева, архитектора решений CleverDATA по платформе Splunk (функционал, источники данных, возможности масштабируемости, примеры панелей управления, возможности интеграции, аналитика данных и предиктивные возможности).
Bios power bi о нас (RU)Oleksandr18КОРПОРАТИВНА ЗВІТНІСТЬ
на базі Microsoft Power BI
Розробка Dashboard. Аналіз даних. Створення інформаційного поля компаній, виявлення ключових метрик. Формування методології корпоративної звітності
Управление Big data платформой Почты РоссииAndrey BashchenkoМой доклад на Highload ++ 2017 по управлению разработкой Big Data платформы для Почты России.
Fors и big data applianceCleverDATAЦентр решений ФОРС. Презентации продуктов и технологий. Демонстрационный зал аппаратных средств. Проведение тренингов и тестирований. Проработка и оптимизация решений на стеке Oracle. Oracle Big Data Appliance
Power BI для аналитики данных из 1С: практический опытMarina PayvinaPower BI для аналитики данных из 1С:
практический опыт
Андрей Терехов, Консультационная Группа АТК
Предиктивная аналитика и Big Data: методы, инструменты, решенияDell_RussiaМарина Онищенко, исполнительный директор StatSoft Russia.
Максим Милков, технический директор StatSoft Russia.
Форум решений Dell — 2015,
21 октября 2015 года.
Руководство по достижению зрелости в области аналитики Больших данныхElizaveta AlekseevaВы уже сделали первые шаги на пути освоения Больших данных и освоили Hadoop? Нет предела совершенству – всегда есть к чему стремиться. Попробуйте оценить эффективность ваших аналитических систем, сравнить их с решениями ваших конкурентов и разработать «дорожную карту» по их развитию.
OSPconf. Big Data Forum 2015Ilya GershanovMy presentation at OSPconf. Big Data Forum 2015 in Moscow on Informatica products and solutions in Big Data space: datawarehouse offload, managed data lake, big data Customer MDM, streaming analytics platform.
Виртуализация Данных: ВведениеDenodo https://bit.ly/2X6Domb
В нашу эпоху головокружительных достижений в области искусственного интеллекта, облачных вычислений и передовой аналитики, как ни странно, многие организации по-прежнему полагаются на архитектуры данных, построенные в прошлом веке. Однако, ситуация быстро меняется с ростом применения виртуализации данных в реальном времени для обеспечения безопасного, логического доступа к информации. Данный подход позволяет отказаться от физической трансформации и перемещения данных в хранилище, прежде чем они могут быть использованы бизнесом.
Посетите этот новый вебинар на русском языке, чтобы узнать:
- Что такое виртуализация данных?
- Чем данный подход отличается от других корпоративных технологий интеграции данных, таких как ETL
- Почему крупнейшие организации используют виртуализацию в масштабах всего предприятия
Узнайте больше о проблемах интеграции данных, решаемых с помощью виртуализации и вариантах применения этой динамично развивающейся технологии.
Решения HPE для Автоматизации каталога услуг и процессов эксплуатации ИТYuri YashkinРешения HPE для Автоматизации каталога услуг и процессов эксплуатации ИТ
Анализ больших данных с помощью инструментов GoogleNetpeakПрезентация доклада на конференции «ФинМаркет», Киев, 06/10/2015.
Докладчик: Алексей Данилин – Senior SEO Specialist Netpeak.
Splunk - универсальная платформа для работы с любыми даннымиCleverDATAПрезентация Константина Ткачева, архитектора решений CleverDATA по платформе Splunk (функционал, источники данных, возможности масштабируемости, примеры панелей управления, возможности интеграции, аналитика данных и предиктивные возможности).
Bios power bi о нас (RU)Oleksandr18КОРПОРАТИВНА ЗВІТНІСТЬ
на базі Microsoft Power BI
Розробка Dashboard. Аналіз даних. Створення інформаційного поля компаній, виявлення ключових метрик. Формування методології корпоративної звітності
Управление Big data платформой Почты РоссииAndrey BashchenkoМой доклад на Highload ++ 2017 по управлению разработкой Big Data платформы для Почты России.
Fors и big data applianceCleverDATAЦентр решений ФОРС. Презентации продуктов и технологий. Демонстрационный зал аппаратных средств. Проведение тренингов и тестирований. Проработка и оптимизация решений на стеке Oracle. Oracle Big Data Appliance
Power BI для аналитики данных из 1С: практический опытMarina PayvinaPower BI для аналитики данных из 1С:
практический опыт
Андрей Терехов, Консультационная Группа АТК
Предиктивная аналитика и Big Data: методы, инструменты, решенияDell_RussiaМарина Онищенко, исполнительный директор StatSoft Russia.
Максим Милков, технический директор StatSoft Russia.
Форум решений Dell — 2015,
21 октября 2015 года.
Руководство по достижению зрелости в области аналитики Больших данныхElizaveta AlekseevaВы уже сделали первые шаги на пути освоения Больших данных и освоили Hadoop? Нет предела совершенству – всегда есть к чему стремиться. Попробуйте оценить эффективность ваших аналитических систем, сравнить их с решениями ваших конкурентов и разработать «дорожную карту» по их развитию.
OSPconf. Big Data Forum 2015Ilya GershanovMy presentation at OSPconf. Big Data Forum 2015 in Moscow on Informatica products and solutions in Big Data space: datawarehouse offload, managed data lake, big data Customer MDM, streaming analytics platform.
Виртуализация Данных: ВведениеDenodo https://bit.ly/2X6Domb
В нашу эпоху головокружительных достижений в области искусственного интеллекта, облачных вычислений и передовой аналитики, как ни странно, многие организации по-прежнему полагаются на архитектуры данных, построенные в прошлом веке. Однако, ситуация быстро меняется с ростом применения виртуализации данных в реальном времени для обеспечения безопасного, логического доступа к информации. Данный подход позволяет отказаться от физической трансформации и перемещения данных в хранилище, прежде чем они могут быть использованы бизнесом.
Посетите этот новый вебинар на русском языке, чтобы узнать:
- Что такое виртуализация данных?
- Чем данный подход отличается от других корпоративных технологий интеграции данных, таких как ETL
- Почему крупнейшие организации используют виртуализацию в масштабах всего предприятия
Узнайте больше о проблемах интеграции данных, решаемых с помощью виртуализации и вариантах применения этой динамично развивающейся технологии.
Решения HPE для Автоматизации каталога услуг и процессов эксплуатации ИТYuri YashkinРешения HPE для Автоматизации каталога услуг и процессов эксплуатации ИТ
Анализ больших данных с помощью инструментов GoogleNetpeakПрезентация доклада на конференции «ФинМаркет», Киев, 06/10/2015.
Докладчик: Алексей Данилин – Senior SEO Specialist Netpeak.
MONT Решения Micro Focus для резервного копированияYuri YashkinПрограммные решения Micro Focus (ранее HPE Software) для задач резервного копирования и восстановления данных.
Логическая витрина для доступа к большим даннымSergey GorshkovКак компании получить максимальную выгоду от накопленной информации? Как интегрировать данные из хранилищ Big Data с традиционной аналитической информацией?
Аналитический обзор рынка Больших Данных от IPOboardIpo BoardДанный аналитический обзор посвящен рынку Больших Данных.
В обзоре освящена текущая ситуация на международном и российском рынках.
Также описаны тенденции рынка и его прогноз.
Продвинутый анализ и машинное обучение с помощью виртуализации данныхDenodo Watch here: https://bit.ly/31XRObm
Передовые методы сбора и обработки информации, такие как машинное обучение, оказались чрезвычайно полезным инструментом для получения ценных знаний на основе имеющихся данных. Такие платформы, как Spark, и математические библиотеки для R, Python и Scala позволяют ученым, работающим с данными, использовать передовые технологии. Однако эти ученые тратили большую часть своего времени на поиск нужных данных и их преобразование в удобный для использования формат. Виртуализация данных предлагает новую парадигму для более эффективного и гибкого решения этих проблем.
Посетите этот вебинар и узнайте:
- Как виртуализация данных может ускорить сбор и преобразование информации, предоставляя ученым, работающим с данными, мощный инструмент, упрощающий их работу.
- Как популярные инструменты из экосистемы науки о данных: Spark, Python, Zeppelin и т.д. интегрируются с Denodo.
- Как можно эффективно использовать платформу Denodo с большими объемами данных.
Big Data Open LabDell_RussiaЛаборатория технологий больших данных Big Data Open Lab
Павел Борох, менеджер по маркетингу корпоративных решений Dell в России, Казахстане и Центральной Азии
Арутюн Аветисян, ученый секретарь, Институт системного программирования РАН.
Форум решений Dell — 2014 (Dell Solutions Forum 2014).
Москва, 14 ноября 2014 г.
Проект "Интеллектуальный помощник руководителя"Vesto93Проект по разработке многофункционального программного комплекса интеллектуального анализа данных для решения прикладных бизнес-задач "Интеллектуальный помощник руководителя"
От Больших данных к знаниям: преимущества для операторов связиYuri YashkinДля операторов связи Большие данные — это возможность создать систему аналитики для более эффективной эксплуатации своих сетей, оценить выгоду от предоставления тех или иных услуг и обеспечить индивидуальный подход к клиентам. И директора по маркетингу, и вице-президенты по эксплуатации сетей, и руководители бизнес-подразделений в равной степени стремятся принимать решения, основываясь на результатах обработки значительных объемов информации. Такие компании ожидают, что их маркетологи смогут предложить им комплексные аналитические выводы, подготовленные с учетом данных, имеющихся в их ИТ- и сетевой инфраструктурах. В данном документе рассматриваются все преимущества преобразования данных операторов связи в знания. Этот процесс охватывает источники информации, инструменты сбора данных, аналитические СУБД с быстрым доступом и, наконец, сценарии использования бизнес-аналитики с представлением и визуализацией результатов и прогнозов
Использование аналитической платформы HPE Vertica для управления большими объ...Yuri YashkinИспользование аналитической платформы HPE Vertica для управления большими объемами данных, фиксируемых интеллектуальными приборами учета в отраслях энергетики и ЖКХ
Модернизация хранилища данных для использования передовой аналитикиYuri YashkinОбновление хранилища, предназначенного для обработки и анализа больших объемов данных, не должно нарушать функционирования вашей информационной среды. Благодаря низкой стоимости, высокой скорости и масштабируемости массивно-параллельной архитектуры колоночная база данных, в частности HPE Vertica, способна стать важнейшим элементом гибридной архитектуры Больших данных.
Руководство по достижению зрелости в области аналитики Больших данныхYuri YashkinВ данном отчете учтен опыт организаций, идущих по пути освоения аналитики Больших данных. В нем описаны стадии зрелости и представлены результаты нашей оценки.
ПО HPE для задач резервного копирования и восстановления данныхYuri YashkinПрограммное обеспечение Hewlett Packard Enterprise для задач резервного копирования и восстановления данных
Шесть важнейших качеств платформы для анализа Больших данных
1. Шесть важнейших качеств
платформы для анализа
Больших данных
Цифровая эра требует высоких скоростей.
Успевает ли за временем ваше хранилище данных?
Брошюра
2. Брошюра Стр. 2
Краткий обзор
Существующие во многих организациях аналитические решения
уже не справляются с растущими объемами данных. Согласно результатам
недавних исследований Hewlett Packard Enterprise, 66 % респондентов
полагают, что имеющиеся у них системы не способны анализировать нужные
объемы данных; по мнению 65 % опрошенных, запросы обрабатываются
слишком медленно или вызывают сбой; 43 % считают, что существующее
решение исчерпало свои возможности1
. При этом оперативный
и качественный анализ данных требуется все чаще.
Вы прекрасно понимаете, чем это грозит. Стремительный рост затрат
и сложности в управлении устаревшим хранилищем данных изматывают
компанию и приближают ее коллапс. В то же время модернизация
аналитической платформы Больших данных открывает новые источники
дохода — это возможность монетизировать данные, повысить лояльность
клиентов, оптимизировать трафик и обеспечить соответствие
законодательным нормам.
Правильно подобранная и установленная платформа для анализа Больших
данных усилит ваши конкурентные преимущества и поможет добиться
блестящих результатов. Как же выбрать оптимальную архитектуру
аналитики, обладающую необходимым запасом прочности, не наносящую урон
даже скромному бюджету и требующую минимальной адаптации процессов и
подходов?
Ниже перечислены шесть основных качеств, которыми должна обладать
такая платформа. Возможно, наши советы покажутся вам неожиданными
и заставят задуматься: следует учитывать не только количество данных и
глубину аналитики, но и производительность системы. Цифровая эра требует
высоких скоростей. Новая платформа должна ускорить извлечение полезных
сведений из массивов данных — ведь эти сведения помогут оптимизировать
процессы и быстрее получать желаемые результаты. Другими словами, будущее
принадлежит быстрому бизнесу.
Содержание
2 Краткий обзор
3 Ключевые требования
к платформе аналитики
Больших данных
3 #1: Максимальное
быстродействие
4 #2: Способность вмещать
огромные объемы данных
4 #3: Совместимость с
имеющимися инструментами
5 #4: Опора на Hadoop и
повышение эффективности
этой платформы
6 #5: Оказание помощи
аналитикам
6 #6: Наличие функций
расширенной аналитики
7 HPE Vertica: уникальная
по эффективности
платформа аналитики
Больших данных
8 Подробнее о HPE Vertica
1
Исследование TechValidate, декабрь
2015 г.
3. Брошюра Стр. 3
Ключевые требования к платформе для анализа
Больших данных
Очевидно, что выбранная вами платформа должна отвечать широкому спектру
требований. Вот шесть главных критериев.
#1: Максимальное быстродействие
Раз уж мы заговорили о современных скоростях, важно понять, что это означает
применительно к аналитической платформе Больших данных. Если совсем
коротко: пользователь, сделавший запрос, не должен ждать результата. Ответ
должен выдаваться моментально, с нужным качеством и без замедления других
процессов. Платформа должна обеспечивать высокую производительность
существующих приложений, позволять разрабатывать новые аналитические
алгоритмы, а также легко масштабироваться — понятно, предсказуемо и с
разумными затратами.
Выполнение этих требований предполагает использование колоночной
архитектуры СУБД (вместо традиционной строчной, не поддерживающей
параллельную обработку запросов) и технологии массивно-параллельной
обработки данных (МРР). Почему именно их? Колоночная архитектура
минимизирует нагрузку на каналы ввода-вывода (именно эта нагрузка чаще всего
снижает скорость обработки данных) и, кроме того, обеспечивает максимальные
возможности сжатия — вчетверо или даже впятеро сильнее, чем строчная
СУБД. А хранилища данных MPP обычно масштабируются линейно: при
удвоении дискового пространства двухузлового хранилища удваивается и его
производительность.
Сочетание колоночного дизайна и МРР не только обеспечивает мощное
масштабирование производительности (в 100–1000 раз), но и позволяет
устанавливать более низкие и прозрачные тарифы, например потерабайтный
(вместо традиционной оплаты по числу процессоров, узлов или пользователей).
Каков же конечный результат? Значительное увеличение производительности и
возможность снижения общей стоимости анализа Больших данных.
«Более 75 %
отраслевых
лидеров внедрили
у себя колоночные
базы данных», —
Aberdeen Group
0
10
20
30
40
50
60
70
80
Процентреспондентов
Колоночная база данных
Отраслевые лидеры76 %
37 %
28 %
57 %
25 % 23 %
54 %
30 %
14 %
Аналитика в режиме
реального времени
Середняки
Предиктивная/
расширенная
аналитика
Отстающие
Рисунок 1. Степень проникновения ключевых характеристик платформ для
анализа Больших данных: Aberdeen Group2
4. Брошюра Стр. 4
#2: Способность вмещать и обрабатывать огромные объемы данных
Конечно, сама по себе скорость работы мало что дает: такая аналитическая
платформа должна хранить и контролировать максимальные объемы
данных. Сегодня речь пойдет о гигабайтах или терабайтах, но завтра вам уже
понадобятся петабайты.
Массовый параллелизм — идеальная технология для масштабирования
аналитической обработки данных: она задействует и системы хранения,
и вычислительные возможности сразу нескольких компьютеров — целого
кластера. Масштабировать можно не только производительность, но и
способность системы обрабатывать огромные потоки входящих данных. К
тому же использование технологии МРР в платформе, рассчитанной на работу
со структурированными Большими данными, способствует ускоренному
выполнению аналитических процессов: структурированные данные
оптимизированы для аналитики, поэтому в них проще найти необходимую
информацию, при этом точность поиска возрастает.
СУБД, предназначенные для работы с неструктурированными данными, не
всегда можно масштабировать до размеров, доступных для колоночных СУБД,
рассчитанных на структурированную информацию. Тем не менее, платформы
аналитики Больших данных могут содержать функции, повышающие
масштабируемость и быстродействие даже неструктурированных СУБД.
#3: Совместимость с имеющимися инструментами
Если вы уже используете программные продукты для извлечения, передачи
и загрузки (ETL) данных (например, Attunity, Informatica, Syncsort, Talend,
Pentaho) или решения для визуализации на базе SQL (Logi Analytics,
Looker, MicroStrategy, Qlik, Tableau, Talena), убедитесь, что ваша платформа
сертифицирована для работы со всеми этими инструментами, а не только с
основными. Кроме того, удостоверьтесь, что и другие средства и технологии
соответствуют новейшей (SQL 2011) версии стандарта ANSI SQL.
5. Брошюра Стр. 5
#4: Опора на Hadoop и повышение эффективности этой платформы
Hadoop — программная платформа с открытым кодом, разработанная
компанией Apache Software Foundation, — стала самым мощным игроком
на рынке аналитики Больших данных. Многие профессионалы считают, что
именно с помощью Hadoop удастся расширить аналитические возможности их
хранилищ данных. К сожалению, производительность Hadoop при обработке
конкретных запросов и использовании SQL-аналитики зачастую оказывается
намного ниже, чем производительность колоночной платформы с МРР,
применяемой для анализа Больших данных. Кроме того, поддержка на Hadoop
запросов, применяемых обычно к хранилищам данных, требует овладения
новыми навыками, приобретения нового программного обеспечения, а во
многих случаях и найма новых сотрудников.
С другой стороны, Hadoop при обработке аналитических запросов
предоставляет ряд очевидных преимуществ. Создавая озера данных,
эта платформа позволяет снижать затраты, реализуя несколько уровней
хранения данных (редко используемая информация размещается отдельно
от той, что запрашивается часто). Hadoop помогает исследовать данные и
определять их ценность для бизнеса. С помощью ETL-инструментов она
может агрегировать и подчищать данные, поступающие в организацию.
Hadoop позволяет загружать, хранить и обрабатывать структурированные,
полуструктурированные и мультиструктурированные данные, причем с
небольшими затратами. Реляционная СУБД на такое не способна.
Вам может потребоваться все сразу: воспользоваться плюсами Hadoop
и избежать снижения производительности и возможных сбоев, то есть
аналитическая платформа должна обеспечивать использование Hadoop
в качестве экономичного решения, чтобы долго хранить данные и
легко управлять ими, ускорив при этом выполнение как обычных, так и
аналитических запросов к хранилищу данных.
6. Брошюра Стр. 6
#5: Оказание помощи аналитикам
Компании уделяют все более серьезное внимание работе специалистов
по исследованию данных, включая их в штат своих ИТ-подразделений,
и платформа для анализа Больших данных призвана помочь им в двух
ключевых областях. Во-первых, новое поколение специалистов по данным
применяет для предиктивной аналитики такие инструменты, как Java, Python
и R. Аналитическая СУБД, с которой они работают, должна поддерживать и
ускорять выполнение таких запросов предиктивной аналитики.
В-вторых, с ее помощью работа аналитика увязывается с бизнес-целями. В
наши дни аналитик обычно начинает свою карьеру с должности специалиста
по статистической обработке, плохо разбирающегося в стратегических целях
бизнеса. Поскольку из-за этого его выводы могут быть неполными, неточными
или нерелевантными с точки зрения бизнес-результатов, сотрудники профильных
подразделений прибегают к помощи таких специалистов только в особых
случаях. Быстрая, эффективная, удобная и широко используемая платформа
для анализа Больших данных позволит решить извечную проблему непонимания
между бизнесом и ИТ.
#6: Наличие функций расширенной аналитики
В ряде случаев требуется углубленное знание функций аналитики SQL,
встроенных в ваше решение для работы с Большими данными. Вы должны
понимать, какую именно аналитику SQL можно применять к конкретным
массивам данных, чтобы получить адекватные результаты.
Например, если необходимо проанализировать данные, поступающие от
устройств (скажем, Интернета вещей), вам понадобятся такие функции,
как анализ временных рядов или анализ разрывов. В случае их отсутствия
придется потратить время на подготовку данных или написание специального
кода.
Для многих организаций все большее значение приобретает предиктивный
анализ. Платформа для анализа Больших данных должна не только мгновенно
подготавливать и загружать информацию, но и строить предиктивные модели
и продвинутые алгоритмы и затем развертывать их, чтобы использовать для
подсчетов с применением средств СУБД.
Эти и другие функции позволят ускорить масштабируемые в широком
диапазоне возможности машинного обучения, статистического анализа и
построения диаграмм, а аналитики смогут при этом использовать привычные
статистические пакеты и языки.
7. Брошюра Стр. 7
HPE Vertica: уникальная по эффективности
платформа для анализа Больших данных
HPE Vertica — едва ли не единственное решение, отвечающее всем
перечисленным критериям. Эта платформа гарантирует скорость,
масштабируемость, удобство использования, а также открытость, отвечающие
практически всем требованиям к аналитическим системам, которые выдвигает
современный бизнес. Она обеспечивает непревзойденную скорость (выполнение
запросов в 50–1000 раз быстрее традиционных СУБД), масштабируемость
до петабайт (хранит на каждом из серверов в 10–30 раз больше данных, чем
традиционные СУБД), открытость и простоту (можно использовать любые
средства BI и ETL, а также Hadoop) — и всё это с гораздо более низкими
затратами, чем при использовании традиционных хранилищ данных.
Не менее важно и то, что HPE Vertica — не точечное решение, а полноценная
аналитическая платформа. Она предоставляет широкий спектр возможностей —
например, консоль управления для отслеживания работы кластеров Vertica, на
которой отображаются схема кластера, его узлы, состояние сети и подробные
диаграммы. Для аварийного восстановления поврежденной или неполной
базы данных или отдельных ее объектов можно применять полное резервное
копирование. Эти и другие функции, которые при использовании менее зрелого
решения пришлось бы собирать по отдельности, включены в нашу платформу
изначально.
HPE Vertica дополняет и расширяет
возможности Hadoop. Это экономичный
масштабируемый инструмент
традиционной и расширенной
аналитики, а также расширяемая
платформа для управления данными,
помогающая извлечь максимум выгоды
из Hadoop и других современных
решений.
HPE Vertica может отправлять прямые
запросы к данным, хранящимся в Hadoop.