Особенности ETL — инструмента pentaho data integrator. Опыт КРОККРОКСеминар Центра компетенции компании КРОК «Построение единой информационной среды как средство поддержания стабильности бизнеса в условиях кризиса».
Подробнее о мероприятии http://www.croc.ru/action/detail/1602/
Презентация Юрия Кудрявцева, эксперта направления BI департамента информационных систем компании КРОК
Реализация bi-системы собственными силами или как снизить стоимость проекта. ...КРОКIV Форум Business Intelligence 2009.
Подробнее о мероприятии http://www.croc.ru/action/partners/detail/1360/
Презентация Александра Клименкова, Руководителя направления BI
Основы OLAP. Вебинар Workaround в SoftengiSoftengi 16 декабря 2014 года сообщество Workaround в Softengi провело первый вебинар "Основы OLAP", докладчиком которого был Юрий Марков, архитектор решений с 15-летним опытом в ИТ.
О чем:
Данные != Информация
Хранилища информации как источник информации для принятия решений
Архитектура хранилищ данных
Реализация OLAP на примере Microsoft SQL Server
Для кого: разработчики баз данных, аналитики, IT-специалисты.
Организатор: семинары Workaround в Softengi. Стартовали в феврале 2014 года как закрытые Архитектурные семинары для сотрудников (https://www.youtube.com/user/softengi ). В октябре 2014 года стали открытыми семинарами Workaround (он же «костыль» или обходной прием) для разработчиков и архитекторов ПО.
Olap и oltp технологииIlya TernovoyThis presentation was created by me for the course of Information technology in 2012. It contains detailed description of OLAP technology and basic description of OLTP technology.
Обеспечение централизованной обработки документации в ОЦО группы «ФосАгро»Корпорация ЭЛАР Автоматизация процесса обработки финансовых и кадровых документов и обеспечение оперативного доступа к ним. Консолидированное хранилище скан-образов и электронных документов. Интеграция с корпоративными учетными системами (Oracle E-business Suite). Оценка проследить эффективности учетных процессов. Подбор отчетных документов. Результаты и преимущества.
презентация 1с платформа 8.3.6 клHelen KoptevaДанная презентация была представлена на вебинаре «1С: Платформа 8.3.6, новые возможности», который провел сотрудник компании "Кодерлайн" Евгений АВЕРКИН, сертифицированный специалист по платформе «1С».
"PostgreSQL для разработчиков приложений", Павел Лузанов, (Постгрес Профессио...Badoo DevelopmentDevConf 2016
"PostgreSQL для разработчиков приложений", Павел Лузанов, (Постгрес Профессиональный)
Что нужно знать разработчику приложений о базах данных вообще и PostgreSQL в частности? Может быть достаточно основ SQL? А может во всём положиться на ORM?
Несмотря на кажущуюся простоту работы с базами данных, для качественной реализации приложений необходимы знания по самому широкому кругу тем:
- Нормализация и денормализация данных
- Типы данных и ограничения целостности
- Хранимые процедуры и триггеры
- Аналитические функции и CTE
- Транзакции и уровни изоляции
- Материализованные представления и секционирование
- Типы индексов и как их использовать
- Методы доступа к таблицам и способы их соединения
- Сбор статистики и планы выполнения запросов
А нужны ли разработчикам знания об основах администрирования и архитектуре СУБД в целом? Нужно ли понимать что и для чего делает VACUUM?
Доклад в первую очередь адресован разработчикам и архитекторам приложений, но также будет интересен администраторам баз данных и всем “сочувствующим”.
АИС ЭЛАР-Архив 2017Корпорация ЭЛАР Полный перечень функций 2017 года передовой российской системы автоматизации государственных и муниципальных архивов:
- Читальный зал и стол справок
- Коннектор к ЕПГУ и ЕСИА
- Платные услуги архивов
- Прием на хранение электронных документов от организаций - источников комплектования
- RFID-учет
- Облачные конфигурации
- Создание Единых региональных систем автоматизации архивов
Алексей Андросов "Архитектура фронтенда Яндекс.Почты"YandexАлексей Андросов "Архитектура фронтенда Яндекс.Почты"
Я.Субботник в Новосибирске
О докладе:
Яндекс.Почта – это большое ajax-приложение. Из доклада вы узнаете, как работает фронтенд почты изнутри, как загружаются данные, обновляется страница и происходит взаимодействие с пользователем, какой мы используем шаблонизатор и почему, как живут самые разные приложения (Яндекс.Подписки, История общения) в рамках одной почтовой платформы.
Обзор протокола Netconf/YANG и его применение для управления услугамиCisco Russia Обзор протокола Netconf/YANG и его применение для управления услугами
Алексей Андросов "Архитектура фронтенда Яндекс.Почты"Yandex15 октября 2011, Я.Субботник в Алматы
Алексей Андросов "Архитектура фронтенда Яндекс.Почты"
О докладе:
Яндекс.Почта сейчас – это большое ajax-приложение. Из доклада вы узнаете, как работает фронтенд почты изнутри, как загружаются данные, обновляется страница и происходит взаимодействие с пользователем, какой мы используем шаблонизатор и почему, как живут самые разные приложения (Яндекс.Подписки, История общения) в рамках одной почтовой платформы.
SharePoint и внешние данныеVitaly Baum«Тонкости взаимоотношений SharePoint и внешних данных».
В докладе будет рассказано о встроенных возможностях SharePoint по получению и обработке данных из существующей корпоративной среды по открытым, а так же проприетарным протоколам взаимодействия.
В том числе будет рассказано об отраслевых стандартах взаимодействия Enterprise Content Management систем и существующей их поддержке на платформе SharePoint.
Будут продемонстрированы способы построения интеграционных приложений, а так же принципы унификации работы «SharePoint as Services».
Уровень сложности: 200
Видео с конференции доступно здесь: http://vimeo.com/12043860
"PostgreSQL для разработчиков приложений", Павел Лузанов, (Постгрес Профессио...Badoo DevelopmentDevConf 2016
"PostgreSQL для разработчиков приложений", Павел Лузанов, (Постгрес Профессиональный)
Что нужно знать разработчику приложений о базах данных вообще и PostgreSQL в частности? Может быть достаточно основ SQL? А может во всём положиться на ORM?
Несмотря на кажущуюся простоту работы с базами данных, для качественной реализации приложений необходимы знания по самому широкому кругу тем:
- Нормализация и денормализация данных
- Типы данных и ограничения целостности
- Хранимые процедуры и триггеры
- Аналитические функции и CTE
- Транзакции и уровни изоляции
- Материализованные представления и секционирование
- Типы индексов и как их использовать
- Методы доступа к таблицам и способы их соединения
- Сбор статистики и планы выполнения запросов
А нужны ли разработчикам знания об основах администрирования и архитектуре СУБД в целом? Нужно ли понимать что и для чего делает VACUUM?
Доклад в первую очередь адресован разработчикам и архитекторам приложений, но также будет интересен администраторам баз данных и всем “сочувствующим”.
АИС ЭЛАР-Архив 2017Корпорация ЭЛАР Полный перечень функций 2017 года передовой российской системы автоматизации государственных и муниципальных архивов:
- Читальный зал и стол справок
- Коннектор к ЕПГУ и ЕСИА
- Платные услуги архивов
- Прием на хранение электронных документов от организаций - источников комплектования
- RFID-учет
- Облачные конфигурации
- Создание Единых региональных систем автоматизации архивов
Алексей Андросов "Архитектура фронтенда Яндекс.Почты"YandexАлексей Андросов "Архитектура фронтенда Яндекс.Почты"
Я.Субботник в Новосибирске
О докладе:
Яндекс.Почта – это большое ajax-приложение. Из доклада вы узнаете, как работает фронтенд почты изнутри, как загружаются данные, обновляется страница и происходит взаимодействие с пользователем, какой мы используем шаблонизатор и почему, как живут самые разные приложения (Яндекс.Подписки, История общения) в рамках одной почтовой платформы.
Обзор протокола Netconf/YANG и его применение для управления услугамиCisco Russia Обзор протокола Netconf/YANG и его применение для управления услугами
Алексей Андросов "Архитектура фронтенда Яндекс.Почты"Yandex15 октября 2011, Я.Субботник в Алматы
Алексей Андросов "Архитектура фронтенда Яндекс.Почты"
О докладе:
Яндекс.Почта сейчас – это большое ajax-приложение. Из доклада вы узнаете, как работает фронтенд почты изнутри, как загружаются данные, обновляется страница и происходит взаимодействие с пользователем, какой мы используем шаблонизатор и почему, как живут самые разные приложения (Яндекс.Подписки, История общения) в рамках одной почтовой платформы.
SharePoint и внешние данныеVitaly Baum«Тонкости взаимоотношений SharePoint и внешних данных».
В докладе будет рассказано о встроенных возможностях SharePoint по получению и обработке данных из существующей корпоративной среды по открытым, а так же проприетарным протоколам взаимодействия.
В том числе будет рассказано об отраслевых стандартах взаимодействия Enterprise Content Management систем и существующей их поддержке на платформе SharePoint.
Будут продемонстрированы способы построения интеграционных приложений, а так же принципы унификации работы «SharePoint as Services».
Уровень сложности: 200
Видео с конференции доступно здесь: http://vimeo.com/12043860
ProveIT. ETL как конструктор алгоритмов обработки данных.
1. Техническая конференция
18 октября 2014 г., г. Казань
ETL как конструктор алгоритмов обработки данных
Иван Пестряков «БАРС Груп», г. Казань
2. Повторяемость кода
Импорт данных
Чтение из БД Чтение из Web-сервиса … Разбор XML Разбор JSON Разбор Excel … Формирование JSON Формирование Excel Формирование XML …. Запись в БД Формирование файла …
Экспорт данных
Конвертации
Трансформации
Пакетные операции
3. Цепочка обработки (Block, Pipeline)
Чтение файла
Разбор Excel
Фильтрация
Отправка в web- сервис
Оповещение оператора
•Повторное использование кода блоков
•Независимость от проектной области
•Совместимость блоков по входам/выходам
Запись в таблицу БД
Формирование JSON
4. Business Intelligence
Business Intelligence или BI бизнес-анализ, бизнес-аналитика.
Это инструменты, используемые для преобразования, хранения, анализа, моделирования, доставки и трассировки информации.
ETL методика и инструмент интеграции данных
5. Инструменты ETL
Extract
Transform
Load
SAS Data Integration Server IBM WebSphere DataStage SAP Data Integrator Informatica PowerCenter Oracle Data Integrator Pentaho JasperETL AlphaBI
процедуры извлечения записи из источников данных и подготовка их к процессу преобразования
преобразование структуры данных;
агрегирование данных;
сортировка/фильтрация;
очистка данных
создание новых данных;
перенос данных в структуру хранилища данных, добавление и обновление данных
•Пакетная обработка
•Репозитарий ETL-процессов
•Метаданные
•Циклические загрузки
•~50% трудозатрат по проекту
6. •Direct3D
•DirectShow
•ASP.NET
Конвейер
•Все принципы SOLID
•Логическая изоляция блоков
•Инкапсуляция
•Совместимость
Блок
Конвейер
•FIFO
•Передача управления
•Передача метаданных
•Контроль ошибок
•Хранимый объект
8. Входы/выходы блоков
Чтение файла с диска
Разбор файла Excel
Фильтр
Накопитель
Формирование JSON
Отправка потока в Web-сервис
9. Метаданные
•Некоторые блоки являются поставщиками метаданных
•Остальные блоки пробрасывают или изменяют метаданные
•Любой блок может запросить метаданные у конвейера
•Метаданные могут храниться внутри блоков
Код поля
Наименование
Тип данных
userLogin
Логин
String
userName
Имя
String
isActive
Активен
Boolean
registrationDate
Дата регистрации
DateTime
11. Реализация на C#
Step<I, O, M>
•Один блок = один класс С#
•Возможность расширения библиотеки блоков через IoC
•Нет зависимостей от бизнес-логики проекта
•Служебные классы – Pipeline, Logger, Storage
•Сериализованные ETL-процессы хранятся в MongoDB
12. Классы блоков
Step<I, O, M>
Input – набор входов Output – набор выходов Metadata – строка метаданных
[Step("Json", "Извлечение (Extract)")] public class JsonExtract : IStep, BaseStep<StreamStepData, RowStepData, MetaField>
public class StreamStepData { [StepConnectionAttribute(Name = "Поток")] public Stream Stream { get; set; } }
14. Сериализация
•Все публичные свойства класса блока
•Набор блоков и связей
•Общие свойства конвейера
•Настройки планировщика запуска
•Всё в одном документе MongoDB
15. Конструктор ETL-процесса
•Настройка ETL-процессов без участия разработчика
•Разработчик сфокусирован на расширении функционала и библиотеки блоков, а не на прикладных задачах
•Накопление базы шаблонов – передача знаний
•Развитие архитектуры программной платформы, а не накопление прикладного кода
16. Web UI конструктора
•Визуальная настройка связей и блоков
•Автоматический редактор блока по public-свойствам класса
•Предпросмотр данных на любом шаге
•Используется аналитиками в своей повседневной деятельности