ݺߣ

ݺߣShare a Scribd company logo
ОТ КОЛИЧЕСТВА К КАЧЕСТВУ :
Аналитика данных и повышение эффективности
пассажирских перевозок
Чеботарев Роман
Архитектор аналитических решений
КРОК
Гараничев Андрей
Руководитель проектов
ЦППК
2
СОДЕРЖАНИЕ
1. Место BigData в пассажирских перевозках
2. Моделирование и прогнозирование пассажиропотока
3. Контроль за безбилетными пассажирами
4. Оптимизация работы кассовых узлов
3
BIGDATA И ПАССАЖИРСКИЕ ПЕРЕВОЗКИ
4
ОАО «ЦЕНТРАЛЬНАЯ ППК» В ЦИФРАХ
> 1,6 млн
пассажиров
> 1300
ниток расписания
ЦППК – это:
• 60% пригородных перевозок РФ
• Более 1500 остановочных пунктов
• 617 млн вагоно-километров
• 583 млн пассажиров в год
1 день ЦППК
5
СИТУАЦИОННО-АНАЛИТИЧЕСКИЙ ЦЕНТР ЦППК
• Мониторинг показателей текущей деятельности ЦППК
• Оперативная работа (подсистема работы с инцидентами)
• Сводки и отчеты
• Прогнозы ключевых показателей деятельности
6
МОДЕЛИРОВАНИЕ ПАССАЖИРОПОТОКА
7
ЧТО ТАКОЕ «ПАССАЖИРОПОТОК»
С точки зрения аналитики пассажиропоток – это ситуация на пригородных
электричках в любой момент времени:
• Сколько людей едет в каждой электричке?
• Откуда и куда они едут?
• Сколько людей ждут на остановочном пункте?
• Куда они хотят поехать?
8
МОДЕЛЬ ПАССАЖИРОПОТОКА
Входящий поток
Выходящий поток
Центр Область
Остановочный
пункт
Модель пассажиропотока = эти 4 показателя с дискретностью в 1 минуту по всем
остановочным пунктам ЦППК + помним «путь» каждого пассажира
9
КАК СЧИТАТЬ ПАССАЖИРОПОТОК
- По данным турникетов?
- Нет!
Турникеты охватывают далеко не все остановочные
пункты, т.е. позволяют оценить только часть
пассажиропотока
- А как тогда составить модель?
- По данным билетов, расписанию движения
поездов, проверяя модель данными турникетов там,
где это возможно.
- Использовать существующие объемы данных для
уточнения и повышения точности модели.
10
МОДЕЛИРУЕМ ПАССАЖИРОПОТОК #1
Используем разовые билеты для восстановления профиля движения
пассажиров:
• Достаточно точно известно время отправления
• Почти 40% пассажиропотока
По данным о ближайшем поезде, соответствующем билету, определяем
время прибытия
11
МОДЕЛИРУЕМ ПАССАЖИРОПОТОК #2
Определяем время обратной поездки для билетов «туда-обратно» и
абонементов:
• Время покупки
• Восстановленные профили станций
• Некоторые «демографические» данные и заключения
Аналогичным способом определяем время поездок в другие дни.
12
МОДЕЛИРУЕМ ПАССАЖИРОПОТОК #3
Корректировка с учетом турникетных данных:
• В среднем менее 6%, пиковая зафиксированная разница – 14,2%
• Выполняется опционально, т.к. есть «зайцы»
«Рассадка» пассажиров по поездам в соответствии с билетами:
• Определение пассажиропотока в разрезе поездов
• Корректировка при дисбалансе вход/выход
‒ Корректировка не требуется для 19% поездов
‒ Только на 3,5% поездов дисбаланс составляет более 15 человек
13
ПИЛОТНАЯ ЗОНА – КИЕВСКОЕ НАПРАВЛЕНИЕ
54
остановочных пункта
~ 66,5 тыс.
проданных билетов
~ 12 тыс.
проходов через турникеты
~ 420
ниток расписания
ЕЖЕДНЕВНО
Москва
Калуга
Наро-Фоминск
Апрелевка
Малоярославец
14
ТЕХНОЛОГИЧЕСКИЙ СТЕК
Хранилища данных
Data Mining (анализ, моделирование и прогнозирование)
15
ПОЧЕМУ BIGDATA (MPP-СУБД) ?
Не устраивала производительность существующих СУБД и средств
аналитики – низкая скорость проведения сложных статистических расчетов
Обновление модели пассажиропотока:
• Классические СУБД – более 9 часов
• BigData-подход – около 2 часов, хорошая масштабируемость
• И это без оптимизаций и «тюнинга» планировщиков!
Можем быстро обновлять модель – учесть прошедший день за ночь!
16
РЕЗУЛЬТАТЫ #1
Населенность:
• любого поезда
• любой станции
• в любой момент времени
17
РЕЗУЛЬТАТЫ #2
Сколько пассажиров необходимо вывезти альтернативными видами транспорта
при блокировке движения электропоездов?
18
РЕЗУЛЬТАТЫ #3
19
РЕЗУЛЬТАТЫ #4
Пиковая населенность поездов, 2 декабря 2014
20
РЕЗУЛЬТАТЫ #5
21
ПОДСЧЕТ БЕЗБИЛЕТНИКОВ
22
ПОДСЧЕТ БЕЗБИЛЕТНИКОВ
Организуются меры по пресечению безбилетного проезда (наряды
полиции, ЧОП и т.п.), контролируется эффективность этих мер
При помощи установленных камер и видеоаналитики
фиксируются факты «нештатного» проникновения или
покидания платформы.
В соответствии с ближайшим поездом рассчитывается
средняя «стоимость» безбилетного пассажира.
23
ОПТИМИЗАЦИЯ РАБОТЫ КАСС
24
ПОДСЧЕТ КОЛИЧЕСТВА ЛЮДЕЙ НА КАССАХ
Подсистема используется для:
• Оперативного управления кассовыми узлами
• Анализа и контроля качества обслуживания
При помощи видеоаналитики в автоматическом режиме
осуществляется подсчет количества людей в очередях
При наличии очереди в течении 10 минут формируется
т.н. инцидент
25
111033, Москва, ул. Волочаевская, д.5, корп.1
www.croc.ru
• По данным отчетов IDC, КРОК — лидер
по услугам системной интеграции (2002-2014)
• В десятке крупнейших ИТ-компаний России (РИА Рейтинг,
«Коммерсантъ – Деньги», Cnews, 2014) в пятерке крупнейших
консалтинговых компаний (РА Эксперт, 2014)
• Реализует несколько тысяч проектов в год
• Сертификат качества Р ИСО 9001-2008
• КРОК — крупнейший российский партнер HP, Fujitsu, EMC,
Cisco Systems, Avaya, Microsoft, Oracle
СПАСИБО ЗА ВНИМАНИЕ!
Гараничев Андрей
Руководитель проектов ЦППК
agaranichev@central-ppk.ru
+7 499 266-02-65 # 7414
Чеботарев Роман
Архитектор аналитических решений
RChebotarev@croc.ru
+7 495 974-22-74 # 7044

More Related Content

Пилотный проект КРОК с использованием технологий BigData для ЦППК

  • 1. ОТ КОЛИЧЕСТВА К КАЧЕСТВУ : Аналитика данных и повышение эффективности пассажирских перевозок Чеботарев Роман Архитектор аналитических решений КРОК Гараничев Андрей Руководитель проектов ЦППК
  • 2. 2 СОДЕРЖАНИЕ 1. Место BigData в пассажирских перевозках 2. Моделирование и прогнозирование пассажиропотока 3. Контроль за безбилетными пассажирами 4. Оптимизация работы кассовых узлов
  • 4. 4 ОАО «ЦЕНТРАЛЬНАЯ ППК» В ЦИФРАХ > 1,6 млн пассажиров > 1300 ниток расписания ЦППК – это: • 60% пригородных перевозок РФ • Более 1500 остановочных пунктов • 617 млн вагоно-километров • 583 млн пассажиров в год 1 день ЦППК
  • 5. 5 СИТУАЦИОННО-АНАЛИТИЧЕСКИЙ ЦЕНТР ЦППК • Мониторинг показателей текущей деятельности ЦППК • Оперативная работа (подсистема работы с инцидентами) • Сводки и отчеты • Прогнозы ключевых показателей деятельности
  • 7. 7 ЧТО ТАКОЕ «ПАССАЖИРОПОТОК» С точки зрения аналитики пассажиропоток – это ситуация на пригородных электричках в любой момент времени: • Сколько людей едет в каждой электричке? • Откуда и куда они едут? • Сколько людей ждут на остановочном пункте? • Куда они хотят поехать?
  • 8. 8 МОДЕЛЬ ПАССАЖИРОПОТОКА Входящий поток Выходящий поток Центр Область Остановочный пункт Модель пассажиропотока = эти 4 показателя с дискретностью в 1 минуту по всем остановочным пунктам ЦППК + помним «путь» каждого пассажира
  • 9. 9 КАК СЧИТАТЬ ПАССАЖИРОПОТОК - По данным турникетов? - Нет! Турникеты охватывают далеко не все остановочные пункты, т.е. позволяют оценить только часть пассажиропотока - А как тогда составить модель? - По данным билетов, расписанию движения поездов, проверяя модель данными турникетов там, где это возможно. - Использовать существующие объемы данных для уточнения и повышения точности модели.
  • 10. 10 МОДЕЛИРУЕМ ПАССАЖИРОПОТОК #1 Используем разовые билеты для восстановления профиля движения пассажиров: • Достаточно точно известно время отправления • Почти 40% пассажиропотока По данным о ближайшем поезде, соответствующем билету, определяем время прибытия
  • 11. 11 МОДЕЛИРУЕМ ПАССАЖИРОПОТОК #2 Определяем время обратной поездки для билетов «туда-обратно» и абонементов: • Время покупки • Восстановленные профили станций • Некоторые «демографические» данные и заключения Аналогичным способом определяем время поездок в другие дни.
  • 12. 12 МОДЕЛИРУЕМ ПАССАЖИРОПОТОК #3 Корректировка с учетом турникетных данных: • В среднем менее 6%, пиковая зафиксированная разница – 14,2% • Выполняется опционально, т.к. есть «зайцы» «Рассадка» пассажиров по поездам в соответствии с билетами: • Определение пассажиропотока в разрезе поездов • Корректировка при дисбалансе вход/выход ‒ Корректировка не требуется для 19% поездов ‒ Только на 3,5% поездов дисбаланс составляет более 15 человек
  • 13. 13 ПИЛОТНАЯ ЗОНА – КИЕВСКОЕ НАПРАВЛЕНИЕ 54 остановочных пункта ~ 66,5 тыс. проданных билетов ~ 12 тыс. проходов через турникеты ~ 420 ниток расписания ЕЖЕДНЕВНО Москва Калуга Наро-Фоминск Апрелевка Малоярославец
  • 14. 14 ТЕХНОЛОГИЧЕСКИЙ СТЕК Хранилища данных Data Mining (анализ, моделирование и прогнозирование)
  • 15. 15 ПОЧЕМУ BIGDATA (MPP-СУБД) ? Не устраивала производительность существующих СУБД и средств аналитики – низкая скорость проведения сложных статистических расчетов Обновление модели пассажиропотока: • Классические СУБД – более 9 часов • BigData-подход – около 2 часов, хорошая масштабируемость • И это без оптимизаций и «тюнинга» планировщиков! Можем быстро обновлять модель – учесть прошедший день за ночь!
  • 16. 16 РЕЗУЛЬТАТЫ #1 Населенность: • любого поезда • любой станции • в любой момент времени
  • 17. 17 РЕЗУЛЬТАТЫ #2 Сколько пассажиров необходимо вывезти альтернативными видами транспорта при блокировке движения электропоездов?
  • 22. 22 ПОДСЧЕТ БЕЗБИЛЕТНИКОВ Организуются меры по пресечению безбилетного проезда (наряды полиции, ЧОП и т.п.), контролируется эффективность этих мер При помощи установленных камер и видеоаналитики фиксируются факты «нештатного» проникновения или покидания платформы. В соответствии с ближайшим поездом рассчитывается средняя «стоимость» безбилетного пассажира.
  • 24. 24 ПОДСЧЕТ КОЛИЧЕСТВА ЛЮДЕЙ НА КАССАХ Подсистема используется для: • Оперативного управления кассовыми узлами • Анализа и контроля качества обслуживания При помощи видеоаналитики в автоматическом режиме осуществляется подсчет количества людей в очередях При наличии очереди в течении 10 минут формируется т.н. инцидент
  • 25. 25 111033, Москва, ул. Волочаевская, д.5, корп.1 www.croc.ru • По данным отчетов IDC, КРОК — лидер по услугам системной интеграции (2002-2014) • В десятке крупнейших ИТ-компаний России (РИА Рейтинг, «Коммерсантъ – Деньги», Cnews, 2014) в пятерке крупнейших консалтинговых компаний (РА Эксперт, 2014) • Реализует несколько тысяч проектов в год • Сертификат качества Р ИСО 9001-2008 • КРОК — крупнейший российский партнер HP, Fujitsu, EMC, Cisco Systems, Avaya, Microsoft, Oracle СПАСИБО ЗА ВНИМАНИЕ! Гараничев Андрей Руководитель проектов ЦППК agaranichev@central-ppk.ru +7 499 266-02-65 # 7414 Чеботарев Роман Архитектор аналитических решений RChebotarev@croc.ru +7 495 974-22-74 # 7044