Презентация пилотного проекта КРОК по прогнозированию пассажиропотоков для компании "Центральная пригородная пассажирская компания" на технологиях EMC GreenPlum (Pivotal) и RapidMiner, которая была представлена на Четвертом Российском форуме Big Data 2015
1 of 25
More Related Content
Пилотный проект КРОК с использованием технологий BigData для ЦППК
1. ОТ КОЛИЧЕСТВА К КАЧЕСТВУ :
Аналитика данных и повышение эффективности
пассажирских перевозок
Чеботарев Роман
Архитектор аналитических решений
КРОК
Гараничев Андрей
Руководитель проектов
ЦППК
2. 2
СОДЕРЖАНИЕ
1. Место BigData в пассажирских перевозках
2. Моделирование и прогнозирование пассажиропотока
3. Контроль за безбилетными пассажирами
4. Оптимизация работы кассовых узлов
4. 4
ОАО «ЦЕНТРАЛЬНАЯ ППК» В ЦИФРАХ
> 1,6 млн
пассажиров
> 1300
ниток расписания
ЦППК – это:
• 60% пригородных перевозок РФ
• Более 1500 остановочных пунктов
• 617 млн вагоно-километров
• 583 млн пассажиров в год
1 день ЦППК
5. 5
СИТУАЦИОННО-АНАЛИТИЧЕСКИЙ ЦЕНТР ЦППК
• Мониторинг показателей текущей деятельности ЦППК
• Оперативная работа (подсистема работы с инцидентами)
• Сводки и отчеты
• Прогнозы ключевых показателей деятельности
7. 7
ЧТО ТАКОЕ «ПАССАЖИРОПОТОК»
С точки зрения аналитики пассажиропоток – это ситуация на пригородных
электричках в любой момент времени:
• Сколько людей едет в каждой электричке?
• Откуда и куда они едут?
• Сколько людей ждут на остановочном пункте?
• Куда они хотят поехать?
8. 8
МОДЕЛЬ ПАССАЖИРОПОТОКА
Входящий поток
Выходящий поток
Центр Область
Остановочный
пункт
Модель пассажиропотока = эти 4 показателя с дискретностью в 1 минуту по всем
остановочным пунктам ЦППК + помним «путь» каждого пассажира
9. 9
КАК СЧИТАТЬ ПАССАЖИРОПОТОК
- По данным турникетов?
- Нет!
Турникеты охватывают далеко не все остановочные
пункты, т.е. позволяют оценить только часть
пассажиропотока
- А как тогда составить модель?
- По данным билетов, расписанию движения
поездов, проверяя модель данными турникетов там,
где это возможно.
- Использовать существующие объемы данных для
уточнения и повышения точности модели.
10. 10
МОДЕЛИРУЕМ ПАССАЖИРОПОТОК #1
Используем разовые билеты для восстановления профиля движения
пассажиров:
• Достаточно точно известно время отправления
• Почти 40% пассажиропотока
По данным о ближайшем поезде, соответствующем билету, определяем
время прибытия
11. 11
МОДЕЛИРУЕМ ПАССАЖИРОПОТОК #2
Определяем время обратной поездки для билетов «туда-обратно» и
абонементов:
• Время покупки
• Восстановленные профили станций
• Некоторые «демографические» данные и заключения
Аналогичным способом определяем время поездок в другие дни.
12. 12
МОДЕЛИРУЕМ ПАССАЖИРОПОТОК #3
Корректировка с учетом турникетных данных:
• В среднем менее 6%, пиковая зафиксированная разница – 14,2%
• Выполняется опционально, т.к. есть «зайцы»
«Рассадка» пассажиров по поездам в соответствии с билетами:
• Определение пассажиропотока в разрезе поездов
• Корректировка при дисбалансе вход/выход
‒ Корректировка не требуется для 19% поездов
‒ Только на 3,5% поездов дисбаланс составляет более 15 человек
13. 13
ПИЛОТНАЯ ЗОНА – КИЕВСКОЕ НАПРАВЛЕНИЕ
54
остановочных пункта
~ 66,5 тыс.
проданных билетов
~ 12 тыс.
проходов через турникеты
~ 420
ниток расписания
ЕЖЕДНЕВНО
Москва
Калуга
Наро-Фоминск
Апрелевка
Малоярославец
15. 15
ПОЧЕМУ BIGDATA (MPP-СУБД) ?
Не устраивала производительность существующих СУБД и средств
аналитики – низкая скорость проведения сложных статистических расчетов
Обновление модели пассажиропотока:
• Классические СУБД – более 9 часов
• BigData-подход – около 2 часов, хорошая масштабируемость
• И это без оптимизаций и «тюнинга» планировщиков!
Можем быстро обновлять модель – учесть прошедший день за ночь!
22. 22
ПОДСЧЕТ БЕЗБИЛЕТНИКОВ
Организуются меры по пресечению безбилетного проезда (наряды
полиции, ЧОП и т.п.), контролируется эффективность этих мер
При помощи установленных камер и видеоаналитики
фиксируются факты «нештатного» проникновения или
покидания платформы.
В соответствии с ближайшим поездом рассчитывается
средняя «стоимость» безбилетного пассажира.
24. 24
ПОДСЧЕТ КОЛИЧЕСТВА ЛЮДЕЙ НА КАССАХ
Подсистема используется для:
• Оперативного управления кассовыми узлами
• Анализа и контроля качества обслуживания
При помощи видеоаналитики в автоматическом режиме
осуществляется подсчет количества людей в очередях
При наличии очереди в течении 10 минут формируется
т.н. инцидент
25. 25
111033, Москва, ул. Волочаевская, д.5, корп.1
www.croc.ru
• По данным отчетов IDC, КРОК — лидер
по услугам системной интеграции (2002-2014)
• В десятке крупнейших ИТ-компаний России (РИА Рейтинг,
«Коммерсантъ – Деньги», Cnews, 2014) в пятерке крупнейших
консалтинговых компаний (РА Эксперт, 2014)
• Реализует несколько тысяч проектов в год
• Сертификат качества Р ИСО 9001-2008
• КРОК — крупнейший российский партнер HP, Fujitsu, EMC,
Cisco Systems, Avaya, Microsoft, Oracle
СПАСИБО ЗА ВНИМАНИЕ!
Гараничев Андрей
Руководитель проектов ЦППК
agaranichev@central-ppk.ru
+7 499 266-02-65 # 7414
Чеботарев Роман
Архитектор аналитических решений
RChebotarev@croc.ru
+7 495 974-22-74 # 7044