Максимум полезной информации для банков и МФО по управлению кредитными рисками. Уникальный кейс по описанию природы рисков и способов их оценки. Описана вся необходимая аналитика для разработки собственного кредитного конвейера. Есть решение на базе Deductor.
Выступление по презентации - https://www.youtube.com/watch?v=raDDegn5d8o
3. Не существует одного способа управления
всеми рисками.
Для каждой категории рисков:
1. Формализовать логику оценки
2. Оценить риск количественно
3. Встроить в бизнес-процесс
Оценка рисков
6. Поле Значение Ошибка
Имя Cергей Первая буква - латинская
Фамилия Петрович Значение из другого поля
Город Мсква Опечатка
Доходы 100 руб. Подозрительная сумма
Телефон 000-00-01 Несуществующий номер
Качество данных: примеры
7. Соответствие
шаблонам
Сайт, e-mail
Телефон
Номер документа
Почтовый Индекс
Оценка
корректности
Отсутствие опечаток
Фамилия, имя,
отчество найдены в
справочнике
Адрес есть в
КЛАДР/ФИАС
Нет перестановок в
полях
Нет дублей и
противоречий
Отсутствие полных
дублей
Отсутствие
противоречивых
записей
Анализ «похожих»
записей
Соответствие
ожиданиям
Зарплата
Стаж работы
Код телефона и город
E-mail и фамилия
Качество данных: проверки
8. Качество данных: сервис очистки
Система
выдачи
кредитов
Deductor
Data Quality-
веб-сервис
очистки и
обогащения
данных
Грязные
данные
Чистые,
обогащенные
данные
11. Веб-сервис интеграции с БКИ
Полнота данных: работа с БКИ
Система выдачи кредитов
Подготовка
данных
Разбор
ответа
Запрос в
БКИ
Решение
Анкета клиента
Отказать / Продолжить
работу
12. Федеральная
налоговая
служба
- 4 млн. предприятий
- 4 млн. ИП
Федеральная
служба гос.
статистики
- 7 млн. предприятий
- 4 млн. ИП
Высший
арбитражный суд
- 3 млн. документов
Система анализа
рынков и
компаний
- 20 источников данных
- 3 страны
Полнота данных: госорганы
13. 53 млн. 43 млн.
25 млн. 12 млн.
Много
данных
•Окружение
•Интересы
•Поведение
Много
мусора
•Нет доверия
•Нет связности
•95-99% - шум
Полнота данных: соцсети
15. Средний размер потерь от мошеннического
кредита*
~100 000 р.
*Эквифакс 2012 г.
Антифрод: проблема
16. Антифрод: внешние сервисы
Заемщик
Банк 1
Банк 2
Ваш Банк
National Hunter
Equifax FPS
Факт обращения
+
результат проверки
службой
безопасности
Предыдущие
обращения и
проверки
17. Антифрод: схема работы
Интеграция с внешними антифрод-сервисами
Система выдачи кредитов
Подготовка
данных
Проверяемые
правила
Запрос к
сервису
Матрица
принятия
решения
Правило 1
Правило 2
Правило 3
Анкета клиента Мошенник / Не мошенник
18. Данные полные
• Вся информация по
заемщику
• Сложные стратегии
оценки
• Отсутствие платы за
обращение к сервису
Данных мало
• Только свои
заемщики
• Сложно оценивать
впервые
обратившихся
Антифрод: внутренние данные
19. Тип Пример
Криминал Судимость, розыск
Спецучет Наркоман, психически больной
Документы Утерянный/недействительный паспорт
Правонарушения Штрафы, алименты, нарушение ПДД
Подставное лицо Зарегистрировано много фирм
Контакты Адресная яма, мошеннический телефон
Работодатель Банкротство/ликвидация предприятия
Черные списки: негатив
20. Баз негатива много, источники разные,
следовательно:
1. Информация разнородна
2. По разному структурирована
3. Имеет различную значимость
4. Содержит ошибки
Черные списки: проблема
23. Службы безопасности банков обмениваются
неструктурированной информацией о негативе:
Списки мошенников
Справки из правоохранительных органов
Выписки из документов
Электронные письма
Базы данных
Формат произвольный: Word, Excel, PDF…
Межбанковский обмен
24. Межбанковский обмен: проверки
Веб-сервис поиска по неструктурированным данным
Система выдачи кредитов
Поиск про проиндексированным документам
Высокий риск Низкий риск
Анкета клиента Найденный негатив
26. Документы
• Удостоверение личности
• Гражданство
• Место регистрации
Работа
• Место работы
• Отрасль экономики
• Стаж работы
• Специальность
Доходы
• Справка 2-НДФЛ
• Долговая нагрузка
• Дополнительные доходы
Бизнес-правила
28. Подготовка
скоринговой выборки
Анализ жизненных
циклов счетов
Сэмплинг
Двумерный анализ –
конечные классы
(одобренные)
Моделирование
(предварительная
карта)
Добавление в выборку
отказов (Reject
Inference)
Перестройка карт с
учетом отказов
(окончательная карта)
Сравнение качества
карт и выбор
оптимальной
Тестовая эксплуатация
и мониторинг
Скоринг: разработка карты
33. Выгода Основание
Регламент Гарантии выполнения
Время Принятие решения за 2-3 минуты
Персонал Система - «Черный ящик»
Портфель Количественная оценка рисков
Гибкость Логика в аналитическим блоке
Промышленное решение
Это стандартные методики, для работы которых важен только порядок, в котором модель выстроила счета, и знание метки плохой/хороший для каждого из них. Принципы расчета Gini и K-S схожи: очередь заемщиков перебирается, начиная от самых плохих до самых хороших, при этом на каждом шаге вычисляются:
Доля Ag хороших заемщиков, оказавшихся в очереди хуже данного, среди всех хороших;
Доля Ab плохих заемщиков, оказавшихся в очереди хуже данного, среди всех плохих.
Статистика K-S является максимальной разницей Ab-Ag по всем точкам очереди.
Gini = 2*AUC-1, где AUC – площадь под ROC-кривой.
Чем больше Gini и KS, тем лучше прогностическая сила скоринговой карты.