ݺߣ

ݺߣShare a Scribd company logo
Анализ данных о
местоположении клиентов
Provectus
Казань 2016
Основные задачи
• Понять специфику клиентов определенного бизнеса:
• Что их привлекает?
• Какие тренды?
• Где размещать рекламу?
• Как развиваться дальше?
• Кто конкуренты? Что с ними происходит во времени?
• Оценить влияние рекламы
• Убедиться в качестве и полноте данных.
Данные
• Сигналы с устройств (местоположение, время, идентификатор
устройства)
• Профили владельцев устройств
• Справочник адресов
• Справочник бизнесов
• Географические данные (штаты, DMA, дороги, и т.д.)
• Данные переписи населения
• Данные от партнеров
• И т.д.
Примеры
• Стандартные отчеты
• Cadillac custom analysis
• Profiles index
• Mariano’s custom analysis
• Double Geocoding with Google Places API
Смещение данных
00%
10%
20%
30%
40%
50%
60%
70%
Male Female
Gender
Profiles
Census
0%
5%
10%
15%
20%
25%
30%
35%
40%
45%
50%
Age 18-24 Age 25-34 Age 35-44 Age 45-54 Age 55-64 Age 65+
Age distribution
Profiles
Census
Смещение данных в
пользу более активных
соц.-дем. групп
пользователей
Проблемы
• Удаление «выбросов»;
• Propensity Score Matching для уточнения всевозможных
результатов с использованием контрольных групп
(демографические профили, характеристика клиентов по типам
посещаемых мест);
• Автоматизация double geocoding;
• Определение временных трендов посещаемости с учетом
изменений в объемах сигналов

More Related Content

Роман Степанов: "Анализ данных о местоположении клиентов"

  • 1. Анализ данных о местоположении клиентов Provectus Казань 2016
  • 2. Основные задачи • Понять специфику клиентов определенного бизнеса: • Что их привлекает? • Какие тренды? • Где размещать рекламу? • Как развиваться дальше? • Кто конкуренты? Что с ними происходит во времени? • Оценить влияние рекламы • Убедиться в качестве и полноте данных.
  • 3. Данные • Сигналы с устройств (местоположение, время, идентификатор устройства) • Профили владельцев устройств • Справочник адресов • Справочник бизнесов • Географические данные (штаты, DMA, дороги, и т.д.) • Данные переписи населения • Данные от партнеров • И т.д.
  • 4. Примеры • Стандартные отчеты • Cadillac custom analysis • Profiles index • Mariano’s custom analysis • Double Geocoding with Google Places API
  • 5. Смещение данных 00% 10% 20% 30% 40% 50% 60% 70% Male Female Gender Profiles Census 0% 5% 10% 15% 20% 25% 30% 35% 40% 45% 50% Age 18-24 Age 25-34 Age 35-44 Age 45-54 Age 55-64 Age 65+ Age distribution Profiles Census Смещение данных в пользу более активных соц.-дем. групп пользователей
  • 6. Проблемы • Удаление «выбросов»; • Propensity Score Matching для уточнения всевозможных результатов с использованием контрольных групп (демографические профили, характеристика клиентов по типам посещаемых мест); • Автоматизация double geocoding; • Определение временных трендов посещаемости с учетом изменений в объемах сигналов