ݺߣ

ݺߣShare a Scribd company logo
Возможности извлечения маркетинговой 
информации в e-commerce 
Михаил Сливинский, Викимарт 
mikhail.slivinskiy@wikimart.ru 
21.10.2014, конференция “Большие данные в национальной экономике”
1. Доступность аудитории и нюансы масштабирования 
2. Высокая цена ошибки 
3. Невозможен push-маркетинг 
4. Изучение потребностей покупателей 
5. Персонализация и рекомендательные системы 
6. Возможность измерений на всех этапах 
выбора, покупки, использования 
Big data в маркетинге e-commerce проектов базируется на: 
➔ накоплении большого объема данных 
➔ извлечении неочевидных зависимостей 
Особенности маркетинга online
Собственные источники: 
➔ источники трафика, поисковые запросы и страницы входа на сайт 
➔ события в сессии на сайте 
➔ история транзакций 
➔ … 
Внешние источники: 
➔ статистика запросов к поисковым системам 
➔ браузерные плагины (neiron, similarweb, alexa, ...) 
➔ результаты поиска в поисковых системах 
➔ корпуса отзывов 
➔ ... 
Источники данных
запрос [детские велосипеды], 
Корреляция температуры воздуха и спроса 
Яндекс
Традиционно рекомендательные системы обычно строят на коллаборативной фильтрации, 
т.е. принципе: рекомендуем этому пользователю то, что интересно похожим на него 
пользователям. 
Основные недостатки: 
➔ для обучения системы нужно много пользователей ( = денег) и действий 
➔ обучаясь “с нуля” на действиях пользователей, мы снижаем их лояльность 
Нестандартные задачи: 
➔ нужен универсальный механизм измерения сходства любых двух 
товаров (“похожие товары”) 
➔ нужно построить хорошую универсальную товарную рекомендацию для 
пользователя, о котором ничего не известно (“отранжированный 
список товаров в категории”) 
Рекомендательные системы
Из анализа сессий, начавшихся с просмотра конкретного товара, 
измеряем вероятность изменения первичной потребности (в бренде, 
свойстве, цене). 
Если покупатель пришел за 40’’ ЖК телевизором Samsung, 
интересуют ли его: 
➔ 40’’ телевизоры Panasonic? 
➔ 36’’ и 42’’ телевизоры Samsung? 
➔ на 7% более дорогая модель? 
Теперь мы умеем отвечать на эти вопросы! 
Ищем похожие товары
Подробнее: “Покупатель — лучший эксперт. Ранжируем товары умно!”, Аркадий Итенберг, Михаил 
Сливинский, YaC/m 2013, https://tech.yandex.ru/events/yac/m/talks/824/ 
Ранжирование товаров 
Нужно учесть: 
➔ товар может быть новым и не 
иметь продаж 
➔ необходимо честное 
тестирование эффективности 
алгоритмов 
Результат: 
+40% отнормированного PPV
Устойчивые n-граммы из отзывов: 
➔ Функциональность: 
регулятор крепости кофе, долго держит заряд, лоток для овощей 
➔ Сочетаемость: есть все разъемы, со всеми форматами, со старыми играми 
➔ «Коммуникабельность»: 
инструкция для сборки, на русском языке, интуитивно понятный интерфейс 
➔ Условия использования: 
на мокром льду, за МКАДом, при недостаточном освещении 
➔ Опыт использования: 
лежит в руке, приятный на ощупь, совсем не шумный, крепится к стеклу 
➔ Личное: это мой первый, по сравнению с, до этого был, на мой взгляд 
➔ Экономическое: за эти деньги, соотношение цена-качество 
➔ Эмоциональное: я очень доволен, танцы с бубном, довольна как слон 
Подробнее: “Лексическая статистика в оценке качества коммерческих текстов", Ирина Борисова, Wikimart. 
http://www.ashmanov.com/arc/aiconf2012/16-borisova-ai-conf2012.pdf 
Извлечение пользовательских предпочтений
Получение трафика из поисковых систем базируется на связках “запрос-документ”. 
Для крупного проекта речь идет о сотнях тысяч и миллионах поисковых запросов. 
Очевидные источники запросов: 
➔ статистика поисковых систем 
➔ поисковые подсказки 
Неочевидные источники поисковых запросов: 
➔ сайты профильных конкурентов 
➔ маркеры в поисковой выдаче 
Возможные способа кластеризации запросов: 
➔ через частотные словари 
➔ через сходство поисковой выдачи 
439 тыс. активных 
пользователей 
33 млн. запросов в месяц 
4 терабайта хранилище 
Извлечение запросов и кластеризация
Извлечение запросов через маркеры
Отзывы: 
радионяни 
эпиляторы 
радар-детекторы 
... 
ноутбук 
шлифовальная машина 
... 
стремянки 
мангалы 
Видео: 
дровокол 
интерактивные животные 
йо-йо 
... 
сушилка для фруктов 
стиральная машина 
… 
кроссовки 
электрокотлы 
Критерий: 
Оценка востребованности типов контента
❏ Прогнозирование вероятности того, что пользователь 
сделает заказ через колл-центр 
❏ Прогнозирование вероятности отказа пользователя 
от созданного заказа 
❏ Прогнозирование вероятности ухода посетителя с 
сайта 
Наша Олимпиада: olymp.wikimart.ru
Вопросы? 
Михаил Сливинский, Викимарт 
mikhail.slivinskiy@wikimart.ru 
facebook.com/iseoexpert 
Спасибо за внимание!

More Related Content

Возможности извлечения маркетинговой информации в e-commerce

  • 1. Возможности извлечения маркетинговой информации в e-commerce Михаил Сливинский, Викимарт mikhail.slivinskiy@wikimart.ru 21.10.2014, конференция “Большие данные в национальной экономике”
  • 2. 1. Доступность аудитории и нюансы масштабирования 2. Высокая цена ошибки 3. Невозможен push-маркетинг 4. Изучение потребностей покупателей 5. Персонализация и рекомендательные системы 6. Возможность измерений на всех этапах выбора, покупки, использования Big data в маркетинге e-commerce проектов базируется на: ➔ накоплении большого объема данных ➔ извлечении неочевидных зависимостей Особенности маркетинга online
  • 3. Собственные источники: ➔ источники трафика, поисковые запросы и страницы входа на сайт ➔ события в сессии на сайте ➔ история транзакций ➔ … Внешние источники: ➔ статистика запросов к поисковым системам ➔ браузерные плагины (neiron, similarweb, alexa, ...) ➔ результаты поиска в поисковых системах ➔ корпуса отзывов ➔ ... Источники данных
  • 4. запрос [детские велосипеды], Корреляция температуры воздуха и спроса Яндекс
  • 5. Традиционно рекомендательные системы обычно строят на коллаборативной фильтрации, т.е. принципе: рекомендуем этому пользователю то, что интересно похожим на него пользователям. Основные недостатки: ➔ для обучения системы нужно много пользователей ( = денег) и действий ➔ обучаясь “с нуля” на действиях пользователей, мы снижаем их лояльность Нестандартные задачи: ➔ нужен универсальный механизм измерения сходства любых двух товаров (“похожие товары”) ➔ нужно построить хорошую универсальную товарную рекомендацию для пользователя, о котором ничего не известно (“отранжированный список товаров в категории”) Рекомендательные системы
  • 6. Из анализа сессий, начавшихся с просмотра конкретного товара, измеряем вероятность изменения первичной потребности (в бренде, свойстве, цене). Если покупатель пришел за 40’’ ЖК телевизором Samsung, интересуют ли его: ➔ 40’’ телевизоры Panasonic? ➔ 36’’ и 42’’ телевизоры Samsung? ➔ на 7% более дорогая модель? Теперь мы умеем отвечать на эти вопросы! Ищем похожие товары
  • 7. Подробнее: “Покупатель — лучший эксперт. Ранжируем товары умно!”, Аркадий Итенберг, Михаил Сливинский, YaC/m 2013, https://tech.yandex.ru/events/yac/m/talks/824/ Ранжирование товаров Нужно учесть: ➔ товар может быть новым и не иметь продаж ➔ необходимо честное тестирование эффективности алгоритмов Результат: +40% отнормированного PPV
  • 8. Устойчивые n-граммы из отзывов: ➔ Функциональность: регулятор крепости кофе, долго держит заряд, лоток для овощей ➔ Сочетаемость: есть все разъемы, со всеми форматами, со старыми играми ➔ «Коммуникабельность»: инструкция для сборки, на русском языке, интуитивно понятный интерфейс ➔ Условия использования: на мокром льду, за МКАДом, при недостаточном освещении ➔ Опыт использования: лежит в руке, приятный на ощупь, совсем не шумный, крепится к стеклу ➔ Личное: это мой первый, по сравнению с, до этого был, на мой взгляд ➔ Экономическое: за эти деньги, соотношение цена-качество ➔ Эмоциональное: я очень доволен, танцы с бубном, довольна как слон Подробнее: “Лексическая статистика в оценке качества коммерческих текстов", Ирина Борисова, Wikimart. http://www.ashmanov.com/arc/aiconf2012/16-borisova-ai-conf2012.pdf Извлечение пользовательских предпочтений
  • 9. Получение трафика из поисковых систем базируется на связках “запрос-документ”. Для крупного проекта речь идет о сотнях тысяч и миллионах поисковых запросов. Очевидные источники запросов: ➔ статистика поисковых систем ➔ поисковые подсказки Неочевидные источники поисковых запросов: ➔ сайты профильных конкурентов ➔ маркеры в поисковой выдаче Возможные способа кластеризации запросов: ➔ через частотные словари ➔ через сходство поисковой выдачи 439 тыс. активных пользователей 33 млн. запросов в месяц 4 терабайта хранилище Извлечение запросов и кластеризация
  • 11. Отзывы: радионяни эпиляторы радар-детекторы ... ноутбук шлифовальная машина ... стремянки мангалы Видео: дровокол интерактивные животные йо-йо ... сушилка для фруктов стиральная машина … кроссовки электрокотлы Критерий: Оценка востребованности типов контента
  • 12. ❏ Прогнозирование вероятности того, что пользователь сделает заказ через колл-центр ❏ Прогнозирование вероятности отказа пользователя от созданного заказа ❏ Прогнозирование вероятности ухода посетителя с сайта Наша Олимпиада: olymp.wikimart.ru
  • 13. Вопросы? Михаил Сливинский, Викимарт mikhail.slivinskiy@wikimart.ru facebook.com/iseoexpert Спасибо за внимание!