Конференция "Большие данные в национальной экономике". "Возможности извлечения маркетинговой информации в e-commerce"
1 of 13
Downloaded 10 times
More Related Content
Возможности извлечения маркетинговой информации в e-commerce
1. Возможности извлечения маркетинговой
информации в e-commerce
Михаил Сливинский, Викимарт
mikhail.slivinskiy@wikimart.ru
21.10.2014, конференция “Большие данные в национальной экономике”
2. 1. Доступность аудитории и нюансы масштабирования
2. Высокая цена ошибки
3. Невозможен push-маркетинг
4. Изучение потребностей покупателей
5. Персонализация и рекомендательные системы
6. Возможность измерений на всех этапах
выбора, покупки, использования
Big data в маркетинге e-commerce проектов базируется на:
➔ накоплении большого объема данных
➔ извлечении неочевидных зависимостей
Особенности маркетинга online
3. Собственные источники:
➔ источники трафика, поисковые запросы и страницы входа на сайт
➔ события в сессии на сайте
➔ история транзакций
➔ …
Внешние источники:
➔ статистика запросов к поисковым системам
➔ браузерные плагины (neiron, similarweb, alexa, ...)
➔ результаты поиска в поисковых системах
➔ корпуса отзывов
➔ ...
Источники данных
5. Традиционно рекомендательные системы обычно строят на коллаборативной фильтрации,
т.е. принципе: рекомендуем этому пользователю то, что интересно похожим на него
пользователям.
Основные недостатки:
➔ для обучения системы нужно много пользователей ( = денег) и действий
➔ обучаясь “с нуля” на действиях пользователей, мы снижаем их лояльность
Нестандартные задачи:
➔ нужен универсальный механизм измерения сходства любых двух
товаров (“похожие товары”)
➔ нужно построить хорошую универсальную товарную рекомендацию для
пользователя, о котором ничего не известно (“отранжированный
список товаров в категории”)
Рекомендательные системы
6. Из анализа сессий, начавшихся с просмотра конкретного товара,
измеряем вероятность изменения первичной потребности (в бренде,
свойстве, цене).
Если покупатель пришел за 40’’ ЖК телевизором Samsung,
интересуют ли его:
➔ 40’’ телевизоры Panasonic?
➔ 36’’ и 42’’ телевизоры Samsung?
➔ на 7% более дорогая модель?
Теперь мы умеем отвечать на эти вопросы!
Ищем похожие товары
7. Подробнее: “Покупатель — лучший эксперт. Ранжируем товары умно!”, Аркадий Итенберг, Михаил
Сливинский, YaC/m 2013, https://tech.yandex.ru/events/yac/m/talks/824/
Ранжирование товаров
Нужно учесть:
➔ товар может быть новым и не
иметь продаж
➔ необходимо честное
тестирование эффективности
алгоритмов
Результат:
+40% отнормированного PPV
8. Устойчивые n-граммы из отзывов:
➔ Функциональность:
регулятор крепости кофе, долго держит заряд, лоток для овощей
➔ Сочетаемость: есть все разъемы, со всеми форматами, со старыми играми
➔ «Коммуникабельность»:
инструкция для сборки, на русском языке, интуитивно понятный интерфейс
➔ Условия использования:
на мокром льду, за МКАДом, при недостаточном освещении
➔ Опыт использования:
лежит в руке, приятный на ощупь, совсем не шумный, крепится к стеклу
➔ Личное: это мой первый, по сравнению с, до этого был, на мой взгляд
➔ Экономическое: за эти деньги, соотношение цена-качество
➔ Эмоциональное: я очень доволен, танцы с бубном, довольна как слон
Подробнее: “Лексическая статистика в оценке качества коммерческих текстов", Ирина Борисова, Wikimart.
http://www.ashmanov.com/arc/aiconf2012/16-borisova-ai-conf2012.pdf
Извлечение пользовательских предпочтений
9. Получение трафика из поисковых систем базируется на связках “запрос-документ”.
Для крупного проекта речь идет о сотнях тысяч и миллионах поисковых запросов.
Очевидные источники запросов:
➔ статистика поисковых систем
➔ поисковые подсказки
Неочевидные источники поисковых запросов:
➔ сайты профильных конкурентов
➔ маркеры в поисковой выдаче
Возможные способа кластеризации запросов:
➔ через частотные словари
➔ через сходство поисковой выдачи
439 тыс. активных
пользователей
33 млн. запросов в месяц
4 терабайта хранилище
Извлечение запросов и кластеризация
11. Отзывы:
радионяни
эпиляторы
радар-детекторы
...
ноутбук
шлифовальная машина
...
стремянки
мангалы
Видео:
дровокол
интерактивные животные
йо-йо
...
сушилка для фруктов
стиральная машина
…
кроссовки
электрокотлы
Критерий:
Оценка востребованности типов контента
12. ❏ Прогнозирование вероятности того, что пользователь
сделает заказ через колл-центр
❏ Прогнозирование вероятности отказа пользователя
от созданного заказа
❏ Прогнозирование вероятности ухода посетителя с
сайта
Наша Олимпиада: olymp.wikimart.ru
13. Вопросы?
Михаил Сливинский, Викимарт
mikhail.slivinskiy@wikimart.ru
facebook.com/iseoexpert
Спасибо за внимание!