ݺߣ

ݺߣShare a Scribd company logo
Алгоритмы аннотирования, 
влияние на сниппеты 
Станислав Поломарь 
webit
План доклада 
• Задача по управлению сниппетами 
• Гипотезы для проверки 
– Яндекс (Ромип) ‘2008 
– Яндекс/Emory (SIGIR) ‘2013 
– Итоговый список 
• Результаты проверки на тестовой коллекции 
• Результаты подтверждения на реальной коллекции 
– Подсветки, синонимы 
• Итоговые рекомендации 
– Рекомендуемые приемы 
– Итого 
– Интересные примеры 
• Данные по CTR 
• Быстроботная примесь
Зачем и что требуется от управления? 
• Трафик из выдачи = Показы * CTR 
• CTR = F (позиции, кликабельность сниппета) 
• Кликабельность сниппета: 
– Читабельность 
– Точность ответа 
– Размер 
– Заметность
Основные пути по управлению 
• Использовать документированные возможности по 
форматам от поисковых систем 
• Конструировать и пытаться влиять на нужные 
фрагменты 
• Использовать недокументированные возможности 
по форматам от поисковых систем 
• Предоставить поисковым системам самим все 
решать
Гипотезы для проверки 
• Алгоритмы контекстно-зависимого 
аннотирования Яндекса на РОМИП-2008 
Опорная пара - два наименее частотных слова из пересечения слов 
запроса и предложения.
Гипотезы для проверки 
• «Алгоритмы контекстно-зависимого 
аннотирования Яндекса на РОМИП-2008» 
– Полное вхождение 
– Точное вхождение 
– Близость к началу предложения 
– В предложении есть слова с высоким IDF 
– Размер фрагмента примерно 150 символов
Гипотезы для проверки 
• «Improving Search Result Summaries by Using 
Searcher Behavior Data» 
F (фрагмента) = K * F_пф + (1 – K) * F_текст
Гипотезы для проверки
Гипотезы для проверки 
• По итогам: 
– Полное вхождение 
– Точное вхождение 
– Близость к началу предложения 
– Максимизация IDF на фрагмент и на слово из фрагмента 
– Близость к началу содержания страницы 
– Размер фрагмента примерно 150 символов 
– Отсутствие избыточного кол-ва пунктуации / кол-во слов с 
заглавной буквы 
• А также: 
– Вес тега meta description 
– Влияние подсветок (топонимы, синонимы и остальное)
Тестовая коллекция 
• Сравним полное/точное vs неполное 
вхождение 
– Тестовые фрагменты не обладают большинством 
остальных признаков, кроме вхождения. 
1. Ожидаемо везде выигрывает полное у неполного 
(Яндекс) 
2. В случае наличия в description полного, а в 
документе неполного – берется description 
(Яндекс)
Тестовая коллекция 
• Сравним группу начало 
предложения/документа vs IDF 
– Тестовые фрагменты содержат точное вхождение 
и, соответственно, набор из сравниваемых 
признаков. Остальными признаками не обладают. 
1. В почти 80% случаях выигрывает 1ая группа 
(Яндекс) 
2. Сравнение внутри первой группы требует 
отдельной выборки
Тестовая коллекция 
• Сравним начало документа vs начало 
предложения 
– Тестовые фрагменты содержат точное 
вхождение и, соответственно, набор из 
сравниваемых признаков. Остальными 
признаками не обладают. 
1. В 3/4 случаев выигрывает начало документа 
2. В п.1 входили документы, где фрагмент 
обладал обоими признаками
Реальная коллекция 
• Измерим позицию начала сниппета 
относительно кол-во слов в документе 
– Выкидываем внутри BODY все теги, стили, скрипты 
и пр. Меню и т.п. остается. Считаем размер общий 
и позицию начала фрагмента из сниппета. 
1. Средняя позиция начало - 49%. С учетом меню % 
несколько ниже, но не сильно. 
2. Метрика не учитывает возможности наличия 
вхождений только в конце документа. 
3. Метрика не учитывает другие сильные признаки, 
которые рассмотрим далее.
Реальная коллекция
Реальная коллекция 
• Размер сниппета (Яндекс)
Реальная коллекция 
• Размер сниппета (Яндекс)
Тестовая коллекция 
• Сравним «вес» meta description для Яндекс 
и Гугл 
– Тестовые фрагменты предложение с точных 
вхождением в тексте и аналогичное, но с 1 
изменением в description . 
1. Во всех случаях Яндекс выбрал текст, Гугл - 
description.
Реальная коллекция 
• Яндекс - в 2% случаев взят description 
– В большинстве из этих случаев нет полного 
вхождения в текст 
– Яндекс смело комбинирует description и текст в 
сниппетах 
• Гугл – в 60% случаев взят description
Рекомендации №1 
• Яндекс 
– Точное/полное вхождение 
– Начало документа и предложения 
– Размер фрагмента зависит от длины запросов (от 
120-160 символов до 180-200) 
– Про description можно не очень переживать 
• Гугл 
– Максимальное использование description 
– «Раскрашиваем» вволю по спец символам 
(http://saney.ru/tools/google-snippets-generator.html)
Тестовая коллекция 
• Сравним наличие слов из подсветки vs без них 
– Тестовые фрагменты содержат точное вхождение и 
да/нет слова из подсветки. В ряде случае устроим 
соревнование с началом документа. 
1. В большинстве использовались самые частные 
подсветки (топоним, купить, основной синоним и 
т.п.). 
2. Практически во всех случаях выиграли 
фрагменты со словами из подсветки (причем 
обыгрывая даже конкурентов из начала 
документа)
Реальная коллекция 
• Наличие подсветки в документе vs сниппет 
– В 90% пар запрос-документ есть хоть одна 
подсветка в тексте (head не в счет) 
– В 72% есть хоть одна подсветка в сниппете (без 
заголовка) 
1. В 80% случаев, когда слова из подсветки есть в 
тексте, они есть и в аннотации (в рамках 1 
варианта). 
2. Яндекс однозначно любит слова из подсветки, 
особенно топонимы и синонимы.
Реальная коллекция 
• Подсветки статистика
Реальная коллекция 
• Подсветки лидеры
Реальная коллекция 
• Синонимы и оператор nosyn 
– Убирает подсветки 
– Видимо отключает ранжирование
Реальная коллекция 
• Собираем подсветки с nosyn 
– Порядка 30% подсветок приходится на синонимы
Полезные приемы 
• Убрать описание ЯК, Дмоз 
<meta name="robots" content="noyaca"/> и <meta name="robots" 
content="noodp"/> 
• Использовать спец символы 
• Использовать Яндекс.Адреса для внутренних страниц
Полезные приемы 
• Использовать Товары и цены / Товарные сниппеты 
– Применять те же приемы 
– Использовать для любых карточек/разделов 
продукции**
Полезные приемы 
• Товары и цены 
– Фрагмент из description ранжируется с 
повышенным весом**
Рекомендации Итого (Яндекс) 
• Точное/полное вхождение 
• В начале документа и предложения 
• Размер фрагмента зависит от длины запросов (от 120-160 символов до 
180-200) 
• Использование слов из подсветки (в первую очередь топонимы и 
синонимы) 
• Отключить ЯК/Дмоз 
• Description для подстраховки и Гугла 
• Использовать все стандартные инструменты по расширениям и 
микроразметке 
• Подключить Товары и цены, где особое внимание уделить description 
• Подключить Товарные сниппеты, подход к description тот же 
• Использование спец символов (ко всем соответствующим пунктам)
Интересные примеры 
• Склейка цены из Товарных сниппетов и текста 
• Влияние синонима
Интересные примеры 
• Делаем список в сниппете 
• Зачем в заголовок брать title?
Интересные примеры 
• Цветные сниппеты 
• Нет подходящего фрагмента – возьму description
CTR (Яндекс)
CTR (Яндекс)
CTR (Гугл)
CTR (Гугл)
Быстроботная примесь 
• Статья про свежесть и запуск быстроботной 
примеси в 2011 году - Recency Ranking by 
Diversification of Result Set 
https://drive.google.com/file/d/0B3oTghWSSP4kejA1Z05DamRJeUk/view?usp=sharing 
• Наблюдения: 
– По факту на сейчас потребность свежести >0 для большинства запросов 
– Краулинговый ранк видимо не очень большой по умолчанию (у поддоменов 
отдельный) 
– Для ранжирования и аннотации во многом также как в большом поиске 
– Документ из базы быстробота получает возможность появится в большой выдаче 
только после набора определенного ранка 
– Дата появления документа = дата 1ой индексации 
– Дата в сохраненке = дата последнего захода ББ
Быстроботная примесь
ВОПРОСЫ? 
• Поломарь Станислав 
– stas@webit.ru / https://fb.com/stas.polomar 
• webit 
– Решает задачи бизнеса в Интернет на http://webit.ru

More Related Content

What's hot (20)

Аналитика поведенческих фатокров (BDD 15)
Аналитика поведенческих фатокров (BDD 15)Аналитика поведенческих фатокров (BDD 15)
Аналитика поведенческих фатокров (BDD 15)
Стас Поломарь
Стас Поломарь. 10 задач по SEO, с решением
Стас Поломарь. 10 задач по SEO, с решениемСтас Поломарь. 10 задач по SEO, с решением
Стас Поломарь. 10 задач по SEO, с решением
Дмитрий Шахов
Аналитика поискового продвижения (SmartFox)
Аналитика поискового продвижения (SmartFox)Аналитика поискового продвижения (SmartFox)
Аналитика поискового продвижения (SmartFox)
Стас Поломарь
Фишки из патентов Google
Фишки из патентов GoogleФишки из патентов Google
Фишки из патентов Google
Сергей Кокшаров
SEO тренды в Google 2017
SEO тренды в Google 2017SEO тренды в Google 2017
SEO тренды в Google 2017
Сергей Кокшаров
«SEO CONF 2015» 20 актуальных работ по SEO в 2015 году
«SEO CONF 2015»  20 актуальных работ по SEO в 2015 году«SEO CONF 2015»  20 актуальных работ по SEO в 2015 году
«SEO CONF 2015» 20 актуальных работ по SEO в 2015 году
Sergey Yurkov
Инсайты из Яндекс.Метрики - AllintopConf 2017
Инсайты из Яндекс.Метрики - AllintopConf 2017Инсайты из Яндекс.Метрики - AllintopConf 2017
Инсайты из Яндекс.Метрики - AllintopConf 2017
Alexey Trudov
Никулин Павел. Machine learning для текстового анализа
Никулин Павел. Machine learning для текстового анализаНикулин Павел. Machine learning для текстового анализа
Никулин Павел. Machine learning для текстового анализа
Дмитрий Шахов
Трудов Алексей. Как поисковые системы учитывают и оценивают возраст страницы
Трудов Алексей. Как поисковые системы учитывают и оценивают возраст страницыТрудов Алексей. Как поисковые системы учитывают и оценивают возраст страницы
Трудов Алексей. Как поисковые системы учитывают и оценивают возраст страницы
Дмитрий Шахов
Seo upgrade - аналитика накрутки пф
Seo upgrade - аналитика накрутки пфSeo upgrade - аналитика накрутки пф
Seo upgrade - аналитика накрутки пф
Sergey Yurkov
Seo коучинг 6.0 [пиксель плюс] - снятие ручных санкций за переоптимизацию
Seo коучинг 6.0 [пиксель плюс] - снятие ручных санкций за переоптимизациюSeo коучинг 6.0 [пиксель плюс] - снятие ручных санкций за переоптимизацию
Seo коучинг 6.0 [пиксель плюс] - снятие ручных санкций за переоптимизацию
Sergey Yurkov
Алгоритм составления ядра сайта. Модуль 12
Алгоритм составления ядра сайта. Модуль 12Алгоритм составления ядра сайта. Модуль 12
Алгоритм составления ядра сайта. Модуль 12
EMPOpro
Конференция Smart fox как продвинуть сайт из топ-20 в топ-10 поисковой системы
Конференция Smart fox   как продвинуть сайт из топ-20 в топ-10 поисковой системыКонференция Smart fox   как продвинуть сайт из топ-20 в топ-10 поисковой системы
Конференция Smart fox как продвинуть сайт из топ-20 в топ-10 поисковой системы
Sergey Yurkov
Seo практикум 3.0 - продвижение коммерческого портала в яндексе и google
Seo практикум 3.0 - продвижение коммерческого портала в яндексе и googleSeo практикум 3.0 - продвижение коммерческого портала в яндексе и google
Seo практикум 3.0 - продвижение коммерческого портала в яндексе и google
Sergey Yurkov
Практический курс SEO для Bewebby, введение в SEO, семантика для сайта
Практический курс SEO для Bewebby, введение в SEO, семантика для сайтаПрактический курс SEO для Bewebby, введение в SEO, семантика для сайта
Практический курс SEO для Bewebby, введение в SEO, семантика для сайта
-Интеллект
Поисковая аналитика DDS-2 (2016)
Поисковая аналитика DDS-2 (2016)Поисковая аналитика DDS-2 (2016)
Поисковая аналитика DDS-2 (2016)
Стас Поломарь
Современная автоматизация работ в SEO: кластеризация запросов, текстовый анал...
Современная автоматизация работ в SEO: кластеризация запросов, текстовый анал...Современная автоматизация работ в SEO: кластеризация запросов, текстовый анал...
Современная автоматизация работ в SEO: кластеризация запросов, текстовый анал...
-Интеллект
Продвижение сайтов в 2016: нюансы и нововведения
Продвижение сайтов в 2016: нюансы и нововведенияПродвижение сайтов в 2016: нюансы и нововведения
Продвижение сайтов в 2016: нюансы и нововведения
Sergey Yurkov
Вебинар: Оптимизация контента, которая понравится поисковым системам
Вебинар: Оптимизация контента, которая понравится поисковым системамВебинар: Оптимизация контента, которая понравится поисковым системам
Вебинар: Оптимизация контента, которая понравится поисковым системам
-Интеллект
Рабочие и нерабочие seo-стратегии
Рабочие и нерабочие seo-стратегииРабочие и нерабочие seo-стратегии
Рабочие и нерабочие seo-стратегии
Сергей Кокшаров
Аналитика поведенческих фатокров (BDD 15)
Аналитика поведенческих фатокров (BDD 15)Аналитика поведенческих фатокров (BDD 15)
Аналитика поведенческих фатокров (BDD 15)
Стас Поломарь
Стас Поломарь. 10 задач по SEO, с решением
Стас Поломарь. 10 задач по SEO, с решениемСтас Поломарь. 10 задач по SEO, с решением
Стас Поломарь. 10 задач по SEO, с решением
Дмитрий Шахов
Аналитика поискового продвижения (SmartFox)
Аналитика поискового продвижения (SmartFox)Аналитика поискового продвижения (SmartFox)
Аналитика поискового продвижения (SmartFox)
Стас Поломарь
«SEO CONF 2015» 20 актуальных работ по SEO в 2015 году
«SEO CONF 2015»  20 актуальных работ по SEO в 2015 году«SEO CONF 2015»  20 актуальных работ по SEO в 2015 году
«SEO CONF 2015» 20 актуальных работ по SEO в 2015 году
Sergey Yurkov
Инсайты из Яндекс.Метрики - AllintopConf 2017
Инсайты из Яндекс.Метрики - AllintopConf 2017Инсайты из Яндекс.Метрики - AllintopConf 2017
Инсайты из Яндекс.Метрики - AllintopConf 2017
Alexey Trudov
Никулин Павел. Machine learning для текстового анализа
Никулин Павел. Machine learning для текстового анализаНикулин Павел. Machine learning для текстового анализа
Никулин Павел. Machine learning для текстового анализа
Дмитрий Шахов
Трудов Алексей. Как поисковые системы учитывают и оценивают возраст страницы
Трудов Алексей. Как поисковые системы учитывают и оценивают возраст страницыТрудов Алексей. Как поисковые системы учитывают и оценивают возраст страницы
Трудов Алексей. Как поисковые системы учитывают и оценивают возраст страницы
Дмитрий Шахов
Seo upgrade - аналитика накрутки пф
Seo upgrade - аналитика накрутки пфSeo upgrade - аналитика накрутки пф
Seo upgrade - аналитика накрутки пф
Sergey Yurkov
Seo коучинг 6.0 [пиксель плюс] - снятие ручных санкций за переоптимизацию
Seo коучинг 6.0 [пиксель плюс] - снятие ручных санкций за переоптимизациюSeo коучинг 6.0 [пиксель плюс] - снятие ручных санкций за переоптимизацию
Seo коучинг 6.0 [пиксель плюс] - снятие ручных санкций за переоптимизацию
Sergey Yurkov
Алгоритм составления ядра сайта. Модуль 12
Алгоритм составления ядра сайта. Модуль 12Алгоритм составления ядра сайта. Модуль 12
Алгоритм составления ядра сайта. Модуль 12
EMPOpro
Конференция Smart fox как продвинуть сайт из топ-20 в топ-10 поисковой системы
Конференция Smart fox   как продвинуть сайт из топ-20 в топ-10 поисковой системыКонференция Smart fox   как продвинуть сайт из топ-20 в топ-10 поисковой системы
Конференция Smart fox как продвинуть сайт из топ-20 в топ-10 поисковой системы
Sergey Yurkov
Seo практикум 3.0 - продвижение коммерческого портала в яндексе и google
Seo практикум 3.0 - продвижение коммерческого портала в яндексе и googleSeo практикум 3.0 - продвижение коммерческого портала в яндексе и google
Seo практикум 3.0 - продвижение коммерческого портала в яндексе и google
Sergey Yurkov
Практический курс SEO для Bewebby, введение в SEO, семантика для сайта
Практический курс SEO для Bewebby, введение в SEO, семантика для сайтаПрактический курс SEO для Bewebby, введение в SEO, семантика для сайта
Практический курс SEO для Bewebby, введение в SEO, семантика для сайта
-Интеллект
Поисковая аналитика DDS-2 (2016)
Поисковая аналитика DDS-2 (2016)Поисковая аналитика DDS-2 (2016)
Поисковая аналитика DDS-2 (2016)
Стас Поломарь
Современная автоматизация работ в SEO: кластеризация запросов, текстовый анал...
Современная автоматизация работ в SEO: кластеризация запросов, текстовый анал...Современная автоматизация работ в SEO: кластеризация запросов, текстовый анал...
Современная автоматизация работ в SEO: кластеризация запросов, текстовый анал...
-Интеллект
Продвижение сайтов в 2016: нюансы и нововведения
Продвижение сайтов в 2016: нюансы и нововведенияПродвижение сайтов в 2016: нюансы и нововведения
Продвижение сайтов в 2016: нюансы и нововведения
Sergey Yurkov
Вебинар: Оптимизация контента, которая понравится поисковым системам
Вебинар: Оптимизация контента, которая понравится поисковым системамВебинар: Оптимизация контента, которая понравится поисковым системам
Вебинар: Оптимизация контента, которая понравится поисковым системам
-Интеллект
Рабочие и нерабочие seo-стратегии
Рабочие и нерабочие seo-стратегииРабочие и нерабочие seo-стратегии
Рабочие и нерабочие seo-стратегии
Сергей Кокшаров

Viewers also liked (12)

SEO жизнь на примере лидеров ecommerce (Cybermarketing 2016)
SEO жизнь на примере лидеров ecommerce (Cybermarketing 2016)SEO жизнь на примере лидеров ecommerce (Cybermarketing 2016)
SEO жизнь на примере лидеров ecommerce (Cybermarketing 2016)
Стас Поломарь
SEO итоги 2015 (Smartfox)
SEO итоги 2015 (Smartfox)SEO итоги 2015 (Smartfox)
SEO итоги 2015 (Smartfox)
Стас Поломарь
Поведенческие факторы Гугл (Sempro 16)
Поведенческие факторы Гугл (Sempro 16)Поведенческие факторы Гугл (Sempro 16)
Поведенческие факторы Гугл (Sempro 16)
Стас Поломарь
Метрики и сценарии работы с анализом видимости проектов
Метрики и сценарии работы с анализом видимости проектовМетрики и сценарии работы с анализом видимости проектов
Метрики и сценарии работы с анализом видимости проектов
Стас Поломарь
Минусинкс. Первые итоги (SmartFox)
Минусинкс. Первые итоги (SmartFox)Минусинкс. Первые итоги (SmartFox)
Минусинкс. Первые итоги (SmartFox)
Стас Поломарь
Учет поведения, мобильности и яндекс.бандит (Optimization-16)Optimization16 t...
Учет поведения, мобильности и яндекс.бандит (Optimization-16)Optimization16 t...Учет поведения, мобильности и яндекс.бандит (Optimization-16)Optimization16 t...
Учет поведения, мобильности и яндекс.бандит (Optimization-16)Optimization16 t...
Стас Поломарь
10 задача по SEO с решением (BDD17)
10 задача по SEO с решением (BDD17)10 задача по SEO с решением (BDD17)
10 задача по SEO с решением (BDD17)
Стас Поломарь
Анализ поисковой видимости (Неделя Байнета 17)
Анализ поисковой видимости (Неделя Байнета 17)Анализ поисковой видимости (Неделя Байнета 17)
Анализ поисковой видимости (Неделя Байнета 17)
Стас Поломарь
Аналитика поведенческих факторов Яндекс/Гугл
Аналитика поведенческих факторов Яндекс/ГуглАналитика поведенческих факторов Яндекс/Гугл
Аналитика поведенческих факторов Яндекс/Гугл
Стас Поломарь
Вводная в SEO ТопЭксперт
Вводная в SEO ТопЭксперт Вводная в SEO ТопЭксперт
Вводная в SEO ТопЭксперт
Стас Поломарь
Многорукие бандиты Яндекса (Optimization-15)
Многорукие бандиты Яндекса (Optimization-15)Многорукие бандиты Яндекса (Optimization-15)
Многорукие бандиты Яндекса (Optimization-15)
Стас Поломарь
Работа с контентными проектами (Optimization-16)
Работа с контентными проектами (Optimization-16)Работа с контентными проектами (Optimization-16)
Работа с контентными проектами (Optimization-16)
Стас Поломарь
SEO жизнь на примере лидеров ecommerce (Cybermarketing 2016)
SEO жизнь на примере лидеров ecommerce (Cybermarketing 2016)SEO жизнь на примере лидеров ecommerce (Cybermarketing 2016)
SEO жизнь на примере лидеров ecommerce (Cybermarketing 2016)
Стас Поломарь
Поведенческие факторы Гугл (Sempro 16)
Поведенческие факторы Гугл (Sempro 16)Поведенческие факторы Гугл (Sempro 16)
Поведенческие факторы Гугл (Sempro 16)
Стас Поломарь
Метрики и сценарии работы с анализом видимости проектов
Метрики и сценарии работы с анализом видимости проектовМетрики и сценарии работы с анализом видимости проектов
Метрики и сценарии работы с анализом видимости проектов
Стас Поломарь
Минусинкс. Первые итоги (SmartFox)
Минусинкс. Первые итоги (SmartFox)Минусинкс. Первые итоги (SmartFox)
Минусинкс. Первые итоги (SmartFox)
Стас Поломарь
Учет поведения, мобильности и яндекс.бандит (Optimization-16)Optimization16 t...
Учет поведения, мобильности и яндекс.бандит (Optimization-16)Optimization16 t...Учет поведения, мобильности и яндекс.бандит (Optimization-16)Optimization16 t...
Учет поведения, мобильности и яндекс.бандит (Optimization-16)Optimization16 t...
Стас Поломарь
10 задача по SEO с решением (BDD17)
10 задача по SEO с решением (BDD17)10 задача по SEO с решением (BDD17)
10 задача по SEO с решением (BDD17)
Стас Поломарь
Анализ поисковой видимости (Неделя Байнета 17)
Анализ поисковой видимости (Неделя Байнета 17)Анализ поисковой видимости (Неделя Байнета 17)
Анализ поисковой видимости (Неделя Байнета 17)
Стас Поломарь
Аналитика поведенческих факторов Яндекс/Гугл
Аналитика поведенческих факторов Яндекс/ГуглАналитика поведенческих факторов Яндекс/Гугл
Аналитика поведенческих факторов Яндекс/Гугл
Стас Поломарь
Многорукие бандиты Яндекса (Optimization-15)
Многорукие бандиты Яндекса (Optimization-15)Многорукие бандиты Яндекса (Optimization-15)
Многорукие бандиты Яндекса (Optimization-15)
Стас Поломарь
Работа с контентными проектами (Optimization-16)
Работа с контентными проектами (Optimization-16)Работа с контентными проектами (Optimization-16)
Работа с контентными проектами (Optimization-16)
Стас Поломарь

Similar to Алгоритмы аннотирования, влияние на сниппеты (IBC 14) (20)

Анализ механизма обработки запроса в поисковых системах [Севальнев, MegaIndex...
Анализ механизма обработки запроса в поисковых системах [Севальнев, MegaIndex...Анализ механизма обработки запроса в поисковых системах [Севальнев, MegaIndex...
Анализ механизма обработки запроса в поисковых системах [Севальнев, MegaIndex...
Дмитрий Севальнев
Текстовые факторы ранжирования: принцип работы ПС и практические инструкции
Текстовые факторы ранжирования: принцип работы ПС и практические инструкцииТекстовые факторы ранжирования: принцип работы ПС и практические инструкции
Текстовые факторы ранжирования: принцип работы ПС и практические инструкции
Нарижный Денис
Презентация SEO - все что нужно знать про поисковую оптимизацию сайта
Презентация SEO - все что нужно знать про поисковую оптимизацию сайтаПрезентация SEO - все что нужно знать про поисковую оптимизацию сайта
Презентация SEO - все что нужно знать про поисковую оптимизацию сайта
Andrew PersonBh
автоматическое аннотирование новостного потока
автоматическое аннотирование новостного потокаавтоматическое аннотирование новостного потока
автоматическое аннотирование новостного потока
Natalia Ostapuk
Стас Поломарь. 10 задач по SEO, с решением #bdd2017
Стас Поломарь. 10 задач по SEO, с решением #bdd2017Стас Поломарь. 10 задач по SEO, с решением #bdd2017
Стас Поломарь. 10 задач по SEO, с решением #bdd2017
Евгений Летов
Рэшад Бакиров. Тематичность страницы и сайта как фактор ранжирования
Рэшад Бакиров. Тематичность страницы и сайта как фактор ранжированияРэшад Бакиров. Тематичность страницы и сайта как фактор ранжирования
Рэшад Бакиров. Тематичность страницы и сайта как фактор ранжирования
Дмитрий Шахов
20120226 information retrieval raskovalov_lecture03-04
20120226 information retrieval raskovalov_lecture03-0420120226 information retrieval raskovalov_lecture03-04
20120226 information retrieval raskovalov_lecture03-04
Computer Science Club
Основы текстовой оптимизации
Основы текстовой оптимизацииОсновы текстовой оптимизации
Основы текстовой оптимизации
Rush Agency
«SEO-экспериментариум», выпуск 1 на MegaIndex.TV. Севальнев Дмитрий
«SEO-экспериментариум», выпуск 1 на MegaIndex.TV. Севальнев Дмитрий«SEO-экспериментариум», выпуск 1 на MegaIndex.TV. Севальнев Дмитрий
«SEO-экспериментариум», выпуск 1 на MegaIndex.TV. Севальнев Дмитрий
Дмитрий Севальнев
Правила хорошего SEO тона в Frontend разработке
Правила хорошего SEO тона в Frontend разработкеПравила хорошего SEO тона в Frontend разработке
Правила хорошего SEO тона в Frontend разработке
Ecommerce Solution Provider SysIQ
Usability и SEO. Юрий Грановский
Usability и SEO. Юрий ГрановскийUsability и SEO. Юрий Грановский
Usability и SEO. Юрий Грановский
Клуб Интернет-Маркетологов
Практические аспекты разработки ПО #3
Практические аспекты разработки ПО #3Практические аспекты разработки ПО #3
Практические аспекты разработки ПО #3
Denis Umnov
SEO-Audit seo summit websarafan 2016
SEO-Audit seo summit websarafan 2016SEO-Audit seo summit websarafan 2016
SEO-Audit seo summit websarafan 2016
Yuriy Khait
08.11 SEMPRO Club - Влад Моргун - Цвет настроения серый
08.11 SEMPRO Club - Влад Моргун - Цвет настроения серый08.11 SEMPRO Club - Влад Моргун - Цвет настроения серый
08.11 SEMPRO Club - Влад Моргун - Цвет настроения серый
Vladislav Morgun
Комплексный подход к SEO-копирайтингу в 2018 году
Комплексный подход к SEO-копирайтингу в 2018 году Комплексный подход к SEO-копирайтингу в 2018 году
Комплексный подход к SEO-копирайтингу в 2018 году
Академия интернет-маркетинга «WebPromoExperts»
Дмитрий Петренко. SEO трафик в конкурентных нишах под БУРЖ. Инструменты, мето...
Дмитрий Петренко. SEO трафик в конкурентных нишах под БУРЖ. Инструменты, мето...Дмитрий Петренко. SEO трафик в конкурентных нишах под БУРЖ. Инструменты, мето...
Дмитрий Петренко. SEO трафик в конкурентных нишах под БУРЖ. Инструменты, мето...
DariaShalahinova
Unit tests
Unit testsUnit tests
Unit tests
Pavel Tsukanov
Seo Drupal 6
Seo Drupal 6Seo Drupal 6
Seo Drupal 6
andreyjw
Seo
SeoSeo
Seo
andreyjw
Анализ механизма обработки запроса в поисковых системах [Севальнев, MegaIndex...
Анализ механизма обработки запроса в поисковых системах [Севальнев, MegaIndex...Анализ механизма обработки запроса в поисковых системах [Севальнев, MegaIndex...
Анализ механизма обработки запроса в поисковых системах [Севальнев, MegaIndex...
Дмитрий Севальнев
Текстовые факторы ранжирования: принцип работы ПС и практические инструкции
Текстовые факторы ранжирования: принцип работы ПС и практические инструкцииТекстовые факторы ранжирования: принцип работы ПС и практические инструкции
Текстовые факторы ранжирования: принцип работы ПС и практические инструкции
Нарижный Денис
Презентация SEO - все что нужно знать про поисковую оптимизацию сайта
Презентация SEO - все что нужно знать про поисковую оптимизацию сайтаПрезентация SEO - все что нужно знать про поисковую оптимизацию сайта
Презентация SEO - все что нужно знать про поисковую оптимизацию сайта
Andrew PersonBh
автоматическое аннотирование новостного потока
автоматическое аннотирование новостного потокаавтоматическое аннотирование новостного потока
автоматическое аннотирование новостного потока
Natalia Ostapuk
Стас Поломарь. 10 задач по SEO, с решением #bdd2017
Стас Поломарь. 10 задач по SEO, с решением #bdd2017Стас Поломарь. 10 задач по SEO, с решением #bdd2017
Стас Поломарь. 10 задач по SEO, с решением #bdd2017
Евгений Летов
Рэшад Бакиров. Тематичность страницы и сайта как фактор ранжирования
Рэшад Бакиров. Тематичность страницы и сайта как фактор ранжированияРэшад Бакиров. Тематичность страницы и сайта как фактор ранжирования
Рэшад Бакиров. Тематичность страницы и сайта как фактор ранжирования
Дмитрий Шахов
20120226 information retrieval raskovalov_lecture03-04
20120226 information retrieval raskovalov_lecture03-0420120226 information retrieval raskovalov_lecture03-04
20120226 information retrieval raskovalov_lecture03-04
Computer Science Club
Основы текстовой оптимизации
Основы текстовой оптимизацииОсновы текстовой оптимизации
Основы текстовой оптимизации
Rush Agency
«SEO-экспериментариум», выпуск 1 на MegaIndex.TV. Севальнев Дмитрий
«SEO-экспериментариум», выпуск 1 на MegaIndex.TV. Севальнев Дмитрий«SEO-экспериментариум», выпуск 1 на MegaIndex.TV. Севальнев Дмитрий
«SEO-экспериментариум», выпуск 1 на MegaIndex.TV. Севальнев Дмитрий
Дмитрий Севальнев
Правила хорошего SEO тона в Frontend разработке
Правила хорошего SEO тона в Frontend разработкеПравила хорошего SEO тона в Frontend разработке
Правила хорошего SEO тона в Frontend разработке
Ecommerce Solution Provider SysIQ
Практические аспекты разработки ПО #3
Практические аспекты разработки ПО #3Практические аспекты разработки ПО #3
Практические аспекты разработки ПО #3
Denis Umnov
SEO-Audit seo summit websarafan 2016
SEO-Audit seo summit websarafan 2016SEO-Audit seo summit websarafan 2016
SEO-Audit seo summit websarafan 2016
Yuriy Khait
08.11 SEMPRO Club - Влад Моргун - Цвет настроения серый
08.11 SEMPRO Club - Влад Моргун - Цвет настроения серый08.11 SEMPRO Club - Влад Моргун - Цвет настроения серый
08.11 SEMPRO Club - Влад Моргун - Цвет настроения серый
Vladislav Morgun
Дмитрий Петренко. SEO трафик в конкурентных нишах под БУРЖ. Инструменты, мето...
Дмитрий Петренко. SEO трафик в конкурентных нишах под БУРЖ. Инструменты, мето...Дмитрий Петренко. SEO трафик в конкурентных нишах под БУРЖ. Инструменты, мето...
Дмитрий Петренко. SEO трафик в конкурентных нишах под БУРЖ. Инструменты, мето...
DariaShalahinova

Алгоритмы аннотирования, влияние на сниппеты (IBC 14)

  • 1. Алгоритмы аннотирования, влияние на сниппеты Станислав Поломарь webit
  • 2. План доклада • Задача по управлению сниппетами • Гипотезы для проверки – Яндекс (Ромип) ‘2008 – Яндекс/Emory (SIGIR) ‘2013 – Итоговый список • Результаты проверки на тестовой коллекции • Результаты подтверждения на реальной коллекции – Подсветки, синонимы • Итоговые рекомендации – Рекомендуемые приемы – Итого – Интересные примеры • Данные по CTR • Быстроботная примесь
  • 3. Зачем и что требуется от управления? • Трафик из выдачи = Показы * CTR • CTR = F (позиции, кликабельность сниппета) • Кликабельность сниппета: – Читабельность – Точность ответа – Размер – Заметность
  • 4. Основные пути по управлению • Использовать документированные возможности по форматам от поисковых систем • Конструировать и пытаться влиять на нужные фрагменты • Использовать недокументированные возможности по форматам от поисковых систем • Предоставить поисковым системам самим все решать
  • 5. Гипотезы для проверки • Алгоритмы контекстно-зависимого аннотирования Яндекса на РОМИП-2008 Опорная пара - два наименее частотных слова из пересечения слов запроса и предложения.
  • 6. Гипотезы для проверки • «Алгоритмы контекстно-зависимого аннотирования Яндекса на РОМИП-2008» – Полное вхождение – Точное вхождение – Близость к началу предложения – В предложении есть слова с высоким IDF – Размер фрагмента примерно 150 символов
  • 7. Гипотезы для проверки • «Improving Search Result Summaries by Using Searcher Behavior Data» F (фрагмента) = K * F_пф + (1 – K) * F_текст
  • 9. Гипотезы для проверки • По итогам: – Полное вхождение – Точное вхождение – Близость к началу предложения – Максимизация IDF на фрагмент и на слово из фрагмента – Близость к началу содержания страницы – Размер фрагмента примерно 150 символов – Отсутствие избыточного кол-ва пунктуации / кол-во слов с заглавной буквы • А также: – Вес тега meta description – Влияние подсветок (топонимы, синонимы и остальное)
  • 10. Тестовая коллекция • Сравним полное/точное vs неполное вхождение – Тестовые фрагменты не обладают большинством остальных признаков, кроме вхождения. 1. Ожидаемо везде выигрывает полное у неполного (Яндекс) 2. В случае наличия в description полного, а в документе неполного – берется description (Яндекс)
  • 11. Тестовая коллекция • Сравним группу начало предложения/документа vs IDF – Тестовые фрагменты содержат точное вхождение и, соответственно, набор из сравниваемых признаков. Остальными признаками не обладают. 1. В почти 80% случаях выигрывает 1ая группа (Яндекс) 2. Сравнение внутри первой группы требует отдельной выборки
  • 12. Тестовая коллекция • Сравним начало документа vs начало предложения – Тестовые фрагменты содержат точное вхождение и, соответственно, набор из сравниваемых признаков. Остальными признаками не обладают. 1. В 3/4 случаев выигрывает начало документа 2. В п.1 входили документы, где фрагмент обладал обоими признаками
  • 13. Реальная коллекция • Измерим позицию начала сниппета относительно кол-во слов в документе – Выкидываем внутри BODY все теги, стили, скрипты и пр. Меню и т.п. остается. Считаем размер общий и позицию начала фрагмента из сниппета. 1. Средняя позиция начало - 49%. С учетом меню % несколько ниже, но не сильно. 2. Метрика не учитывает возможности наличия вхождений только в конце документа. 3. Метрика не учитывает другие сильные признаки, которые рассмотрим далее.
  • 15. Реальная коллекция • Размер сниппета (Яндекс)
  • 16. Реальная коллекция • Размер сниппета (Яндекс)
  • 17. Тестовая коллекция • Сравним «вес» meta description для Яндекс и Гугл – Тестовые фрагменты предложение с точных вхождением в тексте и аналогичное, но с 1 изменением в description . 1. Во всех случаях Яндекс выбрал текст, Гугл - description.
  • 18. Реальная коллекция • Яндекс - в 2% случаев взят description – В большинстве из этих случаев нет полного вхождения в текст – Яндекс смело комбинирует description и текст в сниппетах • Гугл – в 60% случаев взят description
  • 19. Рекомендации №1 • Яндекс – Точное/полное вхождение – Начало документа и предложения – Размер фрагмента зависит от длины запросов (от 120-160 символов до 180-200) – Про description можно не очень переживать • Гугл – Максимальное использование description – «Раскрашиваем» вволю по спец символам (http://saney.ru/tools/google-snippets-generator.html)
  • 20. Тестовая коллекция • Сравним наличие слов из подсветки vs без них – Тестовые фрагменты содержат точное вхождение и да/нет слова из подсветки. В ряде случае устроим соревнование с началом документа. 1. В большинстве использовались самые частные подсветки (топоним, купить, основной синоним и т.п.). 2. Практически во всех случаях выиграли фрагменты со словами из подсветки (причем обыгрывая даже конкурентов из начала документа)
  • 21. Реальная коллекция • Наличие подсветки в документе vs сниппет – В 90% пар запрос-документ есть хоть одна подсветка в тексте (head не в счет) – В 72% есть хоть одна подсветка в сниппете (без заголовка) 1. В 80% случаев, когда слова из подсветки есть в тексте, они есть и в аннотации (в рамках 1 варианта). 2. Яндекс однозначно любит слова из подсветки, особенно топонимы и синонимы.
  • 22. Реальная коллекция • Подсветки статистика
  • 23. Реальная коллекция • Подсветки лидеры
  • 24. Реальная коллекция • Синонимы и оператор nosyn – Убирает подсветки – Видимо отключает ранжирование
  • 25. Реальная коллекция • Собираем подсветки с nosyn – Порядка 30% подсветок приходится на синонимы
  • 26. Полезные приемы • Убрать описание ЯК, Дмоз <meta name="robots" content="noyaca"/> и <meta name="robots" content="noodp"/> • Использовать спец символы • Использовать Яндекс.Адреса для внутренних страниц
  • 27. Полезные приемы • Использовать Товары и цены / Товарные сниппеты – Применять те же приемы – Использовать для любых карточек/разделов продукции**
  • 28. Полезные приемы • Товары и цены – Фрагмент из description ранжируется с повышенным весом**
  • 29. Рекомендации Итого (Яндекс) • Точное/полное вхождение • В начале документа и предложения • Размер фрагмента зависит от длины запросов (от 120-160 символов до 180-200) • Использование слов из подсветки (в первую очередь топонимы и синонимы) • Отключить ЯК/Дмоз • Description для подстраховки и Гугла • Использовать все стандартные инструменты по расширениям и микроразметке • Подключить Товары и цены, где особое внимание уделить description • Подключить Товарные сниппеты, подход к description тот же • Использование спец символов (ко всем соответствующим пунктам)
  • 30. Интересные примеры • Склейка цены из Товарных сниппетов и текста • Влияние синонима
  • 31. Интересные примеры • Делаем список в сниппете • Зачем в заголовок брать title?
  • 32. Интересные примеры • Цветные сниппеты • Нет подходящего фрагмента – возьму description
  • 37. Быстроботная примесь • Статья про свежесть и запуск быстроботной примеси в 2011 году - Recency Ranking by Diversification of Result Set https://drive.google.com/file/d/0B3oTghWSSP4kejA1Z05DamRJeUk/view?usp=sharing • Наблюдения: – По факту на сейчас потребность свежести >0 для большинства запросов – Краулинговый ранк видимо не очень большой по умолчанию (у поддоменов отдельный) – Для ранжирования и аннотации во многом также как в большом поиске – Документ из базы быстробота получает возможность появится в большой выдаче только после набора определенного ранка – Дата появления документа = дата 1ой индексации – Дата в сохраненке = дата последнего захода ББ
  • 39. ВОПРОСЫ? • Поломарь Станислав – stas@webit.ru / https://fb.com/stas.polomar • webit – Решает задачи бизнеса в Интернет на http://webit.ru