4. Расстояния между словами пересчитываются,
в зависимости от семантической разметки, а
не удаленности в файле
5. Google может сам размечать
ваши документы
• Списки могут создаваться таблицами <table>, <tr>
• Могут создаваться блоковыми элементами <div>
• Тегами параграфа <p>
• Просто с помощью разделителей строки <br>
• Page analyzer component анализирует структуру
документа, и не только списки
11. Учитываемые характеристики ссылок
• Размер и цвет текста ссылки
• Позиция в документе (списки, текст, до или после
первого экрана 800х600, боковая панель, футер...)
• Позиция в списке (если ссылка в списке)
• Количество слов в анкоре, их коммерческость
• Тип ссылки (текст, картинка), соотношение сторон
• Слова, окружающие ссылку
• Внутренняя или внешняя, тематический кластер
12. Учитываемые характеристики донора
• Количество ссылок
• Присутствие слов в тексте и заголовках
• Тематический кластер документа
• Степень соответствия тематических кластеров
донора и ссылки
13. Учитываемые поведение пользователей
• Клики по ссылкам, вводимые адреса, заполнения
форм
• Язык и интересы пользователя
• Используемые ключевые слова
• Частота клика по ссылке
• Как часто ссылки не кликаются при выборе других
• Как часто ни одна ссылка в документе не кликается
• ...
15. Для попадания в блок ответов
используйте natural language answer
ln2.in/pat_354
16. Особенности блок-ответов
• Показываются только по intent- или factual- queries
• Натуральный язык запроса является intent-query
• Имеется ограниченный набор шаблонов, и блек-листы,
созданные модераторами
• Основной ключ должен входить в заголовок
• Для тематической классификации используется анализ
слов в релевантных пассажах (LSI-фраз)
• Для ряда тематик необходимы списки
• Ответ выбирается только из natural language
24. Для чего?
• Борьба со спамными техниками
• Дает не тот эффект, который ожидал оптимизатор
(вводит в заблуждение)
• Позволяет выявлять документы и сайты,
продвигающиеся спамом
27. Особенности
• Функция перехода выбирается из множества: с
задержкой по времени, отрицательная, случайная.
• Модификация ранка на 10% включит отрицательную
функцию перехода.
• Идентификация спама происходит во время действия
функции перехода.
• Изменение сигналов выше порогового значения
приводят к фильтрации спама (обнулении рейтинга).
• Функция перехода может устанавливаться не только для
документа, но и для всего сервера.
28. Анализируемые спам-техники
• Переспам текста ключевыми словами
• Невидимый текст
• Мелкий шрифт
• Редиректы (подмена)
• Переспам мета-тегов
• Манипуляции ссылками
• С 2010 года список пополнился
29. Как искать патенты
• patents.google.com
• www.seobythesea.com
• http://patents.ic.gc.ca/opic-cipo/cpd/eng/search/
advanced.html
• другие поисковики патентов