ݺߣ

ݺߣShare a Scribd company logo
вводный доклад, анатомия поисковых машин
Поисковые оптимизаторы регулярно пытаются разобраться в алгоритмах
поисковых машин, чтобы было легче объяснить, что на самом деле представляет
процесс от индексации до нахождения нужного результата. Хорошая поисковая
машина, работающая со всей своей оптимальной производительностью, должна
обеспечивать эффективное местонахождение веб-страниц, полный охват сети,
новейшую информацию, непредвзятый равноправный доступ ко всей
информации, удобный интерфейс для пользователей, кроме того, выдачу наиболее
подходящих результатов на момент выполнения запроса.
Обеспечение содержательного доступа к большим объемам информации — это
трудная задача. Наиболее успешные методы и подходы к информационному
поиску, распределение документов по категориям очень сильно полагаются на
статистические технологии.
МОДУЛИ ПОИСКОВЫХ МАШИН
1. Модуль краулера/спайдера
2. Модуль склада/базы данных
3. Модуль индексатора/анализа ссылок
4. Модуль поиска/ранжирования
5. Пользовательский интерфейс запроса
вводный доклад, анатомия поисковых машин
ПОИСКОВЫЕ МАШИНЫ НАХОДЯТ ВЕБ-
СТРАНИЦЫ ТРЕМЯ СПОСОБАМИ


I.    при помощи использования стартового сбора URL-страниц (по-другому веб-
      страниц) и извлечения из них ссылок, чтобы следовать по ним
      (например, выбирая их из каталогов);
II.   из списка URL, полученного при прошлом исследовании сети (используя
      первые результаты проведенных поисков);
III. URL, добавленных искусственно веб-мастерами непосредственно в
     поисковую машину (при помощи «Добавить URL»).
Существует много различных типов краулеров в сети. Есть те, которые
применяются для личного использования непосредственно с рабочего стола
вашего компьютера, и такие, которые собирают адреса электронной почты, или
разного рода коммерческие краулеры, которые выполняют исследования,
измеряют сеть и выявляют работу шпионских программ.
Описанные краулеры, спайдеры и роботы — это автоматизированные программы,
которыми обычно управляют поисковые машины, ползающие по ссылкам сети и
собирающие первичные текстовые данные и другую информацию для
индексации.
Сегодняшние краулеры, которые появились в течение последних нескольких лет в
результате роста сети, были полностью изменены со времен ранних роботов.
Однако, хотя они все еще используют ту же самую базовую технологию, теперь
они запрограммированы на более индивидуальные собственные разноуровневые
системы.
Хотя ползание по сети — очень быстрый процесс, фактически, краулер делает те
же самые действия, что и рядовой серфер-пользователь.
вводный доклад, анатомия поисковых машин

More Related Content

Similar to вводный доклад, анатомия поисковых машин (20)

Puple's presentation
Puple's presentationPuple's presentation
Puple's presentation
Kuznecov
поисковые системы презентация ученика
поисковые системы презентация ученикапоисковые системы презентация ученика
поисковые системы презентация ученика
Kuznecov
Разновидности поисковых систем в Интернете
Разновидности поисковых систем в ИнтернетеРазновидности поисковых систем в Интернете
Разновидности поисковых систем в Интернете
obstinate
Презентация - Web
Презентация - WebПрезентация - Web
Презентация - Web
Maksim Kislov
информатика
информатикаинформатика
информатика
PR15049455
Prezent puti interneta_neispovedimi
Prezent puti interneta_neispovedimiPrezent puti interneta_neispovedimi
Prezent puti interneta_neispovedimi
rinto2
информационные и информационно поисковые системы интернет
информационные и информационно поисковые системы интернетинформационные и информационно поисковые системы интернет
информационные и информационно поисковые системы интернет
Inno4ka2323
Информационное облако
Информационное облакоИнформационное облако
Информационное облако
startuptour
C# Web. Занятие 01.
C# Web. Занятие 01.C# Web. Занятие 01.
C# Web. Занятие 01.
Igor Shkulipa
835453
835453835453
835453
PillowIsGod
скIm2 занятие 2 - seo, семантика
скIm2   занятие 2 - seo, семантикаскIm2   занятие 2 - seo, семантика
скIm2 занятие 2 - seo, семантика
Ivan Pronko
информационный поиск в интернет
информационный поиск в интернет информационный поиск в интернет
информационный поиск в интернет
Savua
Возможности Мониторикса
Возможности МониториксаВозможности Мониторикса
Возможности Мониторикса
Vyacheslav Tykhonov
Поиск информации в интернете при помощи поисковых систем
Поиск информации в интернете при помощи поисковых системПоиск информации в интернете при помощи поисковых систем
Поиск информации в интернете при помощи поисковых систем
werro33
Техническая оптимизация сайтов
Техническая оптимизация сайтовТехническая оптимизация сайтов
Техническая оптимизация сайтов
Yury Vasyn
AntiPhishStack [RU] .pdf
AntiPhishStack [RU]                  .pdfAntiPhishStack [RU]                  .pdf
AntiPhishStack [RU] .pdf
Хроники кибер-безопасника
Поисковая система
Поисковая системаПоисковая система
Поисковая система
lizazam
Useful Meetup #3. Platform Thinking
Useful Meetup #3. Platform ThinkingUseful Meetup #3. Platform Thinking
Useful Meetup #3. Platform Thinking
usefulagency
Puple's presentation
Puple's presentationPuple's presentation
Puple's presentation
Kuznecov
поисковые системы презентация ученика
поисковые системы презентация ученикапоисковые системы презентация ученика
поисковые системы презентация ученика
Kuznecov
Разновидности поисковых систем в Интернете
Разновидности поисковых систем в ИнтернетеРазновидности поисковых систем в Интернете
Разновидности поисковых систем в Интернете
obstinate
Презентация - Web
Презентация - WebПрезентация - Web
Презентация - Web
Maksim Kislov
информатика
информатикаинформатика
информатика
PR15049455
Prezent puti interneta_neispovedimi
Prezent puti interneta_neispovedimiPrezent puti interneta_neispovedimi
Prezent puti interneta_neispovedimi
rinto2
информационные и информационно поисковые системы интернет
информационные и информационно поисковые системы интернетинформационные и информационно поисковые системы интернет
информационные и информационно поисковые системы интернет
Inno4ka2323
Информационное облако
Информационное облакоИнформационное облако
Информационное облако
startuptour
C# Web. Занятие 01.
C# Web. Занятие 01.C# Web. Занятие 01.
C# Web. Занятие 01.
Igor Shkulipa
скIm2 занятие 2 - seo, семантика
скIm2   занятие 2 - seo, семантикаскIm2   занятие 2 - seo, семантика
скIm2 занятие 2 - seo, семантика
Ivan Pronko
информационный поиск в интернет
информационный поиск в интернет информационный поиск в интернет
информационный поиск в интернет
Savua
Возможности Мониторикса
Возможности МониториксаВозможности Мониторикса
Возможности Мониторикса
Vyacheslav Tykhonov
Поиск информации в интернете при помощи поисковых систем
Поиск информации в интернете при помощи поисковых системПоиск информации в интернете при помощи поисковых систем
Поиск информации в интернете при помощи поисковых систем
werro33
Техническая оптимизация сайтов
Техническая оптимизация сайтовТехническая оптимизация сайтов
Техническая оптимизация сайтов
Yury Vasyn
Поисковая система
Поисковая системаПоисковая система
Поисковая система
lizazam
Useful Meetup #3. Platform Thinking
Useful Meetup #3. Platform ThinkingUseful Meetup #3. Platform Thinking
Useful Meetup #3. Platform Thinking
usefulagency

вводный доклад, анатомия поисковых машин

  • 2. Поисковые оптимизаторы регулярно пытаются разобраться в алгоритмах поисковых машин, чтобы было легче объяснить, что на самом деле представляет процесс от индексации до нахождения нужного результата. Хорошая поисковая машина, работающая со всей своей оптимальной производительностью, должна обеспечивать эффективное местонахождение веб-страниц, полный охват сети, новейшую информацию, непредвзятый равноправный доступ ко всей информации, удобный интерфейс для пользователей, кроме того, выдачу наиболее подходящих результатов на момент выполнения запроса. Обеспечение содержательного доступа к большим объемам информации — это трудная задача. Наиболее успешные методы и подходы к информационному поиску, распределение документов по категориям очень сильно полагаются на статистические технологии.
  • 3. МОДУЛИ ПОИСКОВЫХ МАШИН 1. Модуль краулера/спайдера 2. Модуль склада/базы данных 3. Модуль индексатора/анализа ссылок 4. Модуль поиска/ранжирования 5. Пользовательский интерфейс запроса
  • 5. ПОИСКОВЫЕ МАШИНЫ НАХОДЯТ ВЕБ- СТРАНИЦЫ ТРЕМЯ СПОСОБАМИ I. при помощи использования стартового сбора URL-страниц (по-другому веб- страниц) и извлечения из них ссылок, чтобы следовать по ним (например, выбирая их из каталогов); II. из списка URL, полученного при прошлом исследовании сети (используя первые результаты проведенных поисков); III. URL, добавленных искусственно веб-мастерами непосредственно в поисковую машину (при помощи «Добавить URL»).
  • 6. Существует много различных типов краулеров в сети. Есть те, которые применяются для личного использования непосредственно с рабочего стола вашего компьютера, и такие, которые собирают адреса электронной почты, или разного рода коммерческие краулеры, которые выполняют исследования, измеряют сеть и выявляют работу шпионских программ. Описанные краулеры, спайдеры и роботы — это автоматизированные программы, которыми обычно управляют поисковые машины, ползающие по ссылкам сети и собирающие первичные текстовые данные и другую информацию для индексации. Сегодняшние краулеры, которые появились в течение последних нескольких лет в результате роста сети, были полностью изменены со времен ранних роботов. Однако, хотя они все еще используют ту же самую базовую технологию, теперь они запрограммированы на более индивидуальные собственные разноуровневые системы. Хотя ползание по сети — очень быстрый процесс, фактически, краулер делает те же самые действия, что и рядовой серфер-пользователь.