Что такое Поисковая система???

Что такое Поисковая система???

Что такое Поисковая система???

Поисковая система (поисковая машина, поисковый сервер, поисковик, искалка, search engine) — система, позволяющая искать веб-сайты, содержащие указанные ключевые слова. Для того, чтобы собрать информацию, каждая поисковая система имеет специальный модуль (робот), который, переходя от ссылки к ссылке, собирает и индексирует документы, содержащиеся на веб-сайтах.

Поисковая система (поисковая машина, поисковый сервер, поисковик, искалка, search engine) — инструмент для поиска информации в Интернете. Как правило, работа поисковой машины состоит из двух этапов. Специальная программа (поисковый робот, автомат, агент, паук, червяк, crawler) постоянно обходит сеть и собирает информацию с веб-страниц (индексирует их). Когда пользователь задает запрос, поиск идет по предварительно построенному индексу. Результатом поиска является так называемая поисковая выдача — список ссылок на документы (веб-страницы), соответствующие запросу.

Поисковые машины различаются по области действия на локальные (ограничивающиеся национальным доменом, определенным языком) и глобальные. Обычно глобальные искалки (search engine) хорошо покрывают американский интернет (который действительно является значительной частью мирового) и несколько хуже «знают» остальную часть. Поэтому, если ваш поиск заведомо ограничен страной или языком, лучше пользоваться локальной поисковой системой.

Интернет — живая динамическая система, которая меняется быстрее, чем об этом успевает узнать робот поисковой машины. Поэтому иногда найденные документы могут оказаться измененными или вообще не существовать. Некоторые поисковые машины (search engines) при индексации сохраняют у себя образ индексируемого документа и могут показать его пользователю даже после того, как оригинал перестал соответствовать образу. Скорость обновления индекса и полнота покрытия (размер поисковой базы) являются важной характеристикой поисковой машины.

Ссылки на документы в результатах поиска сортируются по по мере соответствия запросу. Этот критерий называется «релевантность». Способ вычисления релевантности является собственным know-how каждой поисковой машины, поэтому выдача по одному и тому же запросу в разных искалках может заметно отличаться.

Поисковые машины обычно имеют специальный язык запросов, с помощью которого можно точнее объяснить машине, что именно надо искать. Однако большинство искалок не требуют от пользователея знания этого языка, как правило, достаточно просто написать в строке запроса несколько ключевых слов, определяющих область вашего интереса. Самым современным искалкам можно задавать запросы просто на естественном, «человеческом» языке. Система сама разберется, какие слова и словосочетания являются ключевыми.

Основной объект индексации поисковой машины — тексты. Однако существуют искалки, позволяющие делать поиск по картинкам, по архивам программ, по mp3, по новостям и др.

Все поисковые машины сталкиваются с проблемой так называемого поискового спама. С большинством сайтов-спамеров удается бороться с помощью специальных алгоритмов, и меры, принимаемые к спамерам, могут быть довольно суровыми — вплоть до полного исключения сайта из поисковой базы.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *