добавить
ссылку в
Email
Fb
подписка
RSS
Twitter
Email
Fb

Поисковая система

Что такое «Поисковая система»?

Сайт, предназначенный для поиска пользователем информации в Интернете. Для запуска практически всех поисковых систем необходимо ввести в так называемую поисковую строку сайта слово или словосочетание, информацию о котором следует найти, и нажать соответствующую кнопку. Результаты поиска выводятся в виде списка ссылок на страницы сайтов и некоторые файловые документы Интернета.

Не следует думать, что по каждому запросу пользователя поисковая система начинает методично "бороздить" весь колоссальный простор Всемирной паутины. Такой поиск отнял бы слишком много времени и ресурсов. Здесь мы подходим к особенностям структуры поисковой системы.

Структура поисковой системы

Основой любой поисковой системы является комплекс программ, называемый поисковой машиной (движком). Базу данных для движка собирает программа, именуемая поисковым роботом, краулером или "пауком". Он работает совершенно самостоятельно и, действительно, последовательно обходит весь Интернет по ссылкам в поисках новой информации. Найденные страницы файлов или документы (их текстовую составляющую) робот заносит в специальный index-файл, называемый индексом поисковой системы.

Вторая важная часть поисковой машины – модуль обработки запросов пользователя. Эта программа ведет поиск слов запроса в индексе. Таким образом, на самом деле поисковый запрос обрабатывается в существующей у поисковой системы базе данных. Поскольку индекс никогда не может полностью соответствовать реальному объему информации всего Интернета, поисковая система ведет поиск с лучшим или худшим качеством.

Основными критериями качества поисковой системы являются релевантность результата поиска, полнота индекса, учет морфологии и других особенностей языка запроса. Релевантность означает, насколько уместным выглядит результат поиска относительно запроса, насколько он соответствует запросу. Полнота индекса может быть ограничена алгоритмом работы паука – например, индексироваться при поиске могут не все страницы больших сайтов, частичный объем текстов и т. п. Кроме того, в индекс не попадают данные большинства закрытых для общего пользования сайтов и баз данных, запрос к которым формируется не путем гиперссылок.

Немного истории

Поисковые системы существовали еще до появления Всемирной паутины (WWW) как таковой. Один из первых поисковиков – Archie – производил осмотр FTP-серверов.

Первая HTTP-поисковая система (1993 г.) называлась Wandex. Ныне ее уже не существует. Также в 1993 г. начала работать Aliweb, ведущая поиск и в наше время. С тех пор ежегодно возникает несколько поисковых систем со все более совершенными роботами и методами анализа.

Различные поисковые системы мира. Статистика

Основные поисковые системы Запада – Google и Yahoo!, Рунета – Яндекс и Рамблер. Существует еще не один десяток различных поисковиков, на долю всей совокупности которых приходится не более 10% от общего числа поисковых запросов Интернета. Среди этих поисковых систем – и такие известные, как MSN и AOL, Microsoft Live Search и Excite, и весьма специфические – например, "кошерный" поисковик Koogle для ортодоксальных иудеев или православный Искомое.ru. Поисковыми системами нередко называют и весьма локальные инструменты, предназначенные для поиска жилья в различных городах, строительных материалов, бытовых товаров и т. п.

По данным 2008 года, ежемесячно все поисковые системы мира обрабатывают более 70 миллиардов поисковых запросов.

Похожие статьи
поисковые системы