добавить
ссылку в
Email
Fb
подписка
RSS
Twitter
Email
Fb

Поисковая система

Что такое «Поисковая система»?

Сайт, предназначенный для поиска пользователем информации в Интернете. Для запуска практически всех поисковых систем необходимо ввести в так называемую поисковую строку сайта слово или словосочетание, информацию о котором следует найти, и нажать соответствующую кнопку. Результаты поиска выводятся в виде списка ссылок на страницы сайтов и некоторые файловые документы Интернета.

Не следует думать, что по каждому запросу пользователя поисковая система начинает методично "бороздить" весь колоссальный простор Всемирной паутины. Такой поиск отнял бы слишком много времени и ресурсов. Здесь мы подходим к особенностям структуры поисковой системы.

Структура поисковой системы

Основой любой поисковой системы является комплекс программ, называемый поисковой машиной (движком). Базу данных для движка собирает программа, именуемая поисковым роботом, краулером или "пауком". Он работает совершенно самостоятельно и, действительно, последовательно обходит весь Интернет по ссылкам в поисках новой информации. Найденные страницы файлов или документы (их текстовую составляющую) робот заносит в специальный index-файл, называемый индексом поисковой системы.

Вторая важная часть поисковой машины – модуль обработки запросов пользователя. Эта программа ведет поиск слов запроса в индексе. Таким образом, на самом деле поисковый запрос обрабатывается в существующей у поисковой системы базе данных. Поскольку индекс никогда не может полностью соответствовать реальному объему информации всего Интернета, поисковая система ведет поиск с лучшим или худшим качеством.

Основными критериями качества поисковой системы являются релевантность результата поиска, полнота индекса, учет морфологии и других особенностей языка запроса. Релевантность означает, насколько уместным выглядит результат поиска относительно запроса, насколько он соответствует запросу. Полнота индекса может быть ограничена алгоритмом работы паука – например, индексироваться при поиске могут не все страницы больших сайтов, частичный объем текстов и т. п. Кроме того, в индекс не попадают данные большинства закрытых для общего пользования сайтов и баз данных, запрос к которым формируется не путем гиперссылок.

Немного истории

Поисковые системы существовали еще до появления Всемирной паутины (WWW) как таковой. Один из первых поисковиков – Archie – производил осмотр FTP-серверов.

Первая HTTP-поисковая система (1993 г.) называлась Wandex. Ныне ее уже не существует. Также в 1993 г. начала работать Aliweb, ведущая поиск и в наше время. С тех пор ежегодно возникает несколько поисковых систем со все более совершенными роботами и методами анализа.

Различные поисковые системы мира. Статистика

Основные поисковые системы Запада – Google и Yahoo!, Рунета – Яндекс и Рамблер. Существует еще не один десяток различных поисковиков, на долю всей совокупности которых приходится не более 10% от общего числа поисковых запросов Интернета. Среди этих поисковых систем – и такие известные, как MSN и AOL, Microsoft Live Search и Excite, и весьма специфические – например, "кошерный" поисковик Koogle для ортодоксальных иудеев или православный Искомое.ru. Поисковыми системами нередко называют и весьма локальные инструменты, предназначенные для поиска жилья в различных городах, строительных материалов, бытовых товаров и т. п.

По данным 2008 года, ежемесячно все поисковые системы мира обрабатывают более 70 миллиардов поисковых запросов.

Если если вам понравилась эта статья, вы можете подписаться на материалы моего блога через rssRSS или emailemail, а также присоединиться ко мне в twitterTwitter или vkontakteВКонтакте.

Последние статьи блога

Пишем инструмент для проверки наличия ссылок

Пишем инструмент для проверки наличия ссылок

Многие из вас наверняка используют для продвижения своих проектов, такую популярную вещь как покупка ссылок и статей "навсегда". Этот метод имеет очень много плюсов и, в долгосрочной перспективе, несомненно, выгоден. Но у него есть один большой недостаток — ваша честно купленная ссылка может в один прекрасный день быть просто снята, разместившим её вебмастером. Что же делать? Ответ очевиден — нам необходимо средство контроля размещения ссылок.

Не спешите бежать на биржу фрилансеров и искать и исполнителя, ведь написание этого скрипта — не такое сложное дело как кажется на первый взгляд. Постоянные читатели журнала наверняка помнят, что в одной из статей мы подробно разбирали процесс написания простого парсера на PHP. Настало время продолжить наши обучающие уроки для SEO-программистов и написать скрипт проверки ссылок на наличие.

подробнее…
Дата сегодня 5

Как установить счетчик на сайт

Как установить счетчик на сайт

Несомненный атрибут любого современного сайта — счетчик. Благодаря этому многофункциональному инструменту Вы всегда будете держать руку на пульсе ресурса. Сколько страниц Вашего детища просмотрели сегодня? Какое количество людей? Откуда они пришли? Что их заинтересовало? На эти и многие другие вопросы ответ даст сервис статистики. Разнообразных счетчиков существует предостаточно, но мы остановим свой выбор на одном из самых популярных и многофункциональных – Liveinternet.

подробнее…
Дата 26 июля 2010 г. 5

Добавляем сайт в крупнейшие поисковые системы мира

Добавляем сайт в крупнейшие поисковые системы мира

Регистрация в поисковых системах — то, с чего начинает жизнь любой сайт. Можно, конечно, обойтись и без этого предоставив поисковым системам возможность самостоятельно найти наш сайт, но лучше, все же, ускорить этот процесс и вручную добавить свой сайт в их индекс.

Не будем ограничиваться рамками Рунета и приведем список аддурилок и для зарубежных поисковых систем, включая поисковики даже для таких экзотических языков как китайский, хинди и арабский, поскольку найти на их сайтах форму добавления URL довольно проблематично. Впрочем "экзотических" возможно, не самое удачное слово для языков занимающих первые три места в мире по численности говорящих на них:)

подробнее…
Дата 22 июля 2010 г. 2