Принцип устройства поисковых машин.


В Интернете существует очень много поисковых машин, но все они построены по одному принципу. Все поисковые машины состоят из трёх частей, ни одна из этих частей не может существовать без другой.

Рассмотрим каждую часть:

  • Поисковый робот или "паук". По сути, из себя ничего не представляет - это программа, она делает основную функцию поисковой машины - поиск новых страниц. Паук, попадая на страницу начинает поиск ссылок на другие страницы. Далее он переходит на все ссылки с этой страницы и попадает на следующие, на следующих по ссылкам на них - на следующие. И так продолжается без остановки. При переходе со страницы на страницу робот индексирует страницу. То есть он отправляет копию страницы в архивную часть поисковой машины.
  • Самая большая часть поисковой машины - собственно индекс. Это просто большое количество жёстких дисков. Здесь просто хранятся все тексты (только тексты и больше ничего!) со страниц, найденных "пауком". По этой части поисковая машина и осуществляет сам поиск, т.е. программная оболочка за несколько долей секунды осуществляет поиск по огромному числу текстовых документов. Попробуйте задать своему компьютеру поиск какой-нибудь фразы на жёстком диске хотя бы 20 Гбайт. Сколько будет компьютер искать? Этим-то и отличаются поисковые машины, что они могут выполнять поиск сразу для нескольких тысяч потребителей (!!!) за очень короткий промежуток времени.
  • Всё, что видит пользователь у себя на мониторе и программная часть. Вы набираете у себя на компьютере адрес поисковой машины и видите её главную страницу. Далее набираете свой запрос и через несколько секунд (пока загрузится готовый запрос) вам выдаётся готовый ответ. Проводит поиск и рассортировывает полученные данные специально созданная программа - они и является третьей частью поисковой машины. Эта программа создаётся несколько лет и всё время совершенствуется. То, что вы можете наблюдать у себя на мониторе также является частью этой программы.

Для того чтобы ваша страница сразу же попала в индекс поисковой машины, надо её персонально зарегистрировать. Для добавления своего сайта в очередь для индексирования поисковым роботом надо нажать на ссылку "Добавить сайт" обычно находящуюся внизу страницы любого поисковика. Открывается страница регистрации нового ресурса. Перед добавлением прочитайте правила - здесь ничего замысловатого нет.

webmaster.xeno.ru

Самая полезная реклама:

© Рекламатик, 2018-2018.