Как работает поисковая система

Как работает поисковая система

Многие пользователи почему-то считают, что в ответ на их вопрос поисковая система начинает быстро-быстро шерстить Интернет, после чего выдает список страниц, где отыскалось что-то похожее на строку поиска, введенную пользователем. Разумеется, в действительности все происходит совершенно не так, потому что если бы поисковая система при каждом запросе шерстила весь Интернет (или даже его маленькую часть), ответа приходилось бы дожидаться годами.

На самом деле, почти каждая поисковая система (скажем так — классическая поисковая система) состоит из трех основных ком¬понентов:
• веб+паука (web spider);
• индексатора;
• алгоритма поиска и оценки результатов

Веб-паук, несмотря на всю экзотичность подобного названия, — Это всего-навсего специальная программа, которая запускается ил компьютере (компьютерах), подключенном к Интернету, и ее новная задача — шерстить весь этот Интернет (точнее, интертовские странички) во всех возможных направлениях. Ведь 1анички, как мы говорили, состоят из гиперссылок, так вот паук и носится как угорелый по гиперссылкам «паутины» сайтов скачивает полученные таким образом странички для второго компонента — индексной базы.

Индексатор — это обработчик скачанных веб-пауком страниц, и извлекает оттуда все слова и складывает их в поисковую базу (индексную базу). При этом индексатор записывает, где именно было найдено то или иное слово, и данная информация потом используется в поиске.

Алгоритм поиска — это главное ноу-хау любой поисковой системы. От алгоритма зависит эффективность полученного результата и - то есть насколько быстро и точно пользователь найдёт то, что его интересует.