Поисковые системы имеют небольшой перечень важнейших режимов работы, которые позволяют им обеспечивать результаты поиска информации в сети.
Просмотр сети
Поисковые системы выполняют автоматизированные программы, называемые “пауки”, которые используют структуру гиперссылок сети для “просмотра” страниц и документов, которые составляют Всемирную Сеть. По некоторым подсчетам из примерно 20 миллиардов существующих страниц, поисковые системы просмотрели от 8 до 10 миллиардов.
Индексированные документы
После просмотра страницы, ее содержание “индексируется” – сохраняется в гигантской базе данных документов, которые составляют “индекс” поисковой системы. Необходимо, чтобы этот индекс тщательно контролировался таким образом, чтобы запросы, в целях которых осуществляются поиск и сортировка миллиардов страниц, выполнялись в доли секунд.
Обработка запросов
Когда запрос на поиск информации поступает в поисковую систему (их поступает сотни миллионов в день), поисковая система находит и предоставляет из своего индекса все документы, которые соответствуют запросу. Соответствие устанавливается, если термины или фразы найдены на странице в форме, которую указал пользователь. Например, поиск журнала об автомобилях и водителях на Google дал 8.25 миллионов результатов, но поиск той же фразы в заданной форме (“журнал об автомобилях и водителях”) дал только 166 тысяч результатов. В первом случае, обычно называемом методом “Найти все”, Google показывает все документы, на страницах которых встречаются термины “автомобиль”, “водитель”, и “журнал” (не учитывается слово “и”, потому что оно бесполезно при минимизации количества результатов). В то время когда во втором варианте, только те страницы, на которых встречается заданная фраза “журнал об автомобилях и водителях”, были включены в результаты.
Рейтинг результатов
После того, как поисковая система определила соответствующие запросу результаты, ее алгоритм (математическое уравнение, обычно используемое для сортировки) проводит расчеты каждого результата, для определения какой из них более соответствует данному запросу. Он сортирует результаты от наиболее к наименее соответствующему, таким образом, чтобы пользователь мог сделать свой выбор.
Хотя операции поисковых систем занимают немного времени, такие системы как Google, Yahoo!, AskJeeves, и MSN являются наиболее комплексными в мире. Они обрабатывают миллионы расчетов каждую секунду и группируя запросы информации в огромные группы пользователей.