Про GOOGLE | страница 8
Ларри интересовало, можно ли проанализировать обратные ссылки, чтобы определить авторитетность веб-страницы подобно тому, как цитирование придает силу исследованию. Это была его большая идея. Претворить ее в жизнь казалось непростым делом.
Чтобы достичь своей цели, Ларри было необходимо проводить поиски во Всемирной сети, исследовать веб-страницы, считать их обратные ссылки и упорядочивать результаты. Этому требовался продуманный математический алгоритм.
Математический алгоритм – это специальный набор шагов, которым необходимо следовать для решения какой-либо математической задачи или выполнения и завершения компьютерного процесса. Еще один способ представить алгоритм – посмотреть на него как на кулинарный рецепт. Пошаговое выполнение инструкций необходимо для достижения конкретного результата.
И у него на примете был как раз подходящий математический ум для этой работы: Сергей Брин. Оказалось, что Сергей тоже все еще был в поиске своей темы диссертации. Идея Ларри показалась ему захватывающей. Сергей объяснил: «Потому что она касалась сети, которая является отражением людских знаний, и потому что Ларри мне понравился».
Но это не было простой задачей. В конце концов, они собирались сосчитать и проанализировать все ссылки со всей всемирной паутины, все 10 миллионов страниц. Им бы понадобилось запустить поискового бота, собирать ссылки, хранить их, а затем еще и анализировать их ценность. Это значит, что нужно было скачать Всемирную сеть – всю целиком.
У поисковых ботов есть пара других крутых имен: сборщики и пауки! Боты это ничто иное, как программы, которые посещают веб-страницы и считывают их содержимое. Каждый сборщик (или бот) охотится на конкретную информацию. Как только он ее находит, паук создает базу данных или индекс того, что найдено, облегчая доступ к информации.
Пропускная способность, необходимая для такой задачи, должна была быть внушительной, намного шире, чем для обычного проекта студента Стэнфорда. Это было куда более крупное дело. Не говоря уже о том, что они собирались работать с кучей данных и им бы понадобился сервер, который бы смог вместить и хранить в себе столько информации.
Сервер – это компьютер со специальной задачей или набором задач. Есть много различных видов серверов. Некоторые, например, хранят файлы или управляют трафиком сети или обеспечивают загрузку веб-страниц. Предназначение сервера определяется его программным обеспечением.
Пропускная способность (ширина полосы) – это частота передачи данных, обычно измеряемая в битах в секунду для данного канала. Наименьшая единица информации в компьютере известна как двоичный символ или бит. Бит – это всегда 1 или 0. Если речь идет о битах в секунду, имеется в виду то, как быстро эти мельчайшие частицы информации передаются или принимаются за одну секунду.