PageRank

pagerankPageRank (Пэйдж-Ранк)

— один из алгоритмов ссылочного ранжирования ПС Гугл. Он применим к коллекции документов, которые каким-то образом связны с гиперссылками (вроде веб-страниц всемирной паутины). Алгоритм PageRank назначает каждому из таких документов определенное численное значение, которое должно измерять его «значимость» или «авторитетность» в сравнении с другими документами. Важно помнить, что не только к веб-страницам может применяться данный алгоритм. Если говорить в общем, то PageRank можно применить к всякому набору объектов, связанных между собой взаимными ссылками, иными словами, к любому графу. Итак чем больше PageRank вашего сайта, тем больше вы можете заработать в интернете на размещении ссылок.

История создания этого алгоритма начинается в 1996 году. Тогда два аспиранта Стэндфордского университета Сергей Брин и Ларри Пейдж начинают работать на исследовательским проектом BackRub. Это была поисковая система по Интернету, основанная на идее и том, что значимость веб-страницы должна определяться количеством ссылок на нее других страниц. При этом, также учитывалась значимость этих страниц. По прошествии какого-то времени никому неизвестные слова BackRub превратились в одно знаменитое сейчас слово Google.

Первое упоминание об алгоритме PageRank в научном издании появилось в начале 1998 года. В ней описывался сам алгоритм ранжирования. Чуть позже была опубликована статья с подробным описанием самой поисковой системы. Качество возвращаемых поисковых результатов в их поисковой системе было невероятным, оно было намного выше, чем у всех существовавших тогда аналогов.

Сергей Брин и Ларри Пейдж решили, что за этим будущее и основали в сентябре 1998 года компанию Google Inc. Они решили зарабатывать деньги на своих идеях.

С того далекого 1998 года все алгоритмы и математические модели, использующиеся при ранжировании в Google претерпели ряд изменений и значительно улучшились. В 2007 году представитель отдела качества поиска Google в интервью сообщил о том, что в работе поисковой системы задействовано более 200 ранжирующих сигналов, и PageRank является только лишь одним из них, впрочем, он до сих пор имеет огромное значение в поисковых продуктах Google. Впрочем, нужно уточнить, что используемая сейчас версия этого алгоритма существенно отличается от той, что была описана в статье Пейджа в 1998 году. С тех пор улучшению подверглись многие аспекты PageRank.

Интересный факт. Название алгоритма — PageRank, что с английского буквально переводится как «ранг страницы». Такое название, в общем-то, соответствует назначению алгоритма. Но руководство компании Google Inc. уверяют мировую общественность в том, что слово «Page» в данном случае является не «страницей», а фамилией разработчика — Ларри Пейджа (англ. Larry Page). Правда это или нет, никто кроме самих разработчиков, конечно же, не знает.

Как бы ни переводилось слово «Page», важно то, что технология PageRank в 2004 году была зарегистрирована как торговая марка компании Google Inc. Впрочем, еще до того как Лари Пейджем был запатентован этот алгоритм, он уже успешно использовался в работе поисковой системы Google образца 1998 года. Они тогда очень сильно отличались от подобных систем качеством поиска. В дальнейшем сторонние компании разработали свои собственные аналоги PageRank, но до оригинала они все-таки не дотягивали.

Напомним, что PageRank работает на основе ранжирования веб-страниц. То есть, есть какая-то числовая величина, которая характеризует «важность» веб-страницы, скажем, от 1 до 10. Чем больше раз на эту страницу ссылаются другие веб-ресурсы, тем выше становится цифра. И кроме того, имеет значения какие именно страницы ссылаются на определяемую страницу. Чем выше ранг тех страниц, на которых появляются ссылки на определяемый сайт, тем выше будет множитель «важности».