PageRank — один из алгоритмов ссылочного ранжирования.
Алгоритм применяется к коллекции документов, связанных гиперссылками (таких, как веб-страницы из World Wide Web), и назначает каждому из них некоторое численное значение, измеряющее его «важность» или «авторитетность» среди остальных документов. Вообще говоря, алгоритм может применяться не только к веб-страницам, но и к любому набору объектов, связанных между собой взаимными ссылками, то есть к любому графу. Статьи о развитии сайта вы можете прочитать у нас в разделе: Создание сайта и SEO Статьи.
История
В 1996 году Сергей Брин и Ларри Пейдж, тогда ещё аспиранты Стэнфордского университета, начали работу над исследовательским проектом BackRub— поисковой системой по Интернету, использующую новую тогда идею о том, что веб-страница должна считаться тем «важнее», чем больше на неё ссылается других страниц, и чем более «важными» в свою очередь являются эти страницы.Через некоторое время BackRub была переименована в Google. Первая статья с описанием применяющегося в ней алгоритма ранжирования, названного PageRank, появилась в начале 1998 года[3], за ней следом вышла и статья с описанием архитектуры самой поисковой системы. По качеству возвращаемых поисковых результатов их система значительно превосходила все существовавшие тогда поисковые системы, и Брин с Пейджем, осознав её потенциал, основали в сентябре 1998 года компанию Google Inc., для дальнейшего её развития как коммерческого продукта.
С тех пор алгоритмы и математические модели, применяемые при ранжировании в Google значительно улучшились. В интервью в 2007 году Амит Сингхал, представитель отдела качества поиска Google, заявил, что их поисковая система использует более 200 ранжирующих сигналов, лишь одним из которых является PageRank, но он до сих пор играет существенную роль в поисковых продуктах Google. Стоит отметить, что алгоритм PageRank, в том виде, в каком он был изложен Пейджем в статье 1998 года, может быть улучшен в некоторых практических аспектах (например, ссылкам могут назначаться разные веса), и алгоритмы, применяемые в современных поисковых системах, являются скорее лишь его вариантами.
PageRank можно перевести с английского языка как «ранг страницы», однако Google Inc. связывает слово Page в названии алгоритма не с английским словом «страница», а с именем Лэрри Пейджа (англ. Larry Page).
Название «PageRank» является торговой маркой компании Google Inc. Алгоритм запатентован в США 4 сентября 2001 года, в качестве изобретателя алгоритма в патенте указан Ларри Пейдж. Официальным владельцем патента является не Google Inc., а Стэнфордский университет, в котором учились Ларри Пейдж и Сергей Брин в момент подачи заявки на патент.
В 1998 году Google был одной из первых поисковых систем, внедривших ссылочное ранжирование, благодаря чему добился значительного улучшения качества поиска по сравнению с конкурентам. В дальнейшем многие крупные поисковые системы разработали и внедрили свои аналоги PageRank и другие методы статического (то есть запросо-независимого) ранжирования документов.
Google учитывает не все ссылки. Поисковая система отфильтровывает ссылки с сайтов, специально предназначенных для скопления ссылок. Некоторые ссылки могут не только не учитываться, но и отрицательно сказаться на ранжировании ссылающегося сайта (такой эффект называется поисковой пессимизацией). В Google понимают, что вебмастер не в состоянии повлиять на входящие внешние ссылки, но полностью контролирует исходящие ссылки со своего сайта. Поэтому ссылки на сайт не могут повредить ему, но ссылки с сайта — могут. Следует внимательно относиться к сайтам, на которые вы ссылаетесь.
Google использует показатель PageRank найденных по запросу страниц, чтобы определить порядок выдачи этих страниц посетителю в результатах поиска.
Это означает, что поиск в Google работает следующим образом:
ищутся все страницы, в которых есть слова из запроса пользователя;
найденные страницы ранжируются на основе текстовых критериев;
учитывается текст ссылок на сайт;
результаты корректируются с учётом PageRank каждой страницы.
Шкала PageRank может изменяться от 0 до 10. Разделение на единицы по шкале основано на логарифмической зависимости или на чём-то весьма схожем, но только не на равномерном разделении. Перерасчёт значимости страниц происходит во время так называемого «Google Dance». Можно придерживаться примерно такой градации: PageRank от 4 до 5 — наиболее типичный для большинства сайтов средней «раскрученности». 6 — очень хорошо «раскрученный» сайт. 7 — величина, практически недостижимая для множества сайтов, но иногда встречается. Значения 8, 9, 10 имеют исключительно популярные и значимые проекты.Значение 10 имеют всего несколько десятков сайтов. В их числе сам Google. Ранее это были также whitehouse.gov, adobe.com, w3c.org и т. д.
Следует отметить, что PageRank — это параметр относящийся к каждой отдельной странице, но не всему сайту в целом. На одном сайте могут находиться страницы с разным PageRank.
Похожие статьи:
Статьи → Google определил популярные голосовые запросы россиян
Статьи → Google анонсировала безлимитный фотосервис Google Photos
Статьи → Гендиректор Google назвал основателя Tesla Motors похожим на бездомного
Статьи → Apple и Google в третий раз подряд признаны самыми дорогими брендами мира
Статьи → Google запретили читать переписку российских пользователей