видите такое дробление на уровне сигналов только увеличивает объем книги, заполняя её малозначимой информацией, только запутывает всех, и снижает уровень понимания основных факторов.
Ведущий инженер Google – Сингхал как раз и занимался разработкой системы ранжирования страниц, которая включает в себя более 2000 видов информации, или то, что Google называет «сигналами».
PageRank – это всего лишь один сигнал.
Некоторые сигналы находятся на веб-страницах – например, слова, ссылки, изображения и так далее.
Некоторые взяты из истории того, как страницы менялись со временем. Некоторые сигналы – это паттерны данных, обнаруженные в триллионах поисковых запросов, которые Google обрабатывал на протяжении многих лет.
«Данные, которые мы имеем, продвигают современное состояние», – говорит г-н Сингхал.
«Мы видим, что все ссылки ведут на страницу, как содержание меняется на странице с течением времени».
Google все чаще использует сигналы, поступающие из истории того, что отдельные пользователи искали в прошлом, чтобы предлагать результаты, которые отражают интересы каждого человека.
Например, поиск «дельфинов» будет давать разные результаты для пользователя.
Человека, который прежде посещал сайты с футбольной тематикой, Google воспринимает как футбольного фаната клуба Дельфинов, и выдаст один результат.
А для пользователя, который является морским биологом – другой. Это работает только для пользователей, которые входят в одну из служб Google, например, Gmail.
Если же Google не может определить человека, то он выдаёт оба варианта.
Как только Google отправляет свои бесчисленные сигналы, они подают в их формулы, которые Google называет классификаторами (факторами), которые пытаются вывести полезную информацию о типе поиска, чтобы отправить пользователя на самые полезные для него страницы. Классификаторы могут, например, сказать, ищет ли кто-то продукт для покупки или информацию о месте, компании или человеке.
Google недавно разработала новый классификатор для определения имён людей, которые не известны. Другой внедрённый классификатор идентифицирует торговые марки.
Эти сигналы / классификаторы определяем, как факторы ранжирования. Они рассчитывают несколько ключевых показателей релевантности страницы, в том числе тот, который называется «актуальность» – показатель того, как тема страницы относится к широкой категории запроса пользователя. Например, страница с речью президента России в Кировограде в Кремле имела бы высокую актуальность для Кировоградчан, в меньшей степени для самого президента, и ещё меньше для Кремлёвских чиновников. Google объединяет все эти факторы в итоговую оценку релевантности.
Сайты с 10-ю наивысшими баллами получают желанные места на первой странице поиска, если только итоговая проверка не показывает, что в результатах недостаточно «разнообразия».
«Если у вас много разных точек зрения на одной странице, часто это более полезно,