технология будет внедряться все больше и больше. Например, поисковые системы с легкостью определяют изображения порнографического характера. Они делают это благодаря определению количества телесного цвета на изображении. Таким образом работает цензура поисковой системы, отсеивая неэтичные изображения из прямых источников.
Как стоит интерпретировать информацию о работе данных алгоритмов в практическом смысле? В первую очередь мы получаем ценное понимание того, что поисковые системы стали значительно умнее – они научились понимать контекст страницы. Но я бы сильно поспорил с высказыванием представителей Яндекса о том, что веб-мастерам необходимо просто писать тексты для людей. Некорректность данного высказывания заключается в том, что для того, чтобы написать хорошие тексты для людей, необходимо как минимум изучить их психологию, понять портрет целевого пользователя, узнать всё о его «боли» и проблемах.
Что такому пользователю важно? Как он ищет информацию? Для чего он это делает? Каким образом он пытается сделать свою жизнь лучше, разыскивая ту или иную информацию? В действительности возникает множество важных вопросов, и «просто писать тексты для людей» не получится «просто» – это весьма неординарная задача.
В свете данных алгоритмов мы должны определить полный список ключевых фраз, которые встречаются в данной тематике. Сюда будут относиться вся перекрестная семантика, синонимы, околотематические фразы. В дальнейшем мы поговорим о том, как именно собрать подобную информацию. Я также расскажу о способах составления портрета целевого пользователя.
«Панда» и «Баден-Баден»
Для того чтобы объективно понимать ценность тех или иных техник работы с контентом, мы должны рассмотреть еще два важных алгоритма поисковых систем – это «Панда» у Google и «Баден-Баден» у Яндекс.
Алгоритм Google «Панда» был анонсирован в феврале 2011 года. Данный алгоритм был нацелен на чистку Интернета от низкокачественных сайтов, то есть сайтов, содержащих некачественный контент. Запуск алгоритма прошел не очень гладко, так как в первые же несколько итераций были пессимизированы множественные новостные сайты, популярные форумы, которые активно применяли стороннюю рекламу. Мэтт Каттс – бывший инженер Google, который руководил отделом веб-спама, а в 2017 году покинул Google, раскрыл большие объемы инсайдерской информации. Так, он прокомментировал, что Google в действительности пытался добиться увеличения прибыли от некоторых своих партнеров. В связи с не самым успешным запуском алгоритма в апреле 2011 года Google выпустил новую версию алгоритма, чтобы минимизировать ущерб, который получили множественные проекты в ходе первой итерации.
Алгоритм был назван не в честь редкого китайского животного (для тех, кто не знает: все панды в мире принадлежат КНР), а по фамилии инженера, который его изобрел, – Навнит Панда. Несколько позднее мы вернемся к данному алгоритму, так как требования по работе с контентом в рамках Google Panda совпадают с требованиями