В последние годы Google постоянно критиковали за ухудшение качества результатов поиска: в них растет доля ссылок на мусорные сайты с некачественным контентом, специальным образом оптимизированные их владельцами для попадания на первые строчки поисковой выдачи. В ответ на запросы СМИ и экспертов представители поисковика неизменно заявляли, что такие утверждения не соответствуют официальному руководству Google по SEO-оптимизации для владельцев сайтов.
Ряд деталей в утекших документах ставят под сомнение достоверность публичных заявлений Google о том, как работает поиск. «Слово ‘солгали’ жесткое, но это единственное точное слово в данном случае, — пишет Майк Кинг. — Хотя я не виню публичных представителей Google за стремление защитить конфиденциальную информацию, я возражаю против их попыток активно дискредитировать людей в мире маркетинга, технологий и журналистики, которые публикуют воспроизводимые открытия из области SEO».
Вот один из самых ярких примеров: в Google неоднократно заявляли, что не применяют для ранжирования результатов информацию о поведении пользователей в своем браузере Chrome с глобальной аудиторией без малого в 3,5 миллиарда пользователей и не применяют для ранжирования информацию о кликах. В утечке нашлось сразу несколько подтверждений тому, что это не так.
Представители поисковика также отрицали, что метрика EEAT (experience, expertise, authoritativeness, trustworthiness — опыт, экспертиза, авторитетность, достоверность), применяемая для оценки качества поисковых результатов, является одним из факторов ранжирования. Однако Майк Кинг пишет, что обнаружил в конфиденциальных документах поисковика описания функций алгоритма, фиксирующих имя автора в новостных и научных статьях. Этот не доказывает однозначно, что имя применяется для ранжирования, но однозначно говорит о важности этого параметра для поисковика.
Выяснилось, что как минимум по некоторым чувствительным темам — таким как пандемия коронавируса или президентские выборы в США в 2024 году — Google вмешивался в выдачу вручную и создавал «белые списки» сайтов, чтобы отсекать ресурсы с дезинформацией. В компании отрицали, что новые сайты, для которых пока не набралось достаточно данных о достоверности, сначала попадают в «песочницу», где для их оценки применяются не такие правила, как для оценки уже зарекомендовавших себя ресурсов. Однако в документации нашли параметр hostAge, который как раз и используется для борьбы со «свежим спамом».
Проанализировавшие утечку из Google SEO-эксперты приходят к мнению, что в реальности на позицию сайта в выдаче сейчас в гораздо большей степени влияют так называемые поведенческие факторы — клики пользователей и их навигация по сайту, чем контент сайта и ссылки на него с других ресурсов. Поисковик также учитывает при ранжировании размер бренда сайта — насколько часто его упоминают, даже без прямых гиперссылок, на других страницах. В результате новым и нишевым ресурсам, даже если их контент качественный, пробиться в первые строчки выдачи только за счет контента, без SEO-манипуляций, нереально.