ADPASS рекомендует материал к прочтению
PromoPult
18.05.2022, 11:30

Как в один клик собрать метатеги и заголовки с любого сайта

Инструкция по парсингу Title, Description, Keywords, H1-H6 с помощью инструмента от PromoPult.

Оптимизация метатегов и заголовков важна для улучшения позиций страниц в результатах поисковой выдачи и повышения кликабельности сниппетов. Но часто на одних страницах метатеги и заголовки не заполнены, на других — слишком короткие, на третьих — недостаточно точно характеризуют содержание, на четвертых — дублируют друг друга. Также из-за недоработки вебмастера или специфики CMS возникают проблемы с заголовками h1-h6: непоследовательная структура, отсутствие подзаголовков, нерелевантные заголовки.

Выявить проблемы можно вручную путем анализа исходного кода. Но такой подход оправдан, если перед вами 10-20 страниц. В противном случае необходимо автоматизировать сбор данных.

Инструмент парсинга метатегов и заголовков от PromoPult

В PromoPult есть собственный инструмент сбора данных из метатегов и заголовков h1-h6.

Возможности парсера:

  • сбор заголовков title, мета description, keywords и заголовков h1-h6 (вместе или по отдельности) с любого сайта;

  • загрузка URL из XLSX-файла, текстового файла или списком;

  • выгрузка отчетов в формате HTML или XLSX.

Особенности работы:

  • нет ограничений по количеству URL и количеству проверок в сутки;

  • сервис работает в облаке, не нужно устанавливать софт;

  • парсинг в фоне — можно запустить задачу и закрыть браузер;

  • после завершения парсинга приходит уведомление на электронную почту;

  • сохранение отчетов на сервере PromoPult неограниченное время.

Как работает парсер метатегов

Шаг 1. Регистрация в PromoPult. Регистрация необходима, чтобы получить доступ к отчетам в личном кабинете. Если у вас еще нет аккаунта в PromoPult, создайте его. Это займет не более минуты.

Шаг 2. Добавление URL. Перейдите на страницу инструмента и добавьте URL страниц, информацию с которых необходимо спарсить. Сделать это можно тремя способами:

  1. С помощью указания ссылки на XML-карту сайта. Система спарсит все URL, указанные в карте. Поэтому если вам нужны только отдельные URL, этот способ не подходит. Ссылка должна быть в формате https://site.ru/sitemap.xml.

  2. С помощью XLSX-файла. Система соберет все URL из первого листа файла по принципу «одна ячейка – один URL».

  3. С помощью списка: добавьте URL списком, каждый адрес — с новой строки.

Шаг 3. Настройка парсинга. Укажите, какие данные необходимо собрать. Советуем собирать сразу все — стоимость парсинга изменяться не будет. Единственное, если вы парсите сайт с тысячами URL, то для ускорения получения отчета рекомендуем отметить только те данные, которые вы будете реально использовать. Если же время терпит, смело отмечайте все пункты.

Шаг 4. Получение результата. После завершения парсинга вы получите уведомление на e-mail.

Отчет доступен в блоке «Список задач» в формате XLSX. Нажав на соответствующие иконки в колонке «Действия», можно обновить данные в отчете, удалить его или скачать XLSX-файл на свой компьютер:

Файл состоит из двух листов:

  • Результаты — столбцы URL, Title, Description, Keywords, h1, h2, h3, h4, h5, h6. Если на странице несколько заголовков h1-h6, они прописываются в ячейке через знак &.

  • Исходные настройки — указано, какие данные и для каких URL собирались.

Отчеты хранятся в системе неограниченное время.

Анализ результатов парсинга метатегов и заголовков

Итак, у вас на руках готовый отчет. Что делать дальше? Все зависит от того, какой сайт вы хотите анализировать — свой или конкурента.

Парсинг собственного сайта

Проверка заголовков и метатегов на своем сайте необходима, чтобы выявить существенный недостатки внутренней оптимизации, о которых расскажем ниже.

Незаполненные теги и метатеги. Это серьезная ошибка в оптимизации сайта. Яндекс.Вебмастер проверяет наличие информации в метатегах, и если существенная часть не заполнена, отправляет уведомление в раздел «Диагностика»:

Информация в Title и Description позволяет поисковикам точнее определить релевантность страниц поисковому запросу, а пользователям понять, подходит ли контент, опираясь на описание страницы (сниппет) в результатах поиска. Если Title и Description будут пустыми, поисковик сформирует сниппет на свое усмотрение, и текст может быть далек от идеала.

С помощью парсинга вы быстро определите, каких данных не хватает:

Дублирование метатегов. Заголовки и метатеги (вследствие ошибок вебмастеров или неправильных настроек CMS) на разных страницах могут повторяться. Такого также быть не должно. С помощью функции Excel «Условное форматирование…» / «Правила выделения ячеек» / «Повторяющиеся ячейки» вы без проблем найдете дубли в итоговом отчете.

Дублироваться могут не только метатеги, но и содержимое страниц. Подробно о том, какими бывают дубли на сайте, как их выявлять и устранять, описано в этой статье.

Недостаточная или избыточная длина текста. Для получения оптимального заголовка сниппета требуется около 50-60 знаков с пробелами в Title. Более длинные заголовки будут обрезаться. Короткие — передавать минимум информации. Аналогично проанализируйте длину текста в Description (Яндекс отражает в сниппете порядка 140-150 знаков, а Google — 150-160 с учетом типографики).

Неинформативные метатеги. Заголовки и мета-описания — не только для роботов. Они должны быть понятны и полезны для посетителей, информировать о содержании страницы еще до перехода на нее. Вручную пройдитесь по текстам и при необходимости перепишите их.

Нарушение структуры и логики заголовков. В идеале на одной странице должен быть один заголовок h1. Далее по иерархии: h2-h6. Причем h2 — это подзаголовки верхнего уровня. На каждом уровне h2 могут быть подзаголовки h3, на уровне h3 — h4 и т. д. Соответственно, должна соблюдаться логика подзаголовков.

В приведенном ниже примере с заголовками h1 в общей массе все в порядке — здесь отражены названия статей блога. А вот с подзаголовками полная путаница.

Например, у статьи «Полный обзор японских подгузников Merries» некоторые подзаголовки h2 не относятся к основному контенту (вроде «Вы сейчас здесь» и «Также читайте»). Подзаголовки h3 и h4 вообще не относятся к статье, а содержат названия тегов, рубрик и т. п. Подобная ситуация может возникнуть из-за «кривизны» CMS — разработчики не думали о правилах SEO, а просто делали движок. Поэтому необходимо внести правки в шаблон сайта и исправить ситуацию с подзаголовками.

Парсинг сайтов конкурентов

Сбор данных с сайтов-лидеров вашей тематики открывает доступ к следующим данным.

Ключевые запросы, по которым продвигаются конкуренты. Если у конкурентов заполнены теги Keywords, вы фактически получите доступ к их семантическому ядру. В противном случае ключевые фразы можно «вытащить» из Title и Description. Как это сделать:

  • соберите метатеги и заголовки со страниц сайта-конкурента (со всех или интересующей категории);

  • скопируйте все Title и Description из отчета (при необходимости можно добавить информацию из h1-h6, но нужно смотреть на их релевантность);

  • «забросьте» метатеги и заголовки в SEO-анализатор (advego.com/text/seo или text.ru/seo), и вы получите список ключевых фраз с частотностями.

Пример «разложения» Title и Description на ключевые фразы в text.ru

Используйте эти фразы для составления или дополнения собственного семантического ядра.

Логика формирования метатегов. Проанализируйте конкурентов из топ-10 по основным запросам и выявите, каким образом они формируют заголовки и метатеги: есть ли какой-то шаблон, зависимости, в какой части идет основной ключ и т. п.

Как это сделать:

  1. Введите в поиске интересующий запрос.

  2. Скопируйте 10 первых URL и спарсите по ним данные.

  3. Проанализируйте отчет и найдите закономерности.

Пример. Введем в Google фразу «купить золотое кольцо Москва». Отчет по первым 10 URL выглядит так:

Результаты анализа:

  • средняя длина Title — 101 символ с пробелами (в топ-5 — 115);

  • средняя длина Description — 204 символа с пробелами (в топ-5 — 222);

  • 50 % Title и 30 % Description содержат все слова из поискового запроса (в топ-5 — 75 % и 20 % соответственно);

  • 80 % Title (и только 10 % Description) содержат дополнительное слово «интернет-магазин»;

  • в 100 % Title среди первых трех слов присутствует слово «кольцо», в 90 % — слово «золотое»;

  • плюс-слова, которые употребляются в 50 % и более тегов Title: «каталог», «цены», «фото», «золото»;

  • плюс-слова, которые употребляются в 50 % и более тегов Description: «каталог», «цены», «фото», «доставка», «женские», «Россия», «гарантия», «скидка», «золото».

Исходя из такого анализа можно выявить закономерности:

  • добавление в Title всех слов из запроса повышает шансы занять более высокую позицию;

  • в начале Title должно быть словосочетание «золотое кольцо»;

  • длина Title должна быть порядка 100 символов;

  • Title логично дополнить словом «интернет-магазин»;

  • в Description не стоит дублировать все слова из поискового запроса;

  • приветствуется разбавление текстов плюс-словами.

Остается написать такие тексты в заголовках и мета-описании, которые будут максимально отражать пользовательский интент, не дублировать конкурентов и выгодно выделяться на их фоне. Например, ни в одном Title нет информации о цене. Если в видимой части заголовка указать «цены от 2000 рублей», возможно, это повысит кликабельность.

Структура и характер заголовков. Похожий анализ можно провести и по заголовкам h1-h6.

Результаты анализа:

  • самый важный вывод — в заголовках h1 нет точного вхождения поисковой фразы (используется преимущественно название категории в качестве h1);

  • подзаголовки заполнены бессистемно — только в одном случае в качестве подзаголовков h2 использованы названия брендов.

Таким образом, если выстроить на своем сайте логичную структуру заголовков h1-h6, то можно получить небольшое преимущество перед конкурентами.

Сколько стоит использование парсера метатегов

Стоимость парсинга зависит от количества запросов к странице сайта:

Вот примеры бюджета парсинга в различных ситуациях:

Как видите, даже при огромных объемах парсинга бюджет можно считать условным.

Заключение

Анализ метатегов и заголовков на собственном сайте позволяет быстро выявить проблемы и исправить их. С другой стороны, анализ информации со страниц других сайтов открывает дорогу к пониманию стратегии конкурентов. Автоматизация этого процесса значительно ускоряет работу и позволяет сосредоточиться на важных задачах.

Попробуйте инструмент парсинга мета-данных в действии — предлагаем бесплатно проверить 500 URL!

Как создать полезный гид
для предпринимателей?