Ошибки Blogger в админках Яндекса и Гугла

Анализ некоторых  недостатков Blogger с позиции двух известных поисковиков.
Все данные взяты из админок Вебмастера от Яндекса и Инструментов для веб-мастеров российской версии Google.

Начнём с Яндекса.
1) Как видит Яндекс блогспотовский блог?
Структура ↓


В этом году Яндекс сумел сразу же правильно распознать и отобразить строение блога. Ранее я встречал ошибки, большинство из которых было связано с ярлыками.
Однако, если вы переехали на Blogger с другого движка, то вполне возможно, что получится каша из старых и новых папок (как у меня до сих пор на одном блоге). Писать в суппорт по этому поводу бесполезно.

2) Blogger и робот Яндекса.


Если кто-то до сих пор уверен, что Blogger не может корректно работать с Яндексом, это не так.
Блоггер нормально и регулярно принимает запросы от робота, и ошибок здесь нет.

А здесь то, что Blogger отдаёт роботу ↓


Как можно заметить на скриншоте, за день проскочила ошибка клиента 4xx, что скорее всего связано с несуществующими url-ами (об этом будет сказано ниже). Ещё одна ошибка 3xx - это ошибка на уровне сервера, и даже гугл не всегда стабилен.

3) Исключённые страницы.
Это те страницы, кторые Яндекс сразу отбрасывает с криком "фу" и к пересмотру их статуса возвращается очень неохотно.
В этом разделе я наблюдаю у себя:
  • исключённые ярлыки - это правильно: они, как дубли, запрещены в robots.txt
  • страница /view/sidebar - это динамические просмотры, которые Blogger не так давно анонсировал, как офигенно наглядный способ чтения блога
  • страницы 404 - по мнению Яндекса это битые ссылки, хотя это не соответствует истине: за этими ссылками стоят реальные статьи. Я общался с суппортом на этот счёт, и Платон Щукин заверял, что всё будет ОК. Тем не менее, эти "битые ссылки" появляются. Возможно, это баг Blogger.
  • страницы 404 - действительно ссылки на несуществующую страницы. Откуда они? В целях получения нормальной ссылки типа /youtube-widget-blogger, а не /blogpost_03, я набиваю название статьи на транслите, публикую пост и тут же отправляю в черновик. Ссылка становится красивой, а вот поисковики успевают её захватить (пока я пишу статью) и пропинговать. Такая ссылка помечается битой. И будет её в глазах Яндекса ещё долгое время. Ну а если я не опубликую пост, то почти навсегда=).

4) Файлы sitemap.
Давно всем пользователям известно, что та сайтмапа, которая прописана в robots.txt, а-ля /feeds/posts/default?orderby=updated, не катит для Яндекса. Поэтому надо ручками генерировать её на каком-либо онлайн-сервисе по созданию sitemap. У Яндекса была проблема (не обновлялись данные из sitemap), но Платон Щукин лично заверил, что к Blogger данная трабла не имеет никакого отношения.
Добавлю от себя, что sitemap не настолько нужен, если у вас постоянно обновляемый блог (пишите часто, либо объёмные dofollow комментарии). Лучше уделить внимание перелинковке блога.

5) Главное зеркало.
Яндекс позволяет пользователю точно указать домен зеркала или оставить на его усмотрение.
Поскольку у меня домен и так 3-его уровня, то никак зеркал мне не нужно. Однако на доменах второго уровня некоторые хозяева блогов ругались на неправильное автоопределение зеркала, либо сами неправильно его определяли. Во всех случаях Яндекс до полугода обновляет информацию о зеркалах в своей базе, поэтому подумайте дважды прежде чем предпринимать какие-то шаги.

Переходим к Google.
Пользователи Blogger почему-то уверены, что мировой поисковик будет относиться к родной платформе Blogspot как-то особенно, нежели к остальным сайтам.
В этом есть доля правды, если имеются в виду пинги и индексация. Робот Google мгновенно хватает опубликованные ссылки, и даже быстрее, чем это нужно. Такая расторопность провоцирует появление кучи ошибок в Инструментах веб-мастеров.

1) Файл sitemap.
Нужно убедиться, что Google получает полную версию rss ленты, в которой посты сортируются по дате обновления (желательно), а не порядку публикации ↓


2) Ошибки страниц:
/feeds/posts/default/-/ - это ошибка rss ленты, код 400, глюк Blogger, ничего не поделаешь
исключённые ярлыки - для Google они тоже исключены, потому что дубли
не найдено - битые ссылки, несуществующие страницы с ошибкой 404:


Что это за страницы? Это неопубликованные посты, это упомянутые где то-ссылки, это ссылки на удалённые комментарии. Весь этот мусор Google насобирал и засрал диагностику.

3) Статистика сканирования робота.
Чем чаще пишешь, тем чаще сканируется твой сайт/блог поисковыми системами ↓


Вот, пожалуйста, как раз тот случай. Ноябрь у меня был самый плодотворный месяц, и соответственно, бот Google в этот месяц вёл себя тоже очень активно. Конечно благодаря пингам.
Вообще, Blogger, как я уже написал ранее, сам пингует поисковики и сервисы, типа Feedburner, сразу после того, как вы нажмёте кнопку "обновить". Никакие аддурилки Гугла для Blogger не нужны.

4) Короткие метаописания.
Косяк при использовании динамических метатегов description


В этом случае приходится выбирать одно из трёх зол:
  • динамические метатеги, при использовании которых описание становится уникальным, но коротким (как вариант: использовать в статьях длинные названия)
  • обычный метатег - будет везде повторятся, на всех страницах
  • не использовать метатеги
В статье по ссылке есть предложение вставлять в шаблон для каждой страницы свой метатег, но я плохо представляю, как это сделать для 100 страниц хотя бы...

5) Повторяющееся метаописание.
Пока непобедимо. Дело в том, что помимо url статьи, есть ещё url этой же статьи, но с комментариями. Для Google это две разные страницы, поэтому он бьёт тревогу:


6) Повторяющиеся заголовки


Та же картина, что и в пятом, предыдущем, пункте.

Комментариев нет:

Отправка комментария