Читать книгу Поисковые алгоритмы ранжирования сайтов - Анатолий Косарев - Страница 19

GOOGLE ФИЛЬТРЫ
7 – BROKEN LINKS (БИТЫЕ ССЫЛКИ)

Оглавление

Этот фильтр – один из многих, который определяет качество сайта.


Любой развивающийся сайт, со временем претерпевает некоторые изменения. Некоторые страницы добавляются, некоторые изменяются, удаляются или переносятся. Страницы же сайта, как правило, связаны ссылками, и при переносе или удалении даже одной страницы случается так, что несколько или несколько десятков страниц сайта имеют ссылки на удаленную, или перемещенную страницу.


Поэтому получается, что несколько ссылок ведут на несуществующую страницу.


Бывает и так, что при создании сайта недодумано, могут генерироваться страницы с ошибкой 404.


Самый простой и распространенный пример. Программист устанавливает календарь событий компании, на котором пользователь может выбрать любую дату, месяц и год, чтобы посмотреть новость компании этого дня.


Но забывает закрыть доступ к тем датам, когда компания ещё и не существовала. Так пользователь может открыть любой год, например, 1001, или 11, и естественно получить страницу с ошибкой 404.


Разумному человеку вряд ли придет в голову посмотреть события компании в начале первого тысячелетия, но алгоритм, без эмоций выполняет свою работу.


У поисковика алгоритм – обойти все ссылки. Робот и обходит все, а для нашего примера это

2022 х 365 +505= 738 535 не рабочих ссылок, которые ведут на несуществующие страницы.


Ссылка, которая ведет на несуществующую страницу, называют битой. Обычно пользователю в этом случае выдается страница с кодом ошибки 404.


Ошибка 404 или Not Found («не найдено») – стандартный код ответа HTTP о том, запрашиваемая страница не найдена. (Ошибку 404 не следует путать с ошибкой «Сервер не найден» или иными ошибками, указывающими на ограничение доступа к серверу.)


Если сайт с таким календарем имеет несколько десятков страниц, то не сложно подсчитать отношение «хороших» и «плохих» страниц, а это хороший прирост к отрицательному определению качества сайта.


Кроме этого робот-паук должен обойти все страницы сайта, и если он «застрянет» на таком календаре, то хорошие страницы будут еще долго не индексированы.


Другая распространенная причина получения битых ссылок – перенос материала из одной категории в другую. Этим обычно страдают интернет-магазины.


Если битых ссылок на сайте много (величина или процент, который определяет, что битых ссылок много – коммерческая тайна Google), то Google считает этот сайт низкого качества, а поэтому его не стоит показывать пользователям, и пессимизирует его.


Перед запуском сайта нужно убедиться, что на веб-страницах нет битых ссылок, т.е. ссылок, которые никуда не ведут.

Поисковые алгоритмы ранжирования сайтов

Подняться наверх