Видит ли робот разницу между 404 и 410?

Итак, сегодня у нас мастер-класс от главы по борьбе с поисковым спамом корпорации Google (Мэтт Каттс). Наш заграничный товарищ объяснит в чем для поисковика разница между кодами состояния HTTP 404 (который «Not Found») и 410 (который «Gone»).

Абсолютное большинство веб-мастеров интересуется следующим вопросом: одинаково ли робот обрабатывает страницы, отдающие коды 404 и 410? Мэтт Каттс на это отвечает следующим образом (сделаем в виде списка, дабы упростить понимание):

  • Для начала нужно понимать, что 404 и 410 свидетельствуют о недоступности страницы.
  • При этом 404 ошибка говорит роботу, что ни одна страница сайта  не соответствует запрошенному урлу. Причиной такого сбоя может быть неправильное введение ссылки, либо удаление страницы. Также следует отметить, что 404 не говорит была ли когда-нибудь такая страница, будет ли она восстановлена в будущем или веб-ресурс исчез навсегда.
  • Код 410 определяется как «удален», таким образом можно сделать выводы о том, что введенный урл в принципе удален с сервера.
  • Анализируя полученную информацию, любой веб-мастер поймет, что робот по-разному отнесется к появлению ошибок 404 и 410. Так, в случае кода 404 не станет метить ее как удаленную в течение суток, что заставит робота через некоторое время вернуться на сайт и проверить его еще разок. Если поисковик найдет ошибку 410, он автоматически метит ее как удаленную.
  • Таким образом, если вы видите. Что страницы нет, но свято верите в то, что это временное явление, пользуйте код 404. В том случае, когда страница пропала и вы не можете ее заменить другой, грамотнее будет применить код ответа сервера 410.

И по традиции, всем, кто хорошо шарит в английском, оригинальное видео:

 

15.04.2014