Sitemap, он же карта сайта. Предназначение, создание, использование

Вернуться
Опубликовано: 23.04.2015 г.

Для корректной обработки любого сайта в нем должен быть набор определенных служебных файлов, которые помогают поисковым роботам правильно спарсить содержимое и извлечь информацию. Это и robots.txt, и .htaccess, и sitemap.xml. Именно о последнем и пойдет в данной статье речь: что это за файл, зачем он используется и как его создать самостоятельно.

 

Что такое sitemap.xml

Само имя файла подсказывает, что речь идет о карте сайта. Именно так дело и обстоит на самом деле: sitemap.xml содержит информацию для поисковых роботов о том, какие страницы подлежат индексации. Причем здесь необходимо подчеркнуть различия с robots.txt, где можно разрешать и запрещать боту посещать ту или иную папку на сайте. Sitemap.xml действует по-другому: он содержит ссылки на внутренние страницы сайта, которые и «скармливает» роботу. После обработки карты сайта поисковый бот уже не может проигнорировать те страницы, что были здесь указаны.

Что содержится в карте сайта

Кроме уже упомянутых ссылок на внутренние страницы, Sitemap.xml содержит и дополнительную служебную информацию – приоритеты индексации, частота обновления каждой из страниц, дата последнего обновления и т.д. Таким образом, поисковый робот сразу понимает, что нужно обработать в первую очередь, что может подождать, а что вообще не обновлялось с момента прошлого посещения ресурса. Кстати, специалисты по оптимизации рекомендуют использовать sitemap.xml только для крупных ресурсов, где количество страниц превышает 50-60. Для более мелких сайтов можно обойтись robots.txt.

Как создать Sitemap.xml самостоятельно

Если используемый движок не содержит готового sitemap.xml или движка вообще нет, его несложно создать самому. Для этого есть два пути – написать его вручную или воспользоваться одним из многочисленных генераторов в сети. Понятно, что второй способ проще и быстрее, но первый поможет, во-первых, лучше разобраться в структуре файла и получить опыт, а во-вторых, будет содержать только полезную информацию и ничего лишнего.

Итак, если вы выбираете ручной вариант, вначале создайте в любом текстовом редакторе пустой текстовый файл в кодировке UTF-8 и сохраните его как sitemap.xml. Теперь добавьте в него такие строчки:

Для каждой новой странички добавляется новая группа <url>, в которой обязательно должен быть тег <loc> – расположение страницы, и опционально теги <lastmod>, <changefreq> и <priority>, которые отвечают за дату последнего изменения, частоту обновления страницы и коэффициент приоритета (от 0 до 1). Как видите, ничего сложного, и даже если вы забудете синтаксис, его всегда можно подсмотреть на официальном сайте Sitemap — http://www.sitemaps.org/.

Автоматический вариант гораздо проще и предпочтительней, если страниц в проекте очень много, и каждую указывать вручную будет слишком долго. В генераторе нужно просто указать полный адрес Вашего сайта, заполнить параметры (частоту обновления, приоритеты и т.д.), и сгенерировать готовый sitemap.xml. Останется только поместить его в корневую папку вашего проекта.

Чтобы поисковые системы смогли увидитесь карту сайта, информацию о новосозданном файле нужно разместить в robots.txt. Задать нужно полный путь к файлу и разрешить полный доступ к нему. Обратите внимание, чтобы sitemap.xml не был «тяжелее» 10 Мб и не содержал свыше 50 тыс. ссылок на страницы, поскольку иначе его не будут воспринимать роботы.

945 0

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *