О sitemap немало песен сложено,
Я слажаю вам еще одну… =)
Суть статьи одним предложением:
Для сайта рекомендую создать файл sitemap.xml (карта сайта для поисковых систем), поможет в этом плагин для WordPress – Google XML Sitemaps.
После переноса сайта на хостинг одним из первых шагов, который я рекомендую вам выполнить – это создание карты сайта для поисковых систем. А в следующей статье разберемся с еще одним не менее важным моментом – созданием файла robots.txt.
sitemap.xml и robots.txt – это те файлы, которые настоятельно рекомендую создать до того, как вы сообщите поисковым системам о появлении вашего сайта.
Это поможет вашему сайту быстрей продвинуться в поисковых системах.
Зачем нужен sitemap.xml?
Файл sitemap.xml поможет поисковым системам более разумно проиндексировать ваш сайт.
В sitemap.xml хранится следующая информация:
– местоположение страниц (url-адрес) сайта
– дата и время последних изменений страниц
– частота обновления страниц
– важность страниц относительно других страниц сайта
Вся эта информация в файле записана с помощью языка разметки XML.
Вот пример того, как описаны эти данные в sitemap.xml для одной из страниц этого блога.
1 2 3 4 5 6 7 8 |
<url> <loc>http://wordpress-life.ru/plagin-crazy-titles.html</loc> <lastmod>2013-11-26T21:02:55+00:00</lastmod> <changefreq>weekly</changefreq> <priority>0.2</priority> </url> |
В принципе, наличие файла sitemap.xml не является обязательным. Например, мой первый блог yershov.com.ua несколько лет прекрасно жил без карты сайта и его статьи были замечены поисковыми системами, а соответственно и людьми.
В чем же тогда польза sitemap.xml?
Допустим, робот заходит на сайт, у которого нет sitemap.xml. Проиндексировал страницу, нашел какую-то внутреннюю ссылку на другую страницу, перешел на неё и тоже проиндексировал. Лимит времени пребывания робота на этом сайте закончился и он “пошуршал” раБОТать на другие сайты.
Что мы имеем в этот заход робота? Он проиндексировал, например, главную страницу и первая попавшаяся ссылка вела на страницу “О сайте”, информацию с которой поисковый трудяга тоже успешно прихватил. Но эта страница уже давно была проиндексирована и с тех пор не подвергалась изменениям.
Получается, вместо того, чтобы забрать с сайта более свежую и актуальную информацию роботехник, образно говоря, поволок с собой в глобальное хранилище бородатый анекдот. Но смеяться никто не будет, особенно админ сайта, который не создал sitemap.xml из-за лени или незнания.
Если бы, упомянутый сайт, имел sitemap.xml, то робот бы обратил внимание на давнишнюю дату обновления страницы и на её низкий приоритет, и нашел бы для индексации другую страницу с более высокой важностью и свежей датой изменений.
Таким образом, делаем вывод, что наличие карты сайта для поисковых систем ускоряет попадание страниц в индекс.
Плагин Google XML Sitemaps
Каким же образом создать файл sitemap.xml?
Очевидно, процесс создания карты сайта для поисковых систем должен быть автоматизирован. Вы ж не будете после добавления новой статьи или редактирования уже опубликованного поста, каждый раз вручную править файл sitemap.xml?
Поэтому рекомендую использовать плагин Google XML Sitemaps. В данном случае, удобней всего установить плагин первым способом (через подраздел “Поиск”).
После активации плагина Google XML Sitemaps карта сайта сгенерируется автоматически. В корневой папке вашего сайта должны появиться файлы: sitemap.xml и sitemap.xml.gz.
sitemap.xml.gz – это запакованный XML файл карты сайта. Некоторые поисковые системы используют именно такой вариант карты сайта, поэтому желательно наличие файла и в таком формате. Это можно включить/отключить в настройках плагина: “Записать запакованный XML файл (Ваше имя файла + .gz)”.
Плагин Google XML Sitemaps имеет множество настроечных параметров. В принципе, можно использовать те значения параметров, которые установлены по умолчанию. Если вы установите и активируете плагин Google XML Sitemaps – этого уже будет достаточно!
При желании, можете изменить приоритеты и частоту изменений для статей, страниц, категорий и т.д. Касательно “частот”, хочу обратить ваше внимание, что это частота, с которой вы планируете публиковать материал. Например, если для статей вы задали частоту “Daily” (“Ежедневно”), то не думайте, что роботы поисковиком будут ежедневно к вам заходить и проводить индексацию. Эта метка – рекомендация, а не команда.
Некоторые люди устанавливают для всех публикаций значение частоты “Ежедневно”, думая, что лучше чаще, чем реже и что роботы будут ежедневно заходить в гости. Это неверно. Даже, если роботы последуют вашему желанию и будут ежедневно заглядывать к вам, то они не будут индексировать все имеющиеся страницы. Поэтому желательно задавать разные частоты и приоритеты. Например, содержимое статичных страниц изменяется редко, поэтому страницам можно задать приоритет “Ежемесячно”. Зачем рекомендовать роботу индексировать их ежедневно? Думаю, смысл понятен.
Итак, мы научились создавать файл sitemap.xml с помощью плагина Google XML Sitemaps.
Желаю всем регулярной индексации! =)
Эпиграф – обалденный!! Для понимающих!
Алексей, а Вы не разбирались с плагином после апрельского обновления? Он создаёт динамичную карту и страницы выпадают из индексации. Чем его заменить можно?
Борис, плагин Google XML Sitemaps пока не обновлял. Спасибо за информацию.
А где появится фаил sitemap.xml ?
Установил плагин, активировал, а в корневике сайта ничего не появилось….
Да, по умолчанию должно в корень сайта добавить. Посмотрите в настройках плагина блок “Расположение Вашего файла с картой сайта”. Там есть автоматическое определение пути и есть пользовательское расположение. Что там у вас задано?
Еще, может в фтп-клиенте нужно просто обновить каталог и увидите файл.
Вот по этому пути я вижу, что карта сайта у вашего сайта есть http://stolitsamira.ru/sitemap.xml. Конечно, если вопрос касается этого сайта.
Привет всем. У меня этот генератор засунул xml в сайт/index.php?xml_sitemap=params= А эта страница не индексируется в robots.txt Что делать?