Содержание

Что такое sitemap.xml и чем карта сайта помогает в продвижении

В прошлый раз я рассказывал про файл robots.txt, а в этой статье я поведаю о его хорошем друге, файле sitemap.xml. Файл sitemap называют картой сайта – она помогает ориентироваться поисковым роботам среди папок и документов вашего ресурса.

А как выглядит sitemap.xml, мы сейчас подробно разберем.

Предназначение sitemap.xml

Файл Sitemap расположен в корне сайта и содержит данные о его страницах. В карте сайта должны быть ссылки на все страницы сайта. Поисковые роботы Яндекса и Гугла заходят на ваш сайт и гуляют по нему до тех пор, пока не кончится рабочий день. Рабочий день у робота — это краулинговый бюджет. То есть объем страниц и файлов, которые робот может изучить за определенный период времени. Чтобы не задерживать робота и в то же время улучшить индексацию, помогает карта сайта.

Существует еще и HTML-карта сайта, но она нужна пользователям ресурса, а не роботам. Поскольку данный формат устарел, говорить о нем мы не будем.

Просто знайте, что есть еще и HTML-карта, но ее путайте ее с файлом sitemap.xml.

В каких случаях нужна карта сайта

Несложно догадаться, что одностраничным сайтам sitemap.xml не нужен. А вот кому он точно пригодится, так это:

  • сайтам без хлебных крошек (навигационных цепочек),
  • сайтам с большим количеством страниц,
  • сайтам, на которых есть страницы с глубокой вложенностью, например, «Главная/Каталог/Видео» или «Фото/Видеокамеры/Экшн-камеры/GoPro/GoPro 7».

Если у робота перед глазами будет карта, он без проблем доберется до GoPro 7, а также до других мелких аксессуаров. 

Требования к файлу

Яндекс рекомендует создавать карту сайта в XML-формате. Также поддерживается и формат TXT. В txt-формате карта сайта сообщает только адреса. Она выглядит следующим образом:


https://www.example.com/page1.html

https://www.example.com/page2.html

Но я прислушаюсь к рекомендациям Яндекса и создам файл в формате XML.

В формате XML вы можете указать роботу:

  • адрес страницы,
  • дату последнего обновления,
  • частоту изменения страницы,
  • приоритет страницы.

Пример файла в формате XML:


<?xml version="1.0" encoding="UTF-8"?>

    <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> 

        <url>

            <loc>http://www.example.com/page1.html</loc>

            <lastmod>2005-01-01</lastmod>

            <changefreq>monthly</changefreq>

            <priority>0.8</priority>

        </url>

        ...

    </urlset>

Кодировка файла должна быть UTF-8. Файл не должен превышать 50 мегабайт и содержать более 50000 страниц. Файлов может быть несколько.

Как sitemap.xml влияет на SEO

Я уже говорил, в каких случаях необходима карта сайта.

Но что если у вас небольшой сайт, страниц на 20, с хлебными крошками и неглубокой вложенностью? Если вы не создадите файл, то после добавления сайта в Google Search Console и Яндекс.Вебмастер вы увидите ошибку, что данного файла не хватает. Из-за этой ошибки поисковики могут пессимизировать ваш сайт. Как мы знаем, чем меньше ошибок на сайте, тем он успешнее в продвижении. Не стоит дразнить поисковики.

Создаем карту сайта быстро и бесплатно

В создании карты сайта нет никаких сложностей. Вбиваем в поисковой строке «сгенерировать сайтмап» и переходим в любой онлайн-генератор. Например, MySiteMapGenerator.

Вбиваем адрес сайта и переходим к созданию файла. Вводим капчу и ожидаем. До 500 страниц – создание бесплатно.

Затем скачиваем файл, переименовываем его в sitemap.xml и закидываем в корень сайта. Осталось только сообщить поисковикам, что на вашем сайте появилась карта.

Сообщаем поисковикам, что на сайте есть sitemap.xml

В Яндекс. Вебмастере переходим в «Индексирование – Файлы Sitemap» и добавляем ссылку. Если вы добавили сайтмап в корень сайта, то ваша ссылка будет похожа на мою:

То же самое делаем в Google Search Console.

Хочу добавить, что существуют плагины для CMS, которые позволяют один раз создать данный файл и навсегда о нем забыть. Установив такие плагины, вам не придется время от времени обновлять карту сайта, потому что это будет происходить автоматически. 

Файл sitemap.xml – важная часть оптимизации сайта. Главное, не путать поисковых роботов, закрывая страницу в robots.txt и в то же время прося ее проиндексировать в sitemap.xml. Следите за актуальностью своей карты, и тогда ваш сайт будет ждать успех в продвижении.

Все о файлах sitemap.xml, типичные ошибки, разбор документации от технарей

Карта сайта в формате XML должна быть на любом сайте, это как минимум правило хорошего тона для вебмастера. Кроме этого, sitemap помогает поисковым машинам в индексации сайта, потому как время от времени поисковики карту сайта обходят.

Технически реализовать карту сайта не сложно, в популярных CMS есть для этого плагины. Однако с настройкой sitemap нужно быть осторожным. Если в карту сайта попадет мусор (изображения, PDF файлы, технические страницы, несуществующие страницы) — они все будут проиндексированы. А так как большинство таких страниц недостаточно качественные — они не будут участвовать в результатах поиска, но поисковая машина будет о них знать, что понизит общий рейтинг сайта.

Содержание:

Формат карты сайта. Есть ли альтернативы?

Смущает формат XML? Меня тоже интересовал этот вопрос. Объясняю.

Яндекс, к примеру, допускает использование фалов sitemap в формате txt. Почитайте сами.

Google тоже допускает использование формата txt, а также использование фидов (на последнее ругается Яндекс). Довольно подробно здесь.

XML рекомендованный, но не единственный

Яндекс об этом заявляет прямо — использование XML рекомендуется. Google говорит нам о том, что использование txt формата возможно только для указания адреса страницы. Но обычно нам важно передать как можно больше информации поисковой системе, а формат XML как раз позволяет нам это сделать. Об этом слегка позже.

Какие бывают карты сайта

Помимо обычной карты сайта протокол позволяет реализовать еще следующие виды sitemap

Sitemap для изображений

Первым, как и практические всё в интернете, карту сайта для графического контента начал использовать Google. Это создавало некоторые проблемы

отечественным веб мастерам, поскольку валидацию в Яндексе такая карта сайта не проходила, а популярные плагины (например YoastSEO для wordpress) генерировали карту сайта для изображений внутри основной карты сайта (что допустимо было раньше для Google, если вникнуть в документацию Google и что допустимо сейчас для обоих ПС). Так как Яндекс не поддерживал пространство имен sitemap image, то в Веб Мастере вылазили ошибки.

Сейчас Яндекс поддерживает пространство имен, разработанное Google для sitemapimage.

Sitemap для видео контента

Эта история поддерживается только Google, технологии индексации видео контента Яндекса пока не связаны с файлами sitemap.

Документация по этому файлу от Google лежит здесь

Еще один инструмент, рекомендуемый Google для улучшения рейтингов в выдаче видео контента — использование микроразметки.

Пространство имен для Sitemap Video также создано Google.

Sitemap для новостей

Из названия понятно, что это для новостей и, конечно, только для Google новостей. Яндекс ходит мимо и будет ругаться на такую карту сайта. Подходит для новостных порталов и сайтов с большим потоком новостей или другого текстового контента. Согласно рекомендациям в sitemap news не должно быть записей старше двух дней.

Index Sitemap

Не то, чтобы это отдельный вид карты сайта. Дело в том, что файл sitemap имеет вполне физические ограничения — не более 50000 урлов, вес не более 50Мб. Понятно, что есть сайты с гораздо большим количеством урлов и для этого создатели протокола sitemap придумали индексные карты сайта. SitemapIndex по сути представляет из себя карту сайта с картами сайта. Выглядит это так:

Так выглядит индекс карты сайта в Битрикс CMS

Многие CMS имеют встроенные инструменты генерации sitemap и многие же из них делают по умолчанию индекс, вне зависимости от размера сайта. Так делает BitrixCMS, практически все плагины для WordPress. Это удобно в том понимании, что веб мастеру не нужно создавать индекс, когда это «вдруг» потребуется, но с файлами будет сложнее работать.

Где располагается файл с картой сайта?

Обычно карта сайта располагается по адресу https://site.ru/sitemap.xml, но это вовсе не обязательно. Карту сайта можно расположить на любом адресе. При этом, есть несколько способов указать поисковым машинам на адрес расположения карты сайта:

В файле robots.txt

В этом файле можно указать на адрес карты сайта, его постоянно просматривают роботы, где для них содержатся инструкции по сканированию сайта.

адрес карты сайта в файле robots.txt

В панелях для веб мастеров

Яндекс Вебмастер

В яндекс веб мастере это раздел индексирование -> файлы sitemap

Как добавить sitemap в ЯндексВебмастер

Перед добавлением ссылки на файл последний можно проверить теми же сервисами Яндекса, здесь для не авторизованных пользователей, для авторизованных в ВебМастере можно проверить как указано на картинке.

Где проверять карту сайта в Яндекс Веб мастере

Обратите внимание на то, что проверить карту сайта можно тремя способами — проверить файл, проверить сам код (или его кусок), либо проверить URL. В большинстве случаев достаточно проверить URL, поскольку сам файл формируется инструментами CMS, а на его содержимое можно влиять лишь в контексте попадания или не попадания конкретной страницы в файл sitemap.

Однако, если Вы разрабатываете свой собственный модуль для формирования карты сайта, у Вас самописная CMS, или к карте сайта есть определенные технические требования (например совместить карту сайта страниц и карту сайта для изображений), то тогда есть смысл проверять на валидность как сам файл, так и отдельные его куски.

На всякий случай, если Вы еще не видели документацию по протоколу Sitemap — она здесь https://www.sitemaps.org/ru/protocol.html.

Google Search Console

В SearchConsole, разумеется, тоже можно добавить файлы sitemap и в некотором смысле Google дает нам больше инструментов для управления индексированием через sitemap. Добавить можно как указано на изображении ниже

Где добавлять карту сайта в Google Search Console

Способы организации файлов Sitemap

Часто у веб мастеров возникают вопросы об организации файлов sitemap в случае, если используются несколько видов файлов на одном сайте. Но начнем с простого

Один обычный sitemap.xml

Проще всего разместить файл в директории «по умолчанию» site.ru/sitemap.xml. Далее следует указать адрес карты сайта в файле robots.txt и панелях веб мастеров. Все будет ок, только периодически надо проверять, обновляется ли сам файл.

Одновременно используются sitemap.xml и sitemap image

Сейчас, когда Яндекс стал поддерживать пространство имен, разработанное Google вариантов стало несколько.

Сделать и страницы и изображения в одном файле

Выглядеть это будет примерно так:

[php]

xmlns:image=»http://www.google.com/schemas/sitemap-image/1.1″>

http://site.ru/page/

http://site. ru/kartinka.jpg


http://site.ru/photo.jpg
Работа в Париже
Париж, Франция



[/php]

В этой карте размещена одна ссылка на страницу и адреса с файлами изображений.

Соответственно, мы можем помимо адреса самой страницы передавать поисковику и информацию об изображениях, размещенных на этой странице.

Это корректный способ использоватения по сути двух видов файла в одном. Однако он не самый оптимальный, поскольку управлять измнеениями в такой реализации будет сложно. На наш взгляд оптимальный следующий способ:

Сделать отдельные файлы

Понятно, что можно генерировать два файла, один для изображений, другой для страниц. Более того, возможно и допустимо генерировать разные файлы для разных роботов, если для продвижения используются сложные схемы управления индексированием и этот процесс разделяется для Яндекса и Гугла.

В этом случае нужно не указывать на файл sitemap в файле robots.txt, а в панелях для веб мастеров указать адреса сайтмапов для той или иной поисковой системы.

Вот как это выглядит

Указание на общий sitemap в robotsВ SearchConsole добавлена карта сайта для изображенийКарта сайта добавлена в панели веб мастера Яндекса

Конкретно здесь такая реализация из-за того, что Яндекс некоторое время назад еще не поддерживал пространство имен для Sitemap image, поэтому мы и не добавили эту карту сразу в robots, а добавили только в GSC. Когда Яндекс стал поддерживать этот формат мы добавили карту через ЯВМ, ибо так быстрее.

Сейчас можно в файл robots.txt добавлять несколько ссылок на файлы карты сайта и поисковые системы обойдут их все.

В файле robots.txt

Обычный файл robots для обычного сайта выглядит стандартно. Как правило в таком обычном файле директивы используются для всех Usar-agent, в том числе ссылка на карты сайта для всех роботов одна.

При этом надо понимать, что сканированием графического контента на сайте занимаются специальные роботы — Googlebot-Image и YandexImages. Для этих агентов можно прописать свои директивы и свои карты сайта.

еще так можно управлять индексацией картинок

Индекс и много файлов

Индекс сам по себе предполагает несколько файлов внутри. Однако по нашему мнению не стоит в индекс вкладывать ссылки на файлы sitemap для изображений, видео и новостей, а расположить их отдельными файлами и добавить в панелях веб мастеров.

Вот так выглядит индекс карты сайта в Веб мастере

Так видит яндекс индексный файл карты сайта

А вот так в GoogleSearchConsole

Так индексный файл смотрится из панели GSC

Файлы внутри индекса технически не считаются как отдельные карты сайта, поэтому Яндекс предлагает к индексному файлу добавить еще 10 ссылок на файлы sitemap

Яндекс позволяет добавить еще 10 файлов, несмотря на то, что в индексном файле их уже 6

Так что индекс — хорошо, но для специфичного контента лучше делать свои отдельные файлы, не входящие в основной индекс. Кроме того, ничто не мешает веб мастеру делать индексы для разных типов карт сайта, если он имеет дело с очень большим количеством контента.

Как и для чего исследовать sitemap.xml

Первое, что я делаю, когда делаю технический аудит сайта — открываю его sitemap и рассматриваю его пару минут. Жестянка сразу бросается в опытный глаз.

Но ищем сейчас мы вовсе не жестянку, а исследуем сайт на потенциальные проблемы с индексированием, а учитывая общий уровень веб мастеров в России, да и за рубежом, честно говоря, эти проблемы касаются каждого второго сайта. Считаем количество URL в карте сайта и в индексе. Если разница большая (а большая она может быть в любую сторону) — надо выявлять проблему дальше, возможно она напрямую и не связана с sitemap. Тут уже следует смотреть взаимосвязи, потому как Вы помните что SEO? SEO — это явно рефлексивный процесс.

Использование sitemap — серьезный инструмент по управлению индексированием страниц сайта. Если у Вас большой сайт с регулярным добавлением нового контента в значительной объеме — этот инструмент едва ли не самый главный в работе веб мастера

Естественно, что файл sitemap должен состоять только из тех страниц, которые должны быть проиндексированы поисковыми системами. Но так получается не всегда. Сейчас мы разберем наиболее частые ошибки, которые встречаются при работе с sitemap.xml

Протокол, зеркало

Довольно часто встречается история, когда сайт доступен по протоколу https, а URL в карте сайта строятся по протоколу http

Ошибка в sitemap.xml

В данному случае проблема в скрипте. Разработчик указал протокол вручную и когда сайт переехал на https никто не обратил внимание на файл sitemap. То же самое касается и другого зеркала — сайта с www или без www.

В общем, при исследовании Вашего sitemap обратите внимание на то, чтобы был корректный адрес страниц.

Лишние страницы, технические страницы, заброшенные страницы

Часто в карте сайта, которому не повезло попасть в руки нормальных SEOшников встречаются встречаются страницы, которых там не должно быть. Причин на это может быть множество:

  • Особенности работы CMS
  • Особенности работы скрипта
  • Наличие на сайте брошенных, старых страниц, страниц, созданных для тестов и т. д.

Вне зависимости от природы этих ошибок результат всегда один — попадание в sitemap того, что не должно быть там. Только что попросили сделать аудит одного сайта и тут есть что показать Вам. Давайте смотреть картинки.

Ненужная страница в карте сайта

Видим, что есть некая страница с URL /404. Идем по адресу и…

Так выглядит страница 404 из sitemap

Есть даже некая ирония в том, что страница 404 возвращает код ответа 200 (а должна 404, если что). Дело в том, что таких страниц на этом сайте, непонятных, которые в принципе не нужны ни пользователю, ни поиску, ни кому другому несколько. Все они явно недостаточно качественные для индексации, все они не должны ранжироваться и это понимает поисковая система. Если таких страниц у нас 2-3 — ничего страшного, а если 200?

Верный код ответа сервера

Что такое код ответа сервера? Читайте, Екатерина старалась. Прочитали? Или и так знаете?

Подробно обсуждать коды ответов сервера мы здесь не будем. Если коротко, то все все страницы, входящие в sitemap должны возвращать код ответа сервера 200. Проверить код ответа сервера можно при помощи сервиса Яндекса здесь

Если сайт создан давно, то есть смысл исследовать страницы из карты сайта на предмет кода ответа, потому что запросто может быть как 404 (страница фактически удалена, но почему-то застряла в карте), так и 301 (поменяла адрес по разным причинам). Это самые популярные альтернативы 200-му ответу, но может быть вообще все что угодно. За это мы и любим веб технологии, — здесь полно сюрпризов и всякой жести порой. И это классно.

Страницы так или иначе скрытые от индексации

В файле robots можно закрывать от индексации как отдельные страницы, так и целые папки. Но надо быть последовательным и исключить их из карты сайта. Потому что робот приходит сначала в robots, а потом идет в sitemap и видит закрытые от индексации страницы… То же самое касается, если Вы управляете индексированием с помощью мета тега robots, или заголовков X-Robot tag. То, что лежит в карте сайта по умолчанию предназначено для сканирования и индексирования. Поэтому надо внимательно относиться к тому, что генерируют Ваши скрипты.

Файл sitemap не обновляется

Скрипт перестал писать в файл новые страницы. Такое случается довольно часто, и чем сложнее архитектура приложения, тем чаще такое происходит. Это не большая проблема, если не записана одна страница, а если их сотник, то будут проблемы с индексацией сотни этих страниц, поскольку вручную на переобход их не отправить.

Точно так же стоит обратить внимание на атрибут файла lastmod, если он не обновляется, а страница обновляется — поисковый робот может и не переобойти страницу, обратившись к атрибуту lastmod и вычислив, что страница не изменена.

Ошибки валидации

Из панели веб мастера Яндекс или Google могут Вам сообщать о том, что карта сайта сгенерирована с нарушениями и проч. Здесь трудно что-то разобрать на примерах, потому как на наших сайтах таких ошибок не бывает, да и вообще они довольно редкие. Такое если происходит, то вследствие ошибок при разработке, когда неверно применена или понята документация протокола. 99% сайтмапов сгенерированы CMS и если и содержат ошибки, то содержательные.

Как создать sitemap.xml

Сегодня с этим нет проблем совершенно. Большая часть сайтов работает на коммерческих CMS, которые из коробки имеют функционал по созданию sitemap. Конечно, когда Вам нужно сделать sitemap для видео, картинок, новостей, а плагины CMS этого решения не предлагают — нужно заниматься самостоятельной разработкой такого функционала, либо искать готовые решения и внедрять их в свой проект.

Если говорить об общих требованиях к карте сайта, то важными для SEO специалиста представляются следующие инструменты работы с sitemap:

  • Возможность исключать из sitemap отдельную страницу в админке
  • Возможность исключать из sitemap целые папки (/katalog/ например)
  • Возможность выставление приоритета сканирования страниц как для конкретных страниц, так и для папок

При выполнении таких требований с sitemap работать будет удобно, такой подход реализован во многих плагинах и CMS.

Все ли это?

Конечно, нет. Есть еще сотни технических и не только деталей, связанных с особенностями работы тех или иных роботов, восприятия директив, вычисления дат изменений, технической документацией протокола, индексом sitemap, пространством имен.

Эта информация будет уже мало кому интересна. Часть будет разобрана в других статьях нашего блога, посвященных работе поисковых роботов.

Ну и конечно, если Вы желаете заказать самый большой технический аудит сайта — пишите [email protected].

Если хотите сделать сами — мы подготовили Вам лучший чек-лист для технического аудита, пользуйтесь.

Полезные ссылки

Что такое sitemap.xml — как составить карту сайта

1 Апреля 2020

Содержание

Для показа в выдаче поисковой системе необходимо проиндексировать страницы сайта. Для этого в 2005 году компания Google был создан инструмент, который назвали sitemap. Это файл с расширением XML для описания страниц, где компактно можно описать все страницы сайта для их индексации поисковой системой. Теперь этот формат используется всеми поисковиками, поэтому надо правильно его настраивать.

Создание карты сайта

Если сайт имеет большое количество страниц, сразу возникает вопрос — как создавать карту сайта? Многие CMS имеют встроенные функционал для его создания, но можно генерировать и скриптом. Чтобы понять можно взглянуть на пример:

                                                                                                    
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="https://www.sitemaps.org/schemas/sitemap/0.9">
  <url>          
    <loc>http://example.com/</loc>      
    <lastmod>2013-11-18</lastmod>         
    <changefreq>monthly</changefreq>        
    <priority>0.8</priority>
  </url> 
</urlset>                                                                                             
   
  • encoding=»UTF-8″ — указываем кодировку для файла
  • urlset xmlns — указывает стандарт протокола
  • url — родительский тег для всех урлов в sitemap
  • loc — сюда записываем url-страницы, которую хотим предоставить для индексации поисковику
  • lastmod — необязательный тег, который указывает дату последнего обновления
  • changefreq — вероятная частота обновления для страницы, также необязательный тег
  • priority — приоритет для ПС для этой страницы относительно остальных страниц в файле сайтмап, необязателен

Где взять файл sitemap для своего сайта

  • Найти генератор карты сайта онлайн;
  • Воспользоваться специальной программой, имеющей данный функционал: Screaming Frog, WonderWebWare Sitemap Generator;
  • Написать сайтмап собственноручно;
  • Сгенерировать с помощью CMS (если доступна такая функция), о чем мы поговорим далее.

Генератор карты картинок

Эта возможность актуальна только для Гугла, с учетом необходимости продвижения в поиске по картинкам. Также как и обычный sitemap имеет схожую структуру:

Не забывайте добавлять карту картинок в файл robots.txt, вместе с обычной картой. У Яндекса такой функционал не предусмотрен.


<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="https://www.sitemaps.org/schemas/sitemap/0.9">
xmlns:image="https://www.google.com/schemas/sitemap-image/1.1"> <url> <loc>http://example.com/</loc>
<image:image>
<image:loc><image:loc>
</image:image>
</url>
</urlset>

Как добавить карту сайта в Яндекс

Для помощи в индексации сайта Яндексу, файл sitemap необходимо добавить в вебмастер (или проверить добавлен ли он). Заходим в индексирование > файлы sitemap и можем добавить и просмотреть текущие файлы.

В инструментах вы можете проверить карту на наличие ошибок, добавив ссылку на файл, загрузить или просто вставить код. Если интересно посмотреть какие бывают ошибки в файле, то можете сразу промотать сюда.

Добавление и просмотр файлов sitemap в Google

Для добавления карты надо открыть новую версию Search Console от гугл и для выбранного проекта добавить карту сайта в выделенное поле (актуально и для карты картинок)

Далее заходим на просмотр конкретной карты и можем узнать более подробную информацию (в том числе и ошибки).

Создание файла sitemap xml в Opencart

Существует встроенный генератор “Google Sitemap” для Opencart. Чтобы его запустить, необходимо перейти в список модулей, затем в “Каналы продвижения” (для версий 2.0 — 2.2) или “Модули / Расширения” и только там выбрать фильтр “Каналы продвижения” (для версий 2.3 и выше).

В админ панели OpenCart зайдите в Дополнения -> Каналы продвижения. Переходите в меню Редактировать Google Sitemap. Переключите статус sitemap на “включено” и скопируйте адрес Data Feed.

Для использования этого плагина сайт необходимо зарегистрировать в Google Search Console, поскольку далее нам понадобится перейти в меню Сканирование-> Файлы Sitemap и указать там адрес нашей карты сайта.

Недостатки

Как и в любом плагине, у Google Sitemap тоже есть свои недостатки.

  • Во-первых: на исполнение скрипта генерации карты сайта отведено ограниченное время (обычно это 30, 60, или 180 сек.). Решается эта проблема только путем установки более нового усовершенствованного генератора.
  • Во-вторых: Возникает конфликт с Яндексом из-за наличия изображений. Устранить конфликт можно установкой модуля Yandex Sitemap, он отличается от предыдущего только лишь тем, что не содержит тега image.
  • В-третьих: Неправильный приоритет добавления страниц. В первую очередь в сайтмап должны добавляться категории, а для нашего модуля товары имеют больший вес — 1. 0, когда категории и производители — всего лишь 0,7. При этом вес у товаров будет одинаковым независимо от того, старые они или новые. В таком случае ПС должны применять свои алгоритмы для определения приоритетных страниц, и кроме того, карта сайта с правильно расставленными приоритетами будет плюсом для выбранной вами страницы.

Как создать карту сайта sitemap.xml в WordPress

Самый доступный вариант — воспользоваться плагином Google XML Sitemaps.

  1. В меню панели управления WordPress переходим в плагины
  2. Добавить новый
  3. В строке поиска пишем “Google XML Sitemaps”
  4. Устанавливаем плагин
  5. По окончании установки кликаем на “Активировать плагин”

Карта сайта создается сразу после активации плагина, далее нам нужно правильно это все дело настроить.

  1. Переходим в Настройки -> XML-Sitemap
  2. В появившейся странице нам понадобится изменить следующее:
    • В настройках приоритета выбираем “Не использовать автоматическое вычисление приоритета
    • В содержании отмечаем те пункты, которые мы хотим добавить в карту сайта

Другие опции настраиваются индивидуальным образом для каждого проекта, если все оставить как есть, сайтмап все равно будет замечательно работать.

Как включить sitemap xml в Yoast SEO

Yoast SEO — довольно популярный плагин для WordPress, и следует отметить, что в нем предусмотрена настройка карты сайта.

После установки данного плагина в левом меню появится пункт “SEO”. Здесь нам нужно включить построение карты сайта в соответствующем пункте. Далее пробежимся по вкладкам с настройками.

Общие: Здесь можно посмотреть созданную карту сайта. Если сайт работает слишком медленно, попробуйте уменьшить значение “Max entries per sitemap”.

Карта сайта со списком пользователей: Если у вас интернет-магазин или любой другой ресурс, не подразумевающий создание записей различными пользователями, рекомендуется поставить галочку на “Отключить карту сайта со списком авторов и пользователей”, чтобы исключить из карты сайта лишнюю информацию.

Типы записей: Отключаем ненужные типы ресурсов. Для блогов рекомендуется отключить медиафайлы, это сделает xml карту сайта легче и при ее построении уменьшит нагрузку на блог.

Таксономии: Исключаем из карты метки, форматы и рубрики (если они не приносят трафик).

Ежели по какой-либо причине Яндекс.Вебмастер утверждает, что “нет используемых роботом файлов sitemap” в сайте на WordPress, придется залить карту сайта вручную.

Карта сайта для Joomla 3

Базовый функционал этой CMS не предусматривает создание файла карты сайта, но для нашей цели существуют специальные расширения, позволяющие создать Sitemap в общепринятых форматах.

Поговорим о самых известных из них:

  • Xmap
  • mapX
  • OSMap
  • JSitemap
  • JL Sitemap

Начнем с Xmap

Данный генератор является самым популярным на Joomla, поскольку он:

  • самый первый генератор карт сайта для Joomla
  • свободно распространяемый (бесплатный)
  • простой для освоения
  • функциональный
  • прекрасно справляется со своей задачей
Теперь о недостатках
  • устарел и очень давно не обновляется
    Последняя версия плагина была выпущена в 13 году, из-за чего могут возникать проблемы при взаимодействии с другими используемыми компонентами Joomla.
  • требует наличия дополнительных плагинов
    Если на сайте установлены сторонние компоненты, то для добавления в карту сайта некоторых документов, которые создаются этими компонентами, понадобятся дополнительные решения, которых может уже и не существовать, т. к. их актуальность непрерывно стремится к нулю.

Создать карту сайта с Xmap можно практически в пару кликов:

  • устанавливаем компонент,
  • открываем настройки,
  • создать и опубликовать sitemap,
  • создать и опубликовать пункт меню.

Компонент MapX

По сути тот же Xmap, но с некоторыми дополнениями:

  • обновленный интерфейс,
  • функция “Пинг”, сообщающая об обновлении карты поисковым системам.

OSMap

Наследник Xmap, но, в отличие от своего предка, поддерживается разработчиком и, как следствие, регулярно обновляется.

JSitemap и JL Sitemap имеют очень широкий функционал, и рекомендуется их использовать только в тех случаях, когда просто сгенерировать sitemap вам не достаточно, или если вы просто не ищете легких путей.

Создание карты сайта в MODx

Здесь все будет крайне просто:

Для создания карты сайта будем использовать пакет pdoTools, если он не установлен, найдите его в установщике приложений Modx.

Далее идем по пунктам:

  1. Создаем новый файл с именем sitemap.xml и псевдонимом sitemap
  2. указываем шаблон (пустой шаблон)
  3. Переходим в настройки — тип содержимого XML
  4. В поле «содержимое» пишем [[!pdoSitemap? &checkPermissions= list ]]
  5. Публикуем и сохраняем

Карта сайта в Drupal

Если вы используете Drupal 7, то для вас разработан модуль, способный создавать и регистрировать карту сайта автоматически. Его можно найти на официальном сайте друпала, называется он “XML sitemap”, устанавливается он не сложно, на просторах интернета можно найти предостаточно инструкций для новичков на данной CMS. Достаточно включить следующие составляющие модуля:

  • XML sitemap
  • XML sitemap engines
  • XML sitemap menu
  • XML sitemap node
  • XML sitemap taxonomy

Прежде, чем приступить к настройке модуля, нам потребуется открыть доступ всем пользователям, и даже анонимам, на просмотр профилей пользователей. И так, в верхнем меню переходим в Пользователи -> Права доступа.

В строке “просмотр профилей пользователей” ставим все галочки.

Далее, идем в «Конфигурация» -> «Поиск и метаданные». Там вы увидите ссылку ссылка на XML-карту сайта, кликаем. Настройку начнем с раздела “Поисковые системы”.

Здесь выставляем все галочки на «Отправлять карту сайта на следующие поисковики», а в поле «Не отправлять чаще чем раз в» настраиваем ограничение по частоте отправки файла сколько вам нужно. Плавно перемещаемся в следующий раздел “Настройки”

Минимальным временем жизни карты сайта является цикл жизни XML файла. Трогать соответствующее поле стоит в том случае, когда у вас большое кол-во страниц (больше 400), в иных случаях настраивать время жизни не обязательно.

Предварительно запрашивать URL синонимы во время генерации карты сайта – опция достаточно тяжелая для сервера, т.к. она одномоментно запрашивает все ur. Поэтому, если сайт крупный, чтобы не перегружать сервер, её рекомендуется отключить.

После того как мы завершили настройку нашего модуля, давайте добавим материалы, термины и меню в получившуюся карту сайта.

  1. Для начала перейдем в Структуру, типы материалов.
  2. Справа от каждого типа материала находится нужная нам ссылка «Изменить».
  3. Листаем до конца и переходим в раздел «XML-карты сайта»
  4. В графе «Добавлять в карту сайта» устанавливаем галочку на «включить», а в приоритетности, для basic page, ставим «1.0». Для всех остальных проделываем то же самое, но с корректировкой приоритета, исходя из важности выбранного материала.
  5. Включаем Sitemap для пунктов меню и терминов таксономии. В верхнем меню идем в “словарь”, который находится по пути «Структура» -> «Таксономия»
  6. Изменить словарь
  7. Добавляем наши материалы в карту сайта.

Возвращаемся в окно настроек модуля. Там мы видим, что в подразделах появилась новая вкладка «Обновить карту сайта», что нам, собственно, и нужно.

На странице необходимо оставить галочку «Сохранить и восстановить любые текущие включения и приоритет ссылок.» и здесь же обновляем карту сайта.

Последнее, что от нас нужно, это запустить планировщик Cron в ручном режиме. В админ панели идем в раздел «Конфигурация» -> «Система», там вы увидите «Cron Settings»

Запускаем крон с помощью соответствующей кнопки в раскрывшемся окне.

Карта сайта готова.

Sitemap в 1С Bitrix

Как известно, Битрикс — это замечательная CMS, в том числе и потому, что Sitemap.xml в ней создается автоматически. Для кастомизации есть пользовательская форма создания карты сайта, в которой можем указать материалы и разделы инфоблоков, которые мы собираемся добавить в карту.

Развернутый список настроек карты сайта расположен в Маркетинг > Поисковая оптимизация > Настройка sitemap.xml.

Немного расскажу о кнопках, которые мы увидим в контекстной панели

  • Добавить — нужна для перехода к форме добавления новой настройки генерации карты сайта.
  • Настроить — переход к окну настройки отображения (внешнего вида) отчетной формы.
  • Excel — экспорт данных из отображаемой таблицы в MS Excel.

Список настроек

  • Колонка флажков — выбор настроек, к которым предполагается применить какое-либо действие.
  • Меню действий — перечень доступных для нас действий;
  • Редактировать — переход в окно редактирования выбранной настройки генерации карты сайта;
  • Запустить — запуск встроенного генератора карты сайта sitemap. xml;
  • Удалить — удаление настройки.
  • ID — идентификатор настройки.
  • Изменено — последнее изменения в настройках или последняя генерация карты в формате дата и время.
  • Название — название настройки карты сайта.
  • Сайт — идентификатор и название сайта, для которого составлена настройка.
  • Последний запуск — последняя генерация карты сайта в формате дата и время.

Список ошибок

файл не проиндексирован загрузка файла прошла неудачно, стоит проверить доступность сайта по заданному url
размер файла больше допустимого значения размер файла превысил 50 кб, стоит разделить файл не несколько
ошибка при ответе HTTP, Неправильный HTTP-ответ файл отдает ответ отличный от 200 или ответ не соответствует HTTP протоколу, проверить ответ
невалидный URL невалидная запись URL-сайта
Ошибка DNS Проверить чтобы ссылка на файл была правильной
Соединение было прервано, ошибка при соединении при загрузке файла, соединение с сервером было разорвано или не удалось установить его
URL запрещен в файле robots. txt Урлы запрещенные в robots.txt должны быть удалены из sitemap
Ответ не содержит данных Сервер передал пустой файл
Тег встречается более одного раза Все теги должны быть использованы только один раз для каждой записи
Неизвестный тег В файле не должно быть лишних тегов
Тег не найден Обязательным должно быть включение трех тегов urlset xmlns, url, loc
Некорректный URL (не соответствует местоположению файла Sitemap) Необходимо формировать отдельный sitemap для поддоменов
Слишком длинный URL Длина урла не должна превышать 1024 символа
Нет данных в теге, тег не должен содержать другие теги, превышено допустимое число данных Все эти ошибки говорят о том что данные в тегах неверны
Неверная кодировка Эта строка обязательна и указывает на кодировку <?xml version=»1. 0″ encoding=»UTF-8″?>
Невалидный XML Неправильная структура XML
Число URL превышает заданный предел Если записей больше 50000, то надо разделить файл на несколько и сделать индексный файл Sitemap
Число файлов Sitemap превышает заданный предел Также и файл индекса сайтмап не может быть больше чем 50000 записей
Много некорректных URL в начале файла и слишком много ошибок Надо проверить правильность вывода url и вообщем файла, загрузка прекращается на начальной стадии (требуется повторно проверить на ошибки)
Файл Sitemap index не может содержать ссылки на файлы Sitemap index Если вы используете конструкцию <sitemapindex> , то в перечисление не должно быть файлов, содержащих <sitemapindex>
Ошибка в корневом теге Не удалось правильно обработать корневой тег. Проверьте тег <urlset>

MODX sitemap | документация с примерами по PdoSitemap

Автор Алексей На чтение 4 мин. Просмотров 1.7k. Опубликовано Обновлено

Сегодня мы разберем как в MODX Revo создать sitemap.xml. Перед тем как начать, давайте изучим немного теории.

Что такое sitemap.xml

Sitemaps — это XML файл содержащий в себе информацию для роботов поисковых систем, о страницах сайта, подлежащих индексации. Иными словами сайтмап помогает поисковым роботам более быстро определять место нахождения страниц, время и частоту их обновления, а так же их важность.

Документация по сниппету pdoSitemap

Быстрый сниппет генерации карты сайта для поисковых систем (sitemap.xml). Понимает параметры сниппета GoogleSitemap (конвертирует в собственные) и легко его заменяет.

Главная особенность — очень высокая скорость, по сравнению с аналогом. На сайте bezumkin.ru при 1700 страниц скорость генерации возросла в 12 раз, с 8.4 сек. до 0.7.

По умолчанию отключена проверка прав на доступ к документам. Это легко исправить включением параметра &checkPermissions (Внимание: замедляет работу!):

[[!pdoSitemap?
    &checkPermissions=`list`
]]

По возможности ресурсы лучше исключать из карты параметрами сниппета.

Параметры

pdoSitemap принимает все параметры pdoTools и некоторые свои:

ПараметрПо умолчаниюОписание
&sitemapSchemahttp://www.sitemaps.org/schemas/sitemap/0.9Схема карты сайта.
&forceXML1Принудительно выводить страницу как XML.
&priorityTVДополнительное поле, в котором указывается приоритет документа. Нужно добавить его в параметр &includeTVs

Шаблоны

&tpl

@INLINE <url>\n\t
<loc>[[+url]]</loc>\n\t
<lastmod>[[+date]]</lastmod>\n\t
<changefreq>[[+update]]</changefreq>\n\t
<priority>[[+priority]]</priority>\n
</url>

&tplWrapper

@INLINE <?xml version=\"1.0\" encoding=\"[[++modx_charset]]\"?>\n<urlset xmlns=\"[[+schema]]\">\n[[+output]]\n</urlset>

Приоритет и частота обновления для поисковиков устанавливаются в зависимости от последней даты изменения документа:

Времени с последнего обновления документаПриоритетЧастота обновления
Менее суток назад1.0daily
Более суток и менее недели назад0. 75weekly
Более недели и менее месяца назад0.5weekly
Более месяца назад0.25monthly

Создание sitemap.xml в MODX Revo

Перед тем как начать, вам желательно настроить чпу modx, если оно не настроено.

Создавать sitemap.xml мы будем при помощи pdoSitemap (данный сниппет входит в пакет pdoTools), он у вас должен быть уже установлен. Рассмотрим пошагово, процесс создания сайтмап.

1. Создайте документ и заполните вкладку «Документ» следующим образом:

  • Заголовок – sitemap;
  • Шаблон – пустой шаблон;
  • Псевдоним – sitemap;
  • Не показывать в меню – Да.
  • Опубликован – Да.

2. Перейдите во вкладку «Настройки» и выберите следующее:

  • Тип содержимого – XML.
  • Доступен для поиска – Нет.
  • Использовать HTML редактор – Нет.
  • Сохранить документ (ресурс).

Примечание! Если у вас не настроено ЧПУ, то во вкладке Настройки вероятно нужно так же выбрать — Заморозить URI и ввести в поле URL — sitemap. xml.

Важно! Если поисковые системы не видят файл то вместо встроенного местонахождения выберите прикрепленный файл.

3. В поле содержимое ввести: [[!pdoSitemap]] и снова сохранить.

Все. Можно проверить результат, для того нажмите на кнопку посмотреть, либо перейдите по адресу сайт.ru/sitemap.xml.

Больше примеров вызова

Генерируем карту сайта только из определённый контейнеров:

[[pdoSitemap?
    &parents=`10`
]]

Исключаем ресурсы с id = 17 и 27, вместе с их потомками:

[[pdoSitemap?
    &parents=`10, -17,-27`
]]

А теперь исключаем id = 17 с потомками, а 27 — без:

[[pdoSitemap?
    &resources=`-27`
    &parents=`-17,10`
]]

Добавляем еще один контекст:

[[pdoSitemap?
    &resources=`-25`
    &parents=`-15,10`
    &context=`web,catalog`
]]

А вот так можно посмотреть лог выборки карты:

[[pdoSitemap?
    &resources=`-27`
    &parents=`-17,10`
    &context=`web,catalog`
    &showLog=`1`
    &forceXML=`0`
]]

Пример вызова карты сайта на fenom:

{'!pdoSitemap' | snippet : [ 
'parents' => '0', 
'checkPermissions' => 'list', 
'context' => 'web', 
'showHidden' => '1' 
]}

Что такое XML-карта сайта? Как создать карту сайта в WordPress?

Вам интересно, что такое карта сайта XML и как добавить ее на свой сайт WordPress?

Карта сайта в формате XML помогает поисковым системам легко перемещаться по содержанию вашего веб-сайта. Он предоставляет им список всего вашего контента в машиночитаемом формате.

В этой статье мы объясним, что такое XML-карта сайта, и как легко создать карту сайта в WordPress.

Что такое XML-карта сайта?

Карта сайта XML — это файл, в котором перечислено все содержимое вашего веб-сайта в формате XML, поэтому поисковые системы, такие как Google, могут легко обнаруживать и индексировать ваш контент.

Еще в начале 2000-х правительственные веб-сайты имели на своих главных страницах ссылку под названием «Карта сайта». Эта страница обычно содержит список всех страниц этого веб-сайта.

Хотя некоторые веб-сайты по-прежнему имеют карты сайта в формате HTML, в целом использование карт сайта изменилось.

Сегодня карты сайта публикуются в формате XML вместо HTML, и их целевая аудитория — поисковые системы, а не люди.

По сути, карта сайта в формате XML — это способ для владельцев веб-сайтов сообщить поисковым системам обо всех страницах, существующих на их веб-сайтах.

Он также сообщает поисковым системам, какие ссылки на вашем сайте важнее других и как часто вы обновляете свой сайт.

Хотя карты сайта в формате XML не повышают рейтинг вашего сайта в поисковых системах, они позволяют поисковым системам лучше сканировать ваш сайт. Это означает, что они могут найти больше контента и начать показывать его в результатах поиска, что приведет к увеличению поискового трафика и повышению рейтинга SEO.

Зачем вам нужен XML-файл Sitemap?

Карты сайта чрезвычайно важны с точки зрения поисковой оптимизации (SEO).

Простое добавление карты сайта не влияет на поисковый рейтинг . Однако, если на вашем сайте есть страница, которая не проиндексирована, то карта сайта предоставляет вам способ сообщить поисковым системам об этой странице.

Карты сайта

чрезвычайно полезны, когда вы впервые запускаете блог или создаете новый веб-сайт, потому что на большинстве новых веб-сайтов нет обратных ссылок. Это затрудняет поисковым системам обнаружение всего своего контента.

Вот почему поисковые системы, такие как Google и Bing, позволяют новым владельцам веб-сайтов отправлять карту сайта в свои инструменты для веб-мастеров.Это позволяет их роботам поисковых систем легко находить и индексировать ваш контент (подробнее об этом позже).

Карты сайта не менее важны для уже существующих популярных веб-сайтов. Они позволяют вам выделить, какая часть ваших веб-сайтов более важна, какие части обновляются чаще и т. Д., Чтобы поисковые системы могли посещать и соответственно индексировать ваш контент.

При этом давайте посмотрим, как создать карту сайта XML в WordPress.

Как создать карту сайта в WordPress?

Есть несколько способов создать карту сайта XML в WordPress.Мы покажем вам три популярных метода создания XML-карты сайта в WordPress, и вы сможете выбрать тот, который лучше всего подходит для вас.

Метод 1. Как создать XML-карту сайта в WordPress без подключаемого модуля

Это очень простой метод с ограниченными возможностями.

До августа 2020 года в WordPress не было встроенных карт сайта. Однако в WordPress 5.5 они выпустили базовую функцию карты сайта XML.

Это позволяет автоматически создавать XML-карту сайта в WordPress без использования плагина.Вы можете просто добавить wp-sitemap.xml в конце вашего доменного имени, и WordPress покажет вам карту сайта XML по умолчанию.

Эта функция карты сайта XML была добавлена ​​в WordPress, чтобы гарантировать, что любой новый веб-сайт WordPress не упустит преимущества SEO карты сайта XML.

Однако он не очень гибкий, и вы не можете легко контролировать, что добавлять или удалять из ваших XML-карт сайта.

К счастью, почти все лучшие плагины для SEO для WordPress имеют собственные функции карты сайта.Эти карты сайта лучше, и вы можете контролировать, какой контент удалять или исключать из карт сайта WordPress XML.

Метод 2. Создание XML-карты сайта в WordPress с использованием All in One SEO

Самый простой способ создать XML-карту сайта в WordPress — использовать плагин All in One SEO для WordPress.

Это лучший плагин WordPress для SEO на рынке, предлагающий вам полный набор инструментов для оптимизации ваших сообщений в блоге для SEO.

Во-первых, вам необходимо установить и активировать плагин All in One SEO.Для получения дополнительной информации см. Наше пошаговое руководство по установке плагина WordPress.

Примечание. Функция Sitemap также доступна в бесплатной версии AIOSEO. Однако для получения расширенных файлов Sitemap для новостей и видео вам понадобится версия Pro.

После активации перейдите на страницу All in One SEO »Карты сайта , чтобы просмотреть настройки карты сайта.

По умолчанию All in One SEO включает функцию Sitemap для вас и заменяет базовые карты сайта WordPress.

Вы можете нажать кнопку «Открыть карту сайта», чтобы просмотреть ее и посмотреть, как она выглядит. Вы также можете просмотреть карту сайта, добавив «sitemap.xml» к URL-адресу, например www.example.com/sitemap. xml.

Новичку ничего делать не нужно, настройки по умолчанию подходят для всех типов веб-сайтов, блогов и интернет-магазинов.

Однако вы можете настроить параметры карты сайта, чтобы управлять тем, что вы хотите включить в карту сайта XML.

Просто прокрутите вниз до раздела настроек Sitemap.

Этот раздел дает вам возможность управлять индексами карты сайта, включать или исключать типы сообщений, таксономии (категории и теги). Вы также можете включить карты сайта XML для архивов на основе дат и архивов авторов.

All in One SEO автоматически включает весь ваш контент WordPress в карты сайта XML. Однако что, если у вас есть отдельные страницы, такие как контактная форма, целевая страница или страницы магазина Shopify, которые не являются частью WordPress?

Ну, AIOSEO — единственный плагин, который позволяет вам добавлять внешние страницы в вашу карту сайта WordPress.Просто прокрутите до раздела Дополнительные страницы и включите его. Это покажет вам форму, в которой вы можете добавить любые настраиваемые страницы, которые хотите включить.

Вам просто нужно добавить URL-адрес страницы, которую вы хотите включить, а затем установить приоритет, где 0,0 — самый низкий, а 1,0 — самый высокий. Если вы не уверены, мы рекомендуем использовать 0,3.

Далее выберите частоту обновлений и дату последнего изменения страницы.

Вы можете нажать кнопку «Добавить», если вам нужно добавить больше страниц.

Не забудьте нажать кнопку «Сохранить изменения», чтобы сохранить свои настройки.

Исключение определенных сообщений / страниц из XML-файла Sitemap

All in One SEO позволяет исключить любую публикацию или страницу из ваших XML-файлов Sitemap. Вы можете сделать это, щелкнув раздел «Дополнительные настройки» на странице All in One SEO »Карты сайта .

Вы также можете удалить сообщение или страницу из файлов Sitemap XML, сделав их запретными для индексации и подписки. Это запретит поисковым системам показывать этот контент в результатах поиска.

Просто отредактируйте сообщение или страницу, которые вы хотите исключить, и прокрутите вниз до поля настроек AIOSEO под редактором.

Отсюда вам нужно переключиться на вкладку «Дополнительно» и установить флажки рядом с параметрами «Без индекса» и «Без отслеживания».

Создание дополнительных файлов Sitemap

All in One SEO позволяет создавать дополнительные карты сайта, такие как карта сайта для видео или карта сайта для новостей.

Вы можете создать карту сайта для видео, если регулярно вставляете видео в сообщения или на страницы своего блога. Это позволяет поисковым системам отображать сообщения в результатах поиска и видео вместе с миниатюрами видео.

Вы также можете создать карту сайта для новостей, если у вас есть новостной веб-сайт и вы хотите отображаться в результатах поиска Новостей Google.

Просто перейдите на страницу All in One SEO »Карты сайта и переключитесь на вкладки Video Sitemap или News Sitemap, чтобы создать эти карты сайта.

В целом, AIOSEO — лучший плагин WordPress, потому что он дает вам всю гибкость и мощные функции по очень доступной цене.

Метод 3. Создание XML-карты сайта в WordPress с помощью Yoast SEO

Если вы используете Yoast SEO в качестве плагина WordPress SEO, он также автоматически включает для вас XML-карты сайта.

Во-первых, вам необходимо установить и активировать плагин Yoast SEO. Для получения дополнительной информации см. Наше пошаговое руководство по установке плагина WordPress.

После активации перейдите на страницу SEO »Общие и перейдите на вкладку« Возможности ». Отсюда вам нужно прокрутить вниз до опции «XML Sitemap» и убедиться, что она включена.

Затем нажмите кнопку «Сохранить изменения», чтобы сохранить изменения.

Чтобы убедиться, что Yoast SEO создал XML-карту сайта, вы можете щелкнуть значок вопросительного знака рядом с опцией XML Sitemap на странице.

После этого нажмите ссылку «Просмотреть XML-карту сайта», чтобы просмотреть свою текущую XML-карту сайта, созданную Yoast SEO.

Вы также можете найти свою карту сайта в формате XML, просто добавив sitemap_index.xml в конце адреса своего веб-сайта. Например:

https://www.example.com/sitemap_index.xml

Yoast SEO создает несколько карт сайта для разных типов контента. По умолчанию он создает карты сайта для сообщений, страниц, автора и категорий.

Как отправить XML-файл Sitemap в поисковые системы

Поисковые системы довольно умны при поиске карты сайта.Каждый раз, когда вы публикуете новый контент, в Google и Bing отправляется пинг, чтобы сообщить им об изменениях в вашей карте сайта.

Однако мы рекомендуем отправлять карту сайта вручную, чтобы поисковые системы могли ее найти.

Отправка XML-файла Sitemap в Google

Google Search Console — это бесплатный инструмент, предлагаемый Google, чтобы помочь владельцам веб-сайтов отслеживать и поддерживать присутствие своего сайта в результатах поиска Google.

Добавление карты сайта в Google Search Console помогает ей быстро обнаруживать ваш контент, даже если ваш сайт совсем новый.

Во-первых, вам необходимо посетить веб-сайт Google Search Console и зарегистрировать учетную запись.

После этого вам будет предложено выбрать тип недвижимости. Вы можете выбрать домен или префикс URL. Мы рекомендуем выбрать префикс URL, так как его проще настроить.

Введите URL-адрес своего веб-сайта и нажмите кнопку «Продолжить».

Далее вам будет предложено подтвердить право собственности на сайт. Вы увидите несколько методов для этого, мы рекомендуем использовать метод HTML-тега.

Просто скопируйте код с экрана и перейдите в админку вашего сайта WordPress.

Если вы используете AIOSEO, то для него предусмотрена простая проверка инструментами для веб-мастеров. Просто зайдите в All in One SEO »Общие настройки и затем щелкните вкладку Инструменты для веб-мастеров. После этого вы можете ввести туда код от Google.

Если вы не используете AIOSEO, вам необходимо установить и активировать плагин Insert Headers and Footers.Для получения дополнительной информации см. Наше пошаговое руководство по установке плагина WordPress.

После активации вам необходимо перейти на страницу Настройки »Вставить верхние и нижние колонтитулы и добавить код, который вы скопировали ранее, в поле« Сценарии в заголовке ».

Не забудьте нажать кнопку «Сохранить», чтобы сохранить изменения.

Теперь вернитесь на вкладку Google Search Console и нажмите кнопку «Подтвердить».

Google проверит наличие кода подтверждения на вашем сайте и затем добавит его в вашу учетную запись Google Search Console.

Примечание: Если проверка не удалась, обязательно очистите кеш и попробуйте еще раз.

Теперь, когда вы добавили свой веб-сайт, давайте также добавим карту сайта в формате XML.

На панели управления вашей учетной записи вам нужно нажать «Sitemaps» в левом столбце.

После этого вам необходимо добавить последнюю часть URL-адреса вашей карты сайта в раздел «Добавить новую карту сайта» и нажать кнопку «Отправить».

Теперь Google добавит URL вашей карты сайта в консоль поиска Google.

Google потребуется некоторое время, чтобы просканировать ваш сайт. Через некоторое время вы сможете увидеть основную статистику карты сайта.

Эта информация включает количество ссылок, найденных Google в вашей карте сайта, сколько из них проиндексировано, соотношение изображений к веб-страницам и многое другое.

Отправка XML-файла Sitemap в Bing

Подобно Google Search Console, Bing также предлагает инструменты Bing для веб-мастеров, которые помогают владельцам веб-сайтов отслеживать свои веб-сайты в поисковой системе Bing.

Чтобы добавить карту сайта в Bing, вам необходимо посетить веб-сайт Bing Webmaster Tools. Здесь вы увидите два варианта добавления своего сайта. Вы можете импортировать свой сайт из Google Search Console или добавить его вручную.

Если вы уже добавили свой сайт в Google Search Console, мы предлагаем импортировать его. Это экономит время, поскольку ваша карта сайта будет автоматически импортирована за вас.

Если вы решили добавить свой сайт вручную, вам необходимо ввести URL-адрес своего сайта, а затем подтвердить сайт.

Bing попросит вас подтвердить право собственности на ваш сайт и покажет вам несколько способов сделать это.

Мы рекомендуем использовать метод метатега. Просто скопируйте строку метатега со страницы и перейдите в админку WordPress.

Теперь установите и активируйте плагин Insert Headers and Footers на своем веб-сайте.

После активации вам необходимо перейти на страницу «Настройки » »Вставить верхние и нижние колонтитулы и добавить код, который вы скопировали ранее, в поле« Сценарии в заголовке ».

Не забудьте нажать кнопку «Сохранить», чтобы сохранить изменения.

Как использовать XML-карты сайта для развития вашего сайта?

Теперь, когда вы отправили карту сайта XML в Google, давайте посмотрим, как использовать ее на своем веб-сайте.

Во-первых, вы должны иметь в виду, что XML-карта сайта не улучшает ваш поисковый рейтинг. Однако это помогает поисковым системам находить контент, регулировать скорость сканирования и улучшать видимость вашего сайта в поисковых системах.

Вам нужно следить за статистикой вашей карты сайта в Google Search Console. Он может показать вам ошибки сканирования и страницы, исключенные из охвата поиска.

Под диаграммами вы можете нажимать на таблицы, чтобы просмотреть фактические URL-адреса, исключенные или не проиндексированные Google.

Обычно Google может принять решение пропустить повторяющееся содержание, страницы без содержания или с очень небольшим содержанием, а также страницы, исключенные файлом robots. txt или метатегами вашего сайта.

Однако, если у вас необычно большое количество исключенных страниц, вы можете проверить настройки плагина SEO, чтобы убедиться, что вы не блокируете какой-либо контент.

Подробнее см. В нашем полном руководстве по Google Search Console для начинающих.

Мы надеемся, что эта статья помогла ответить на все ваши вопросы о XML-картах сайта и о том, как создать XML-карту сайта для вашего сайта WordPress. Вы также можете ознакомиться с нашим руководством о том, как быстро увеличить посещаемость вашего веб-сайта с помощью пошаговых советов и нашего сравнения лучших инструментов исследования ключевых слов для написания лучшего контента.

Если вам понравилась эта статья, то подпишитесь на наш канал YouTube для видеоуроков по WordPress.Вы также можете найти нас в Twitter и Facebook.

Что такое карта сайта | Типы файлов Sitemap

Sitemap — это в основном карта, содержащая информацию обо всех ресурсах, размещенных на веб-сайте. Это помогает пользователям, а также поисковым системам легко находить нужный объект на веб-сайте. С другой стороны, это также помогает им улучшить их поиск (для пользователей) и индексацию (для поисковых систем).

Какие бывают типы файлов Sitemap?

Существует два основных типа карт сайта;

  • Карта сайта HTML (написанная на языке гипертекстовой разметки)
  • Карта сайта XML (написана на расширяемом языке разметки)

XML-файлы Sitemap могут иметь два типа.

  • Индекс Sitemap (сколько URL-адресов Sitemap есть на сайте)
  • URL Sitemap (содержит окончательную информацию об URL-адресах на веб-странице)

XML-карты сайта делятся на 3 разные категории.

  • Карты сайта для веб-страниц (в сообществе обычно называемые XML-картой сайта)
  • Карты сайта для изображений (подробная информация об изображениях и их URL-адресах на веб-сайте)
  • Карты сайта для видео (на каких веб-страницах встроены видеоролики и их подробности)

[the_ad id = ”6396 ″]

Итак, окончательное дерево категоризации карт сайта, которое у нас есть;

  • XML Sitemap
    • Индекс Карта сайта
    • URL Sitemap
      • Карты сайта для веб-страниц
      • Файлы Sitemap для изображений
      • Файлы Sitemap для видео
  • HTML-файлы Sitemap

Что такое карта сайта в формате HTML?

Карта сайта

HTML, как указано выше, представляет собой карту, которая содержит информацию о ресурсах веб-сайта и их местонахождении. Эти карты сайта предназначены в первую очередь для пользователей, чтобы помочь им найти желаемый элемент на веб-сайте или легко изучить веб-сайт. Возьмем пример:

На веб-сайте есть тысячи веб-страниц, распределенных по различным разделам в виде каталогов. Теперь с таким огромным количеством веб-страниц пользователь может чувствовать себя в никуда, когда попадает на такой сайт. Первое, что может ему помочь — это вариант поиска. Но если ему не повезло, то карта сайта в формате HTML станет для него последним средством изучения веб-сайта.

Во-вторых, поскольку карта сайта HTML связывает ресурсы внутри компании, а внутренние ссылки помогают повысить рейтинг ключевых слов; Эти карты сайта также помогают ссылкам веб-страниц в их рейтинге в поисковых системах.

[the_ad id = ”6392 ″]

Что такое XML-файлы Sitemap?

XML — это, по сути, язык, на котором информация об объекте хранится в организованном или заранее определенном формате. Этот формат непонятен людям, но поисковые системы понимают, что в нем написано и цель написания. Итак, мы можем сказать это;

Карты сайта

XML предназначены в первую очередь для поисковых систем, чтобы иметь карту внутренних / внешних ресурсов веб-сайта с их информацией. Быстрое и безопасное индексирование веб-сайта поисковыми системами полагается на эти карты сайта.

Что мы пишем в XML Sitemap?

Мы записываем информацию об объектах, например, о его доступности, важности, типе объекта, частоте изменений и т. Д.


Что такое XML-карта сайта и как ее использовать для SEO? [Видео]

Вы еще не подписаны на наш канал на YouTube ?!

Выписка:

Если вы пират, пытающийся найти сундук с сокровищами, разве карта с указанием того, где именно находится сокровище, не сделает вашу жизнь намного проще?

Ну, это в основном то, что делает XML-карта сайта для поисковых роботов — и это облегчает им поиск и индексирование страниц на вашем сайте.

В этом видео я расскажу о том, что такое XML-карта сайта, как создать карту сайта и как отправить ее через Google Search Console. Оставайтесь с нами, чтобы продолжить обучение.

Итак, во-первых, что такое карта сайта XML?

Поисковые системы используют ботов, называемых сканерами, для выхода во всемирную паутину для поиска страниц в Интернете.

Хотя они делают это довольно быстро, может пройти довольно много времени, прежде чем они найдут определенную страницу на вашем веб-сайте из-за огромного количества контента, доступного в Интернете.

Вот тут-то и пригодится карта сайта в формате XML!

XML-карта сайта — это файл на вашем веб-сайте, который сообщает сканерам поисковых систем, что вы хотите, чтобы они смотрели на вашем сайте.

Это выглядит примерно так:

В этом примере с sitemaps.org вы видите карту сайта с одной ссылкой. Карта сайта состоит из трех обязательных частей. Первый — , который содержит все URL-адреса в карте сайта.

Следующая необходимая часть — это тег , который является контейнером для всей информации, связанной с отдельными URL-адресами.Теперь мы переходим к информации об отдельных URL. Внутри тега URL находится тег местоположения (), в который вы помещаете URL, на который хотите направить поисковые роботы.

Другие элементы не требуются поисковым системам, но все же очень полезны.

Тег последней модификации () сообщает вам, когда файл был последний раз изменен.

Тег частоты изменения () сообщает, как часто вы обновляете свои страницы, а тег приоритета () сообщает поисковым роботам, какие страницы более важны на вашем сайте.

Вот пример карты сайта компании GLAD, занимающейся хранением продуктов и мусором.

Вот еще один пример карты сайта в формате XML от New Yorker. Здесь вы увидите все типичные элементы карты сайта, о которых я говорил ранее, такие как теги , , и .

Как карты сайта влияют на SEO?

Sitemap может положительно повлиять на SEO.

Пока мы сосредоточены на XML-картах сайта, HTML-карты сайта являются очень полезным инструментом SEO.

Обычно вы можете найти ссылку на карту сайта в формате HTML в нижнем колонтитуле веб-сайта. Здесь вы видите пример карты сайта в формате HTML.

Карта сайта в формате HTML предназначена для людей и поисковых роботов, и с ее помощью поисковые роботы могут легко находить и индексировать ссылки на вашем сайте. Карта сайта XML предназначена для поисковых роботов и помогает им находить новые страницы для индексации.

Сканирование и индексирование страниц вашего сайта — важная часть того, как поисковые системы определяют, где ваш сайт будет ранжироваться.

WebFX SEO Checker

  • это Всеобъемлющий.
  • это Немедленно.
  • это БЕСПЛАТНО.

Как создать карту сайта в формате XML для своего веб-сайта?

При создании XML-карты сайта вы захотите включить ссылки на все страницы, которые будут сканировать поисковые роботы.

Если вы не хотите, чтобы страница сканировалась, не помещайте ее в карту сайта XML. Однако это не помешает роботу поисковой системы найти его. Вы должны включить страницы, которые вы не хотите сканировать в своих роботах.txt файл.

Прочтите в нашем блоге сообщение о robots.txt после этого видео, если хотите узнать больше.

Отличным инструментом для создания карты сайта для вашего сайта является XML-Sitemaps.com. Если на вашем сайте 500 страниц или меньше, вы можете использовать этот инструмент бесплатно.

Если вы используете систему управления контентом, такую ​​как WordPress, существуют плагины, которые создают и обновляют вашу карту сайта XML за вас.

Давайте поговорим о том, как загрузить карту сайта в формате XML.

Как отправить XML-карту сайта в Google Search Console?

Если у вас нет аккаунта Google Search Console, связанного с вашим веб-сайтом, вам нужно сначала создать его.

Как только вы это сделаете, вы найдете «Sitemap» под заголовком «Index» на левой боковой панели Google Search Console.

Щелкните «Sitemaps», и вы перейдете на страницу, где вы можете добавить URL-адрес вашей карты сайта. Вставьте URL-адрес в поле с надписью «Добавить новую карту сайта» и нажмите «Отправить».

У вас есть карта сайта загружена в Google!

Google не сразу начнет сканировать ваш сайт. Google может просканировать ваш сайт в течение нескольких дней или даже недель, но если вы просмотрите отчет о файлах Sitemap, он покажет вам, сколько URL-адресов Google нашел в вашей карте сайта и сканировал ли Google вашу карту сайта вообще.

Важно поддерживать карту сайта, время от времени обновляя, какие страницы должны или не должны там находиться. Но как только вы отправите карту сайта в Google Search Console, вы можете расслабиться и позволить сканеру Google делать всю работу! Ничего особенного, правда?

Если вам понравилось это видео, посмотрите наш плейлист для SEO, чтобы узнать все о поисковой оптимизации!

И не забудьте подписаться на наш канал на YouTube и посмотреть в блоге WebFX информативные видеоролики по широкому кругу тем цифрового маркетинга.

Увидимся позже!

sitemaps.org — Протокол

Перейти к:
Определения тегов XML
Преобразование объекта
Использование файлов индекса Sitemap
Другие форматы Sitemap
Местоположение файла Sitemap
Проверка вашего Sitemap
Расширение протокола Sitemaps
Информирование поисковых роботов

Этот документ описывает схему XML для протокола Sitemap.

Формат протокола Sitemap состоит из тегов XML. Все значения данных в файле Sitemap должны быть экранированным от сущности. Сам файл должен быть в кодировке UTF-8.

Карта сайта должна:

  • Начните с открывающего тега и заканчиваться закрывающим тегом .
  • Укажите пространство имен (стандарт протокола) в пределах тег.
  • Включите запись для каждого URL-адреса, как родительский тег XML.
  • Включите дочернюю запись для каждого родительский тег.

Все остальные теги необязательны. Поддержка этих необязательных тегов может варьироваться в зависимости от поиска. двигатели.За подробностями обращайтесь к документации каждой поисковой системы.

Кроме того, все URL-адреса в файле Sitemap должны быть с одного хоста, например www.example.com. или store.example.com. Для получения дополнительных сведений см. Файл Sitemap. расположение

Пример XML-файла Sitemap

В следующем примере показан файл Sitemap, содержащий только один URL и использующий все необязательные теги.Необязательные теги выделены курсивом.








 http://www.example.com/ 

  01.01.2005 

 ежемесячно 

 0,8  





 

Также посмотрите наш пример с несколькими URL-адресами.

Определения тегов XML

Доступные теги XML описаны ниже.

Атрибут Описание
обязательный

Инкапсулирует файл и ссылается на текущий стандарт протокола.

обязательный

Родительский тег для каждой записи URL. Остальные теги являются дочерними по отношению к этому тегу.

обязательный

URL страницы. Этот URL-адрес должен начинаться с протокола (например, http) и заканчиваться на косая черта в конце, если этого требует ваш веб-сервер.Это значение должно быть меньше 2048 символы.

необязательный

Дата последней модификации файла.Эта дата должна быть в Формат даты и времени W3C. Этот формат позволяет опускать временную часть, если желаемый и используйте ГГГГ-ММ-ДД.

Обратите внимание, что этот тег отделен от заголовка If-Modified-Since (304) сервера могут возвращаться, а поисковые системы могут использовать информацию из обоих источников по-разному.

необязательный

Как часто страница будет меняться. Это значение предоставляет общую информацию для поисковых систем и может не соответствовать точно тому, как часто они сканируют страницу.Допустимые значения:

  • всегда
  • почасово
  • ежедневно
  • еженедельно
  • ежемесячно
  • годовой
  • никогда

Значение «всегда» следует использовать для описания документов, которые меняются каждый раз, когда они доступны.Значение «никогда» следует использовать для описания заархивированных URL-адресов.

Обратите внимание, что значение этого тега считается подсказкой , а не командой. Даже если сканеры поисковых систем могут учитывать эту информацию при принятии решений, они могут сканировать страницы с пометкой «ежечасно» реже, чем это, и они могут сканировать страницы с пометкой «ежегодно» чаще, чем это.Поисковые роботы могут периодически сканировать страницы с пометкой «никогда», чтобы они могли обрабатывать неожиданные изменения на этих страницах.

<приоритет> необязательный

Приоритет этого URL-адреса по отношению к другим URL-адресам на вашем сайте.Диапазон допустимых значений от 0,0 до 1,0. Это значение не влияет на то, как ваши страницы сравниваются со страницами. на других сайтах — он позволяет только поисковым системам узнать, какие страницы вы считаете наиболее важно для сканеров.

По умолчанию приоритет страницы равен 0,5.

Обратите внимание, что приоритет, который вы назначаете странице, вряд ли повлияет на положение ваших URL-адресов на страницах результатов поисковой системы.Поисковые системы могут использовать эта информация при выборе URL-адресов на одном сайте, поэтому вы можете использовать эту тег, чтобы увеличить вероятность того, что ваши самые важные страницы будут присутствовать в поиске индекс.

Также обратите внимание, что присвоение высокого приоритета всем URL-адресам на вашем сайте вряд ли вам поможет.Поскольку приоритет относительный, он используется только для выбора между URL-адресами на вашем сайте.

Вернуться к началу

Сущность, убегающая

Файл Sitemap должен иметь кодировку UTF-8 (обычно это можно сделать при сохранении файл).Как и во всех файлах XML, любые значения данных (включая URL-адреса) должны использовать entity escape-коды для символов, перечисленных в таблице ниже.

символ Код выхода
Амперсанд & & amp;
Одиночная цитата '
Двойная кавычка » & quot;
Лучше чем > & gt;
Меньше, чем < & lt;

Кроме того, все URL-адреса (включая URL-адрес вашего Sitemap) должны иметь экранирование URL-адресов и закодированы для удобства чтения веб-сервером, на котором они расположены.Однако если вы используете любой сценарий, инструмент или файл журнала для генерации ваших URL-адресов (что угодно кроме ввода вручную), обычно это уже сделано за вас. пожалуйста, проверьте чтобы убедиться, что ваши URL-адреса соответствуют RFC-3986 стандарт для URI, RFC-3987 стандарт для IRI и стандарт XML.

Ниже приведен пример URL-адреса, в котором используется символ, отличный от ASCII ( ü ), а также символ, который требует экранирования сущности ( и ):

 http: // www.example.com/ümlat.php&q=name 

Ниже приведен тот же URL-адрес в кодировке ISO-8859-1 (для размещения на сервере, который использует этот кодировка) и экранированный URL:

 http://www.example.com/%FCmlat.php&q=name 

Ниже приведен тот же URL-адрес в кодировке UTF-8 (для размещения на сервере, который использует эту кодировку). и экранированный URL:

 http: // www.example.com/%C3%BCmlat.php&q=name 

Ниже тот же URL, но также экранированный объект:

 http://www.example.com/%C3%BCmlat.php&q=name 

Пример XML-файла Sitemap

В следующем примере показан файл Sitemap в формате XML. Карта сайта в примере содержит небольшое количество URL-адресов, каждый из которых использует свой набор дополнительных параметров.








 http://www.example.com/ 

 1 января 2005 г. 

 ежемесячно 

 0,8 





 http: // www.example.com/catalog?item=12&desc=vacation_hawaii 

 еженедельно 





 http://www.example.com/catalog?item=73&desc=vacation_new_zealand 

 23 декабря 2004 г. 

 еженедельно 





 http: // www.example.com/catalog?item=74&desc=vacation_newfoundland 

 2004-12-23T18: 00: 15 + 00: 00 

 0,3 





 http://www.example.com/catalog?item=83&desc=vacation_usa 

 23 ноября 2004 г. 





 

Вернуться к началу

Использование файлов индекса Sitemap (для группировки нескольких файлов Sitemap файлы)

Вы можете предоставить несколько файлов Sitemap, но каждый предоставленный файл Sitemap должен иметь не более 50 000 URL-адресов и не должен превышать 50 МБ (52 428 800 байт).При желании вы можете сжать файлы Sitemap с помощью gzip, чтобы уменьшить требования к пропускной способности; однако несжатый файл карты сайта не должен быть больше чем 50 МБ. Если вы хотите указать более 50 000 URL-адресов, необходимо создать несколько файлов Sitemap. файлы.

Если вы предоставляете несколько файлов Sitemap, вам следует затем перечислить каждый файл Sitemap в Файл индекса Sitemap.Файлы индекса Sitemap не могут содержать более 50 000 файлов Sitemap и не должен превышать 50 МБ (52 428 800 байт) и может быть сжат. Вы можете иметь более одного файла индекса Sitemap. XML-формат файла индекса Sitemap очень аналогичен формату XML файла Sitemap.

Файл индекса Sitemap должен:

  • Начните с открытия тег и заканчиваться закрывающим тегом .
  • Включить запись для каждого файла Sitemap в качестве родительского тега XML.
  • Включить дочернюю запись для каждый родительский тег .

Необязательный тег также доступен для файлов индекса Sitemap.

Примечание. Файл индекса Sitemap может указывать только найденные файлы Sitemap. на том же сайте, что и файл индекса Sitemap. Например, http://www.yoursite.com/sitemap_index.xml могут включать файлы Sitemap на http://www.yoursite.com, но не на http://www.example.com или http://yourhost.yoursite.com. Как и в случае с файлами Sitemap, ваш файл индекса Sitemap должен быть в кодировке UTF-8.

Образец XML-файла Sitemap Индекс

В следующем примере показан индекс Sitemap, в котором перечислены два файла Sitemap:






<карта сайта>

 http://www.example.com/sitemap1.xml.gz 

 2004-10-01T18: 23: 17 + 00: 00 



<карта сайта>

 http: // www.example.com/sitemap2.xml.gz 

 1 января 2005 г. 





 

Примечание. URL-адреса файлов Sitemap , как и все значения в ваших файлах XML, должны быть сущность сбежала.

Карта сайта Индексировать определения тегов XML

Атрибут Описание
обязательный Инкапсулирует информацию обо всех файлах Sitemap в файле.
<карта сайта> обязательный Инкапсулирует информацию об отдельном файле Sitemap.
обязательный

Определяет расположение файла Sitemap.

Это может быть карта сайта, файл Atom, файл RSS или простой текстовый файл.

необязательный

Определяет время изменения соответствующего файла Sitemap.Это не соответствуют времени изменения любой из страниц, перечисленных в этом файле Sitemap. Значение тега lastmod должно быть в Формат даты и времени W3C.

Предоставляя метку времени последнего изменения, вы включаете сканеры поисковых систем. для получения только части файлов Sitemap в индексе i.е. сканер может только получить Файлы Sitemap, которые были изменены с определенной даты. Эта инкрементальная загрузка файла Sitemap Механизм позволяет быстро обнаруживать новые URL-адреса на очень больших сайтах.

Вернуться к началу

Другие форматы файлов Sitemap

Протокол Sitemap позволяет вам предоставлять подробную информацию о ваших страницах поисковым системам, и мы поощряем его использование, так как вы можете предоставить дополнительную информацию о сайте страницы за пределами URL-адресов.Однако, помимо протокола XML, мы поддерживаем RSS-каналы и текстовые файлы, которые предоставляют более ограниченную информацию.

Канал синдикации

Вы можете предоставить канал RSS (Real Simple Syndication) 2.0 или Atom 0.3 или 1.0. В общем-то, вы можете использовать этот формат, только если на вашем сайте уже есть канал распространения. Запись что этот метод может не сообщать поисковым системам обо всех URL-адресах на вашем сайте, поскольку фид может предоставлять информацию только о недавних URL-адресах, хотя поисковые системы все еще может использовать эту информацию, чтобы узнавать о других страницах вашего сайта во время их обычные процессы сканирования путем перехода по ссылкам на страницах фида.Сделать убедитесь, что канал находится в каталоге самого высокого уровня, который вы хотите поисковыми системами ползти. Поисковые системы извлекают информацию из фида следующим образом:

  • <ссылка> поле — указывает URL
  • поле даты изменения (поле для RSS-каналов и дата для каналов Atom) — указывает, когда каждый URL был последний раз изменен.Использование поле даты изменения не является обязательным.

Текстовый файл

Вы можете предоставить простой текстовый файл, содержащий по одному URL в каждой строке. Текстовый файл должен следовать этим правилам:

  • Текстовый файл должен иметь по одному URL в строке. URL-адреса не могут содержать встроенные новые строки.
  • Необходимо полностью указать URL-адреса, включая http.
  • Каждый текстовый файл может содержать не более 50 000 URL-адресов и не должен превышать 50 МБ. (52 428 800 байт). Если на вашем сайте более 50 000 URL-адресов, вы можете разделить список в несколько текстовых файлов и добавлять каждый отдельно.
  • Текстовый файл должен использовать кодировку UTF-8. Вы можете указать это при сохранении файла (например, в Блокноте это указано в меню Кодировка диалогового окна Сохранить как коробка).
  • Текстовый файл не должен содержать никакой информации, кроме списка URL-адресов.
  • Текстовый файл не должен содержать информации верхнего или нижнего колонтитула.
  • При желании вы можете сжать текстовый файл Sitemap с помощью gzip, чтобы уменьшить ваши требования к пропускной способности.
  • Вы можете назвать текстовый файл как хотите. Убедитесь, что ваш URL-адреса соответствуют стандарту RFC-3986 для URI — стандарт RFC-3987 для IRI
  • Вы должны загрузить текстовый файл в каталог самого высокого уровня, который вам нужен для поисковых систем. для сканирования и убедитесь, что вы не перечисляете URL-адреса в текстовом файле, которые находятся в каталоге более высокого уровня.

Ниже показаны образцы текстовых файлов.

 http://www.example.com/catalog?item=1

 
http://www.example.com/catalog?item=11

Вернуться к началу

Расположение файла Sitemap

Расположение файла Sitemap определяет набор URL-адресов, которые можно включить в этот файл Sitemap.Файл Sitemap, расположенный по адресу http://example.com/catalog/sitemap.xml, может включать любые URL-адреса, начинающиеся с http://example.com/catalog/, но не могут включать URL-адреса начиная с http://example.com/images/.

Если у вас есть разрешение на изменение http://example.org/path/sitemap.xml, это предполагается, что у вас также есть разрешение на предоставление информации для URL-адресов с префиксом http: // пример.org / путь /. Примеры URL-адресов, считающихся действительными в http://example.com/catalog/sitemap.xml включают:


http://example.com/catalog/show?item=23

http://example.com/catalog/show?item=233&user=3453

 

URL-адреса, не считающиеся действительными в http://example.com/catalog/sitemap.xml, включают:


http://example.com/image/show?item=23

http: // пример.ru / image / show? item = 233 & user = 3453

https://example.com/catalog/page1.php

 

Обратите внимание: это означает, что все URL-адреса, перечисленные в файле Sitemap, должны использовать один и тот же протокол. (http, в этом примере) и находятся на том же хосте, что и Sitemap. Например, если файл Sitemap находится по адресу http://www.example.com/sitemap.xml, он не может включать URL-адреса из поддомена http: //.example.com.

URL-адреса, которые не считаются действительными, исключаются из дальнейшего рассмотрения. это настоятельно рекомендуется разместить файл Sitemap в корневом каталоге вашего веб-сайта. сервер. Например, если ваш веб-сервер находится по адресу example.com, то ваш индекс Sitemap файл будет по адресу http://example.com/sitemap.xml. В некоторых случаях вам может понадобиться для создания разных файлов Sitemap для разных путей (например,g., если разрешения безопасности в вашей организации разделите доступ на запись в разные каталоги).

Если вы отправляете Sitemap, используя путь с номером порта, вы должны указать этот порт. число как часть пути в каждом URL-адресе, указанном в файле Sitemap. Например, если ваш файл Sitemap находится по адресу http://www.example.com:100/sitemap.xml, то каждый URL, указанный в Sitemap, должен начинаться с http: // www.example.com:100.

Файлы Sitemap и Cross Подает

Чтобы отправить файлы Sitemap для нескольких хостов с одного хоста, вам необходимо «подтвердить» право собственности. хоста (ов), URL-адреса которых отправляются в Sitemap. Вот пример. Допустим, вы хотите отправить файлы Sitemap для 3 хостов:


www.host1.com с файлом Sitemap sitemap-host1.xml

www.host2.com с файлом Sitemap sitemap-host2.xml

www.host3.com с файлом Sitemap sitemap-host3.xml

 

Более того, вы хотите разместить все три файла Sitemap на одном хосте: www.sitemaphost.com. Таким образом, URL-адреса файлов Sitemap будут:


http://www.sitemaphost.com/sitemap-host1.xml

http: // www.sitemaphost.com/sitemap-host2.xml

http://www.sitemaphost.com/sitemap-host3.xml

 

По умолчанию это приведет к ошибке «перекрестной отправки», поскольку вы пытаетесь для отправки URL-адресов для www.host1.com через карту сайта, размещенную на www.sitemaphost.com (и то же самое для двух других хостов). Один из способов избежать ошибки — доказать, что вы владеете (т.е. имеют право изменять файлы) www.host1.com. Ты можешь это сделать изменив файл robots.txt на www.host1.com так, чтобы он указывал на Sitemap на www.sitemaphost.com.

В этом примере файл robots.txt на http://www.host1.com/robots.txt будет содержать строка «Карта сайта: http://www.sitemaphost.com/sitemap-host1.xml». Изменяя Файл robots.txt на www.host1.com и указав на файл Sitemap на www.sitemaphost.com, вы неявно доказали, что являетесь владельцем www.host1.com. Другими словами, тот, кто контролирует файл robots.txt на www.host1.com доверяет карте сайта http://www.sitemaphost.com/sitemap-host1.xml содержать URL-адреса для www.host1.com. Тот же процесс можно повторить для другого два хозяина.

Теперь вы можете отправить файлы Sitemap на сайте www.sitemaphost.com.

Когда файл robots.txt определенного хоста, скажем http://www.host1.com/robots.txt, указывает в файл Sitemap или индекс Sitemap на другом хосте; ожидается, что для каждого из целевые файлы Sitemap, например http://www.sitemaphost.com/sitemap-host1.xml, все URL-адреса принадлежат хосту, указывающему на него. Это потому, что, как отмечалось ранее, файл Sitemap ожидается, что URL-адреса будут поступать только с одного хоста.

Вернуться к началу

Проверка файла Sitemap

Следующие XML-схемы определяют элементы и атрибуты, которые могут появляться в ваш файл Sitemap. Вы можете скачать эту схему по ссылкам ниже:

Для файлов Sitemap: http: // www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd
Для файлов индекса Sitemap: http://www.sitemaps.org/schemas/sitemap/0.9/siteindex.xsd

Существует ряд инструментов, которые помогут вам проверить структуру вашего Карта сайта на основе этой схемы. Вы можете найти список инструментов, связанных с XML, на каждом из по следующим адресам:

http: // www.w3.org/XML/Schema#Tools
http://www.xml.com/pub/a/2000/12/13/schematools.html

Чтобы проверить ваш Sitemap или файл индекса Sitemap на соответствие схеме, XML файлу потребуются дополнительные заголовки, как показано ниже.

Карта сайта:








...





 

Индексный файл Sitemap:






<карта сайта>

...





 

Вернуться к началу

Расширение протокола Sitemaps

Вы можете расширить протокол Sitemap, используя собственное пространство имен.Просто укажите это пространство имен в корневом элементе. Например:




 



<пример: example_tag>

...



...



 

Вернуться к началу

Информирование поисковых роботов

После того, как вы создали файл Sitemap и разместили его на своем веб-сервере, вам потребуется для информирования поисковых систем, поддерживающих этот протокол, о своем местонахождении.Вы можете сделать это:

Затем поисковые системы могут получить ваш Sitemap и сделать URL-адреса доступными для их краулеры.

Отправка файла Sitemap через поиск интерфейс подчинения двигателя

Чтобы отправить файл Sitemap непосредственно в поисковую систему, которая позволит вам получать информацию о статусе и любых ошибках обработки см. в документации каждой поисковой системы.

Указание местоположения Sitemap в ваш файл robots.txt

Вы можете указать местоположение файла Sitemap с помощью файла robots.txt. Сделать это, просто добавьте следующую строку, включая полный URL-адрес в карту сайта:

 Карта сайта: http://www.example.com/sitemap.xml 

Эта директива не зависит от строки пользовательского агента, поэтому не имеет значения, где вы помещаете его в свой файл.Если у вас есть файл индекса Sitemap, вы можете включить расположение только этого файла. Вам не нужно перечислять каждый отдельный файл Sitemap в списке. в индексном файле.

Вы можете указать несколько файлов Sitemap для каждого файла robots.txt.

 Sitemap: http://www.example.com/sitemap-host1.xml

Карта сайта: http://www.example.com/sitemap-host2.xml 

Отправка файла Sitemap с помощью HTTP-запроса

Чтобы отправить файл Sitemap с помощью HTTP-запроса (замените на URL-адрес, предоставленный поисковой системой), отправьте запрос по следующему URL-адресу:

  / ping? Sitemap = sitemap_url 

Например, если ваш файл Sitemap находится по адресу http: // www.example.com/sitemap.gz, ваш URL станет:

  /ping?sitemap=http://www.example.com/sitemap.gz 

URL кодирует все после / ping? Sitemap =:

  /ping?sitemap=http%3A%2F%2Fwww.yoursite.com%2Fsitemap.gz 

Вы можете отправить HTTP-запрос с помощью wget, curl или другого механизма по вашему выбору.Успешный запрос вернет код ответа HTTP 200; если вы получите другой ответ, вы должны повторно отправить свой запрос. Код ответа HTTP 200 указывает только что поисковая система получила ваш файл Sitemap, а не сам файл Sitemap или URL-адреса, содержащиеся в нем, были действительными. Самый простой способ сделать это — настроить автоматизированный работа по созданию и отправке файлов Sitemap на регулярной основе.
Примечание. Если вы предоставляете файл индекса Sitemap, вам нужно только выдать один HTTP-запрос, который включает расположение файла индекса Sitemap; вам не нужно отправлять отдельные запросы для каждого файла Sitemap, указанного в индексе.

Вернуться к началу

Без содержания

Протокол Sitemap позволяет сообщать поисковым системам, какой контент вы бы вроде проиндексировано.Чтобы указать поисковым системам контент, который вы не хотите индексировать, используйте файл robots.txt. файл или метатег robots. См. Robotstxt.org для получения дополнительной информации о том, как исключить контент из поисковых систем.

Вернуться к началу

Последнее обновление: 21 ноября 2016 г.

карт сайта.org — FAQ

Как представить URL-адреса в файле Sitemap?

Имеет ли значение, какой метод кодировки символов я использую? для создания моих файлов Sitemap?

Как указать время?

Как вычислить дату последнего изменения?

Где мне разместить свой Sitemap?

Насколько большим может быть мой файл Sitemap?

На моем сайте десятки миллионов URL-адресов; могу я как-нибудь отправлять только те, которые недавно изменились?

Что мне делать после создания файла Sitemap?

Нужно ли полностью указывать URL-адреса в файле Sitemap?

На моем сайте есть как http, так и https версии URL.Делать Мне нужно перечислить оба?

URL-адреса на моем сайте содержат идентификаторы сеанса. Мне нужно удалить их?

Влияет ли положение URL-адреса в файле Sitemap на его использование?

На некоторых страницах моего сайта используются фреймы. Должен ли я включить URL-адреса набора фреймов или URL-адреса содержимого фрейма?

Могу ли я заархивировать свои файлы Sitemap или их нужно архивировать?

Изменится ли подсказка «приоритет» в XML Sitemap рейтинг моих страниц в результатах поиска?

Есть ли схема XML, по которой я могу проверить свой XML-файл Sitemap? против?

Что делать, если у меня есть еще один вопрос об использовании протокола или отправке файл Sitemap?


В: Как представить URL-адреса в Sitemap?

Как и во всех файлах XML, любые значения данных (включая URL-адреса) должны использовать управляющие коды сущностей для следующих символов: амперсанд (&), одиночный цитата (‘), двойная кавычка («), меньше (<) и больше (>).Вам следует также убедитесь, что все URL-адреса следуют RFC-3986 стандарт для URI, RFC-3987 стандарт для IRI и стандарт XML. Если вы используете скрипт для генерации ваших URL-адресов, вы обычно можете экранировать URL-адреса как часть этого сценария. Вам все равно нужно будет сбежать от них. Например, следующий объект скрипта Python экранирует http: // www.example.com/view?widget=3&count>2

$ питон
Python 2.2.2 (# 1, 24 февраля 2003 г., 19:13:11)
>>> импортировать xml.sax.saxutils
>>> xml.sax.saxutils.escape ("http://www.example.com/view?widget=3&count>2")
 

Результирующий URL-адрес из приведенного выше примера:

http://www.example.com/view?widget=3&count>2
 

В: Имеет ли значение, какой метод кодировки символов, который я использую для создания файлов Sitemap?

Да.Файлы Sitemap должны использовать кодировку UTF-8.

В: Как указать время?

Используйте кодировку W3C Datetime для отметки времени lastmod и все другие даты и время в этом протоколе. Например, 2004-09-22T14: 12: 14 + 00: 00.

Эта кодировка позволяет опустить временную часть формата ISO8601; например, 2004-09-22 также действительно.Однако, если ваш сайт часто меняется, вам рекомендуется включить временной отрезок, чтобы сканеры имели более полную информацию о вашем сайт.

Q: Как мне вычислить дата последней модификации?

Для статических файлов это фактическая дата обновления файла. Вы можете использовать дату UNIX команда, чтобы получить эту дату:

$ date --iso-8601 = секунды -u -r / home / foo / www / bar.php
>> 2004-10-26T08: 56: 39 + 00: 00
 

Для многих динамических URL-адресов вы можете легко вычислить дату последней модификации на основе когда базовые данные были изменены или с помощью некоторого приближения на основе периодических обновления (если применимо). Использование даже приблизительной даты или отметки времени может помочь сканерам избегайте сканирования URL-адресов, которые не изменились. Это уменьшит пропускную способность и процессор. требования к вашим веб-серверам.

Q: Где мне разместить мой Sitemap?

Настоятельно рекомендуется разместить файл Sitemap в корневом каталоге ваш HTML-сервер; то есть разместите его по адресу http://example.com/sitemap.xml.

В некоторых ситуациях может потребоваться создать разные файлы Sitemap для разных путей. на вашем сайте — эл.g., если разрешения безопасности в вашей организации разделены доступ на запись в разные каталоги.

Мы предполагаем, что если у вас есть разрешение на загрузку http://example.com/path/sitemap.xml, у вас также есть разрешение на отправку метаданных по адресу http://example.com/path/.

Все URL-адреса, перечисленные в Sitemap, должны находиться на том же хосте, что и Sitemap.За например, если файл Sitemap находится по адресу http://www.example.com/sitemap.xml, он не может включить URL-адреса из http://subdomain.example.com. Если файл Sitemap находится по адресу http://www.example.com/myfolder/sitemap.xml, он не может включать URL-адреса с http://www.example.com.

Вернуться к началу

В: Насколько большим может быть мой файл Sitemap?

Файлы Sitemap не должны превышать 50 МБ (52 428 800 байт) и могут содержать максимум 50 000 URL.Эти ограничения помогают гарантировать, что ваш веб-сервер не увязнет. обслуживание очень больших файлов. Это означает, что если на вашем сайте более 50 000 URL-адреса или ваш файл Sitemap больше 50 МБ, необходимо создать несколько файлов Sitemap. и используйте файл индекса Sitemap. Вы должны использовать Файл индекса Sitemap, даже если у вас небольшой сайт, но вы планируете вырасти за пределы 50 000 URL-адреса или размер файла 50 МБ.Файл индекса Sitemap может включать до 50 000 файлов Sitemap. и не должен превышать 50 МБ (52 428 800 байт). Вы также можете использовать gzip для сжатия вашего Карты сайта.

В: На моем сайте десятки миллионов URL-адресов; можно как-то отправить только те, которые недавно изменились?

Вы можете перечислить URL-адреса, которые часто меняются в небольшом количестве файлов Sitemap, а затем используйте тег lastmod в вашем Файл индекса Sitemap для идентификации этих файлов Sitemap.Тогда поисковые системы могут постепенно сканировать только измененные файлы Sitemap.

В: Что мне делать после Я создаю свой Sitemap?

После того, как вы создали свой Sitemap, пусть поисковые системы узнают об этом, отправив запрос напрямую им, их или добавив расположение файла Sitemap в файл robots.txt.

В. Нужны ли URL-адреса в файле Sitemap быть полностью уточненным?

Да. Вам необходимо включить протокол (например, http) в свой URL. Вы тоже необходимо включить в URL завершающую косую черту, если она требуется вашему веб-серверу. За Например, http://www.example.com/ — действительный URL-адрес для файла Sitemap, а www.example.com не является.

В: На моем сайте есть оба «http» и https-версии URL-адресов. Мне нужно перечислить оба?

Нет. Укажите только одну версию URL в своих файлах Sitemap. Включая несколько версий URL-адресов может привести к неполному сканированию вашего сайта.

В: URL-адреса на моем сайте имеют сеанс ID в них.Мне нужно их удалить?

Да. Включение идентификаторов сеансов в URL-адреса может привести к неполному и избыточному сканированию. вашего сайта.

В: Позиция URL в файл Sitemap влияет на его использование?

Нет. Положение URL в файле Sitemap вряд ли повлияет на его использование. или рассматривается поисковыми системами.

В: Некоторые страницы моего сайта используют фреймы. Должен ли я включать URL-адреса набора фреймов или URL-адреса содержимого фрейма?

Пожалуйста, включите оба URL.

В. Могу ли я заархивировать свои файлы Sitemap или сделать они должны быть сжаты?

Используйте gzip для сжатия файлов Sitemap.Помните, что ваш файл Sitemap не должен быть больше чем 50 МБ (52 428 800 байт), в сжатом или нет.

Q: Будет подсказка «приоритет» в XML Sitemap меняет рейтинг моих страниц в поиске полученные результаты?

Подсказка «приоритет» в вашем файле Sitemap указывает только на важность определенного URL-адрес относительно других URL-адресов на вашем собственном сайте и не оказывает никакого влияния о рейтинге ваших страниц в результатах поиска.

Q: Есть ли XML-схема, Я могу проверить свой XML-файл Sitemap на соответствие?

Да. Схема XML доступна для файлов Sitemap по адресу http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd и схему для Файлы индекса Sitemap доступны по адресу http://www.sitemaps.org/schemas/sitemap/0.9 / siteindex.xsd. Вы также можете узнайте больше о проверке вашего Sitemap.

В: Что делать, если у меня есть еще один вопрос об использовании протокол или отправка файла Sitemap?

См. Документацию, доступную для каждой поисковой системы, для получения более подробной информации о представлении. и использование файлов Sitemap.

Вернуться к началу

Последнее обновление: 21 ноября 2016 г.

О файлах Sitemap — Создание файлов Sitemap для Google, Bing и других поисковых систем — The Easy Way

Если вы владеете или поддерживаете веб-сайт или собираетесь владеть им, было бы здорово, если бы у вас были частые посетители, которые находят удовлетворение в получении именно информация, которая им нужна с вашей страницы?

Еще в 2005 году поисковая система Google запустила Sitemap 0.84 Протокол, предназначенный для использования формата XML.

Карта сайта — это способ организации веб-сайта с указанием URL-адресов и данных в каждом разделе. Раньше карты сайта были в первую очередь ориентированы на пользователей веб-сайта. Однако формат XML Google был разработан для поисковых систем, что позволяет им находить данные быстрее и эффективнее.

Новый протокол карты сайта Google был разработан в ответ на увеличение размера и сложности веб-сайтов. Деловые сайты часто содержат в своих каталогах сотни товаров; в то время как популярность блогов привела к тому, что веб-мастера обновляли свои материалы не реже одного раза в день, не говоря уже о популярных инструментах создания сообщества, таких как форумы и доски объявлений.По мере того, как веб-сайты становились все больше и больше, поисковым системам было трудно отслеживать весь этот материал, иногда «пропуская» информацию, когда она просматривала эти быстро меняющиеся страницы.

Благодаря протоколу XML поисковые системы могут более эффективно отслеживать URL-адреса, оптимизация поиска за счет размещения всей информации на одной странице. XML также суммирует, как часто обновляется конкретный веб-сайт, и записывает время последнего внесения каких-либо изменений.

XML-карты сайта не были, как некоторые думали, инструментом для поисковой оптимизации.Это не влияет на рейтинг, но позволяет поисковым системам делать более точные рейтинги и поиск. Он делает это, предоставляя данные, которые нужны поисковой системе, и помещает их в одно место, что весьма удобно, учитывая, что существуют миллионы веб-сайтов, которые нужно просмотреть.

Чтобы побудить другие поисковые системы принять протокол XML, Google опубликовал его под лицензией Attribution / Share Alike Creative Commons. Его усилия окупились. Недавно Google с радостью объявил, что Yahoo и Microsoft согласились «официально поддерживать» протокол XML, который теперь обновлен до Sitemap 0.9 и совместно спонсируемый www.sitemaps.org, сайт, объясняющий работу протокола. Это хорошая новость для владельцев сайтов и похвальный знак сотрудничества между известными конкурентами.

Совместное распознавание протокола XML означает, что разработчикам веб-сайтов больше не нужно создавать разные типы карт сайта для разных поисковых систем. Они могут создать один файл для отправки, а затем обновить его, когда они внесли изменения на сайт. Это упрощает весь процесс настройки и расширения веб-сайта.

Благодаря этому формату XML вскоре станет стандартным элементом создания и разработки всех веб-сайтов. Сами веб-мастера начали видеть преимущества, которые предоставляет этот файл. Поисковые системы ранжируют страницу в соответствии с релевантностью ее содержания определенным ключевым словам, но до формата XML были случаи, когда этот контент не воспринимался должным образом. Веб-мастера часто разочаровывались, когда осознавали, что их усилия по созданию веб-сайта остаются незамеченными.На создание блогов, дополнительных страниц или даже добавление мультимедийных файлов уходили часы. Благодаря XML-файлу эти часы не будут потрачены зря, и их увидят три ведущие поисковые системы — Google, Microsoft и Yahoo.

Недавно компания Ask.com начала поддерживать карты сайта в формате XML, а в обновлении протокола карт сайта появилась возможность сообщать всем поисковым системам местоположение вашей карты сайта в формате XML, поместив запись в файл robots.txt.

Карта сайта: http: // www.mysite.com/sitemap.xml

Чтобы создать карту сайта в формате xml и информировать поисковые системы об изменениях на вашем сайте, попробуйте наш бесплатный онлайн-генератор карты сайта. В дополнение к XML-карте сайта наш бесплатный генератор карты сайта также создаст карту сайта в формате HTML, которую вы можете использовать для посетителей-людей.

XML-Sitemaps.com 18/04/07

Пример XML-карты сайта, созданной для нашего сайта: sitemap.xml (обновляется ежедневно)

.