sitemap.xml
von Valentyn Budkin
1. Использовать Sitemap index file для списка всех sitemap
1.1. https://support.google.com/webmasters/answer/75712?visit_id=1-636173227763622113-75395804&rd=1
2. Подходы к наименованиям, когда есть несколько сайтмэпов Вариант 1: sitemap.social.audits.xml, sitemap.seo.audits.xml, и т.д. Вариант 2: sitemap.products.xml, sitemap.catetegories.xml, и т.п.
3. Для быстрой индексации
3.1. Есть смысл делать rss.xml с последними товарами, блогпостами, промоакциями и скармливать его Google. От туда урлы для индексации будут браться в первую очередь.
3.2. application/rss должен где-то присутствовать
3.3. Таких фидов должен быть минимум
3.4. Можно пинговать гугл о том что появился новый sitemap - http://stackoverflow.com/questions/1332601/pinging-google-sitemap-after-every-new-article-submission http://google.com/ping?sitemap=http://www.example.com/my_sitemap.xml
4. Источники
4.1. https://www.greenlaneseo.com/blog/how-to-create-the-perfect-xml-sitemap/
4.2. Формат - https://www.sitemaps.org/protocol.html
4.3. https://habrahabr.ru/post/274557/
4.4. http://seocheck.io/sitemap-101/
4.5. https://support.google.com/webmasters/answer/183668?hl=en
5. Размер файла не больше 10МБ
5.1. В хелпе Google написано
6. Количество ссылок не больше 50000 на sitemap
7. Нельзя включать в sitemap - noindex
8. Только http 200 OK
9. Только страницы не заблокированные в robots.txt
10. Только Canonical
11. Только страницы относящиеся к этому домену
11.1. Для поддоменов - отдельные сайтмэпы
11.2. Для языков - отдельные сайтмэпы
12. В идеале sitemap повторяет то, что гуглу надо проиндексировать.
13. В sitemap не должно быть дубликатов url