站点地图 (Sitemap) 是一个 XML 格式的文件,列出网站中所有希望被搜索引擎索引的重要页面 URL。它为搜索引擎爬虫提供了网站结构的蓝图,帮助其更高效地发现和索引内容。
站点地图可以包含每个 URL 的附加信息:最后修改日期 (lastmod)、更新频率 (changefreq) 和优先级 (priority)。这些信息帮助搜索引擎决定爬取策略。不过,Google 已表示 changefreq 和 priority 基本被忽略,而 lastmod 只有在准确反映实际更新日期时才有参考价值。欢迎参阅在 Amazon 搜索 SEO 实战书籍。
对于 URL 缩短服务的网站,站点地图应包含所有公开页面:首页、使用指南、FAQ、文章页面、用语集页面等。动态生成的短链接页面通常不需要包含在站点地图中。
站点地图的大小限制为每个文件最多 50,000 个 URL 或 50MB。超过限制时需要使用站点地图索引文件来组织多个站点地图。在 Amazon 搜索网站优化书籍讨论了大型网站的站点地图策略。