サイトマップとは、 Web サイトのページ一覧を XML 形式で記述したファイルです。検索エンジンのクローラーにサイト構造を効率的に伝え、クロールとインデックスの精度を向上させます。 example.com/sitemap.xml の URL で配置するのが一般的です。
サイトマップの XML には、各ページの URL (<loc>) 、最終更新日 (<lastmod>) 、更新頻度 (<changefreq>) 、優先度 (<priority>) を記述できます。ただし、 Google は <changefreq> と <priority> を無視すると公式に述べており、実質的に重要なのは <loc> と <lastmod> のみです。
サイトマップが特に重要なケースは、大規模サイト (数千ページ以上) 、新しいサイト (外部リンクが少なくクローラーが発見しにくい) 、内部リンク構造が不十分なサイト、 JavaScript で動的に生成されるページが多いサイトです。小規模なサイトでも、サイトマップを設置しておくことで Google Search Console でインデックス状況を監視しやすくなります。
サイトマップのサイズ制限は、 1 ファイルあたり最大 50,000 URL または 50MB (非圧縮) です。これを超える場合は、サイトマップインデックスファイルを使って複数のサイトマップを束ねます。多言語サイトでは、サイトマップ内に hreflang 情報を記述することで、各言語版ページの関係性を検索エンジンに効率的に伝えられます。関連書籍は Amazon でも探せます。