サイトマップ / XML Sitemap
要約
Webサイト内のページ一覧をXML形式で記述したファイル。検索エンジンのクローラーに対してサイト構造を伝え、新規・更新ページの発見を促進する。大規模サイトではサイトマップインデックスの活用が推奨される
サイトマップ(XML Sitemap)とは、Web サイト内のページ一覧を XML 形式で記述したファイルです。検索エンジンのクローラーに対してサイト構造を伝え、新規ページや更新されたページの発見を促進する役割を持ちます。通常はドメインのルートディレクトリに sitemap.xml として配置し、Google Search Console に提出します。
サイトマップは、内部リンクだけではカバーしきれない URL の発見を補完するための仕組みです。特に新規サイト、大規模サイト、コンテンツを頻繁に更新するメディアサイトでは、サイトマップがないとインデックスまでの時間が大幅に遅延する可能性があります。
サイトマップが特に効果的なケース
すべてのサイトでサイトマップが必須というわけではありません。Google 公式ドキュメントでも、小規模で内部リンクが適切に設定されたサイトでは、サイトマップなしでも Googlebot がページを発見できるとされています。
以下のようなケースでは、サイトマップの設置が特に効果を発揮します。
| ケース | 理由 | 効果 |
|---|---|---|
| 新規サイト | 外部リンクが少なく URL が発見されにくい | クロール開始の加速 |
| 50 万ページ以上の大規模サイト | 内部リンクだけでは全 URL をカバーしきれない | クロールバジェットの効率化 |
| コンテンツを頻繁に更新するサイト | 更新ページの早期再クロールが必要 | lastmod による更新通知 |
| 孤立ページが多いサイト | 内部リンクが不足しているページがある | URL の発見漏れ防止 |
| リッチメディアを多用するサイト | 画像や動画が検索対象になる | 画像・動画サイトマップによる発見促進 |
サイトマップの主要な構成要素
XML サイトマップで使用できるタグとその役割を整理します。
| タグ | 必須/任意 | 役割 | 注意点 |
|---|---|---|---|
| loc | 必須 | ページの URL を指定 | 正規 URL のみを記載する |
| lastmod | 任意(推奨) | ページの最終更新日 | 実際の更新日のみ記載。不正確だと無視される |
| changefreq | 任意 | 更新頻度の目安 | Google はこの値を参考程度にしか扱わない |
| priority | 任意 | ページの相対的な優先度 | Google はこの値をほとんど無視する |
実務上重要なのは loc と lastmod の 2 つです。changefreq と priority は Google がほとんど参照しないため、設定の手間に対して効果は限定的です。
lastmod は Google がクロールの優先順位を判断する重要な手がかりです。ただし、コンテンツの変更がないのに lastmod を毎日更新すると、Google は lastmod の信頼性が低いと判断し、この値を無視するようになります。lastmod には実際にコンテンツを更新した日付のみを記載します。
サイトマップの種類
用途に応じて複数の種類のサイトマップを使い分けることができます。
| 種類 | 対象コンテンツ | 主な用途 |
|---|---|---|
| 通常のサイトマップ | Web ページの URL | すべてのサイトで使用 |
| 画像サイトマップ | 画像 URL | 画像検索からのトラフィック獲得 |
| 動画サイトマップ | 動画コンテンツ | 動画検索での表示促進 |
| ニュースサイトマップ | ニュース記事 | Google News への掲載 |
| サイトマップインデックス | サイトマップファイルの一覧 | 50,000 URL を超える大規模サイト |
サイトマップインデックスは、複数のサイトマップファイルをまとめる「目次」の役割を果たします。大規模サイトでは、コンテンツの種類(商品ページ、ブログ記事、カテゴリページ等)ごとにサイトマップを分割し、サイトマップインデックスで管理するのが標準的なアプローチです。
サイトマップ最適化のベストプラクティス
サイトマップの効果を最大化するための具体的な手順を、優先度の高いものから整理します。
インデックス対象の URL のみを含める
サイトマップには、実際にインデックスさせたい URL のみを記載します。noindex を設定しているページ、robots.txt でブロックしているページ、リダイレクト元の URL、404 エラーのページはサイトマップから除外します。サイトマップの URL と noindex 設定が矛盾していると、Google に混乱したシグナルを送ることになります。
Search Console に提出する
サイトマップを作成したら Google Search Console に提出します。robots.txt にもサイトマップの URL を記載しておくことで、Search Console 以外のクローラーにもサイトマップの存在を伝えられます。
動的生成を導入する
コンテンツを頻繁に更新するサイトでは、CMS やフレームワークの機能を使ってサイトマップを自動生成する仕組みを導入します。手動管理では更新漏れが発生しやすく、lastmod の正確性も維持できません。Next.js では generateSitemaps 関数でビルド時に自動生成できます。
ファイルサイズの制限を守る
1 ファイルあたり 50,000 URL 以内、非圧縮時のファイルサイズは 50MB 以内に収めます。これを超える場合はサイトマップインデックスで分割します。gzip 圧縮を使用するとファイルサイズを大幅に削減できます。
サイトマップに記載した URL 数と、Search Console の「ページのインデックス登録」レポートに表示されるインデックス済みページ数を定期的に比較します。大きな乖離がある場合は、インデックスに問題が発生している可能性があります。
サイトマップでよくある間違い
サイトマップの運用で見落としやすいポイントを整理します。
| よくある間違い | 問題 | 正しい対応 |
|---|---|---|
| noindex ページをサイトマップに含める | 矛盾するシグナル | noindex ページは除外する |
| リダイレクト URL を含める | 最終 URL が正しく伝わらない | リダイレクト先の最終 URL のみ記載 |
| lastmod を毎日一括更新 | Google が lastmod を無視するようになる | 実際の更新日のみ記載 |
| サイトマップを提出しない | URL 発見の遅延 | Search Console で提出 |
| 古いサイトマップを放置 | 存在しない URL がクロール対象になる | 定期的にサイトマップを更新 |
サイトマップと IndexNow
2026 年現在、サイトマップに加えて IndexNow プロトコルを併用するサイトが増えています。サイトマップが Google のクロールスケジュールに依存するのに対し、IndexNow はコンテンツの追加・更新を検索エンジンに即座に通知できます。
IndexNow は Bing、Yandex、Naver 等が対応していますが、Google は未対応です。Google に対しては引き続きサイトマップと Search Console の URL 検査ツールが主要な手段です。Googlebot のクロールの仕組みを解説した記事では、IndexNow とGooglebot のクロールプロセスの関係を詳しく紹介しています。
spotyou での活用
spotyou は AI 記事生成とコンプライアンスチェック、SEO/AEO 最適化を一体で提供するサービスです。記事を公開した際にサイトマップが適切に更新される運用体制と組み合わせることで、spotyou で生成した高品質なコンテンツが速やかにインデックスされます。コアアップデート後の順位回復でも解説しているとおり、インデックスの健全性は検索パフォーマンスの土台です。
構造化データに対応した記事構造で出力されるため、Google がコンテンツの意味を正確に理解し、インデックスの精度も向上します。コンプライアンスチェック機能で情報の正確性を担保することで、インデックス後の検索順位にもプラスに作用します。
まとめ
- サイトマップは Web サイトの URL 一覧を XML で記述し、検索エンジンにサイト構造を伝えるファイル
- 新規サイトや大規模サイトではサイトマップの設置がインデックス促進に効果的
- lastmod は実際の更新日のみ記載し、不正確な日付は Google に無視される原因になる
- インデックス対象の URL のみを含め、noindex ページやリダイレクト URL は除外する
- 大規模サイトではサイトマップインデックスを活用し、コンテンツ種類ごとにファイルを分割する
よくある質問
XMLサイトマップとは何ですか?
XMLサイトマップとは、Webサイト内のページ一覧をXML形式で記述したファイルです。検索エンジンのクローラーに対してサイトの構造やURLの存在を伝え、新規ページや更新ページの発見を促進する役割を持ちます。通常はドメインのルートにsitemap.xmlとして配置します。
サイトマップは必ず必要ですか?
小規模サイト(数百ページ以下)で内部リンクが適切に設定されていれば、サイトマップがなくてもGooglebotはページを発見できます。ただし、新規サイト、大規模サイト、頻繁にコンテンツを更新するサイトではサイトマップの設置が強く推奨されます。
サイトマップの上限はありますか?
1ファイルあたり50,000URL以内、非圧縮時のファイルサイズが50MB以内という制限があります。これを超える場合はサイトマップインデックスを使って複数のサイトマップファイルに分割します。
lastmodは毎日更新すべきですか?
いいえ。lastmodにはページを実際に更新した日付のみを記載します。コンテンツの変更がないのにlastmodを毎日更新すると、Googleはlastmodの値を信頼しなくなり、無視するようになります。
サイトマップに含めてはいけないURLは?
noindexを設定しているページ、robots.txtでブロックしているページ、リダイレクト元のURL、404エラーのページはサイトマップに含めるべきではありません。インデックスさせたいURLのみを記載することで、矛盾するシグナルを避けられます。