サイトマップ / XML Sitemap

要約

Webサイト内のページ一覧をXML形式で記述したファイル。検索エンジンのクローラーに対してサイト構造を伝え、新規・更新ページの発見を促進する。大規模サイトではサイトマップインデックスの活用が推奨される

サイトマップ(XML Sitemap)とは、Web サイト内のページ一覧を XML 形式で記述したファイルです。検索エンジンのクローラーに対してサイト構造を伝え、新規ページや更新されたページの発見を促進する役割を持ちます。通常はドメインのルートディレクトリに sitemap.xml として配置し、Google Search Console に提出します。

サイトマップは、内部リンクだけではカバーしきれない URL の発見を補完するための仕組みです。特に新規サイト、大規模サイト、コンテンツを頻繁に更新するメディアサイトでは、サイトマップがないとインデックスまでの時間が大幅に遅延する可能性があります。

サイトマップが特に効果的なケース

すべてのサイトでサイトマップが必須というわけではありません。Google 公式ドキュメントでも、小規模で内部リンクが適切に設定されたサイトでは、サイトマップなしでも Googlebot がページを発見できるとされています。

以下のようなケースでは、サイトマップの設置が特に効果を発揮します。

ケース理由効果
新規サイト外部リンクが少なく URL が発見されにくいクロール開始の加速
50 万ページ以上の大規模サイト内部リンクだけでは全 URL をカバーしきれないクロールバジェットの効率化
コンテンツを頻繁に更新するサイト更新ページの早期再クロールが必要lastmod による更新通知
孤立ページが多いサイト内部リンクが不足しているページがあるURL の発見漏れ防止
リッチメディアを多用するサイト画像や動画が検索対象になる画像・動画サイトマップによる発見促進

サイトマップの主要な構成要素

XML サイトマップで使用できるタグとその役割を整理します。

タグ必須/任意役割注意点
loc必須ページの URL を指定正規 URL のみを記載する
lastmod任意(推奨)ページの最終更新日実際の更新日のみ記載。不正確だと無視される
changefreq任意更新頻度の目安Google はこの値を参考程度にしか扱わない
priority任意ページの相対的な優先度Google はこの値をほとんど無視する

実務上重要なのは loc と lastmod の 2 つです。changefreq と priority は Google がほとんど参照しないため、設定の手間に対して効果は限定的です。

lastmod は Google がクロールの優先順位を判断する重要な手がかりです。ただし、コンテンツの変更がないのに lastmod を毎日更新すると、Google は lastmod の信頼性が低いと判断し、この値を無視するようになります。lastmod には実際にコンテンツを更新した日付のみを記載します。

サイトマップの種類

用途に応じて複数の種類のサイトマップを使い分けることができます。

種類対象コンテンツ主な用途
通常のサイトマップWeb ページの URLすべてのサイトで使用
画像サイトマップ画像 URL画像検索からのトラフィック獲得
動画サイトマップ動画コンテンツ動画検索での表示促進
ニュースサイトマップニュース記事Google News への掲載
サイトマップインデックスサイトマップファイルの一覧50,000 URL を超える大規模サイト

サイトマップインデックスは、複数のサイトマップファイルをまとめる「目次」の役割を果たします。大規模サイトでは、コンテンツの種類(商品ページ、ブログ記事、カテゴリページ等)ごとにサイトマップを分割し、サイトマップインデックスで管理するのが標準的なアプローチです。

サイトマップ最適化のベストプラクティス

サイトマップの効果を最大化するための具体的な手順を、優先度の高いものから整理します。

インデックス対象の URL のみを含める

サイトマップには、実際にインデックスさせたい URL のみを記載します。noindex を設定しているページ、robots.txt でブロックしているページ、リダイレクト元の URL、404 エラーのページはサイトマップから除外します。サイトマップの URL と noindex 設定が矛盾していると、Google に混乱したシグナルを送ることになります。

Search Console に提出する

サイトマップを作成したら Google Search Console に提出します。robots.txt にもサイトマップの URL を記載しておくことで、Search Console 以外のクローラーにもサイトマップの存在を伝えられます。

動的生成を導入する

コンテンツを頻繁に更新するサイトでは、CMS やフレームワークの機能を使ってサイトマップを自動生成する仕組みを導入します。手動管理では更新漏れが発生しやすく、lastmod の正確性も維持できません。Next.js では generateSitemaps 関数でビルド時に自動生成できます。

ファイルサイズの制限を守る

1 ファイルあたり 50,000 URL 以内、非圧縮時のファイルサイズは 50MB 以内に収めます。これを超える場合はサイトマップインデックスで分割します。gzip 圧縮を使用するとファイルサイズを大幅に削減できます。

サイトマップに記載した URL 数と、Search Console の「ページのインデックス登録」レポートに表示されるインデックス済みページ数を定期的に比較します。大きな乖離がある場合は、インデックスに問題が発生している可能性があります。

サイトマップでよくある間違い

サイトマップの運用で見落としやすいポイントを整理します。

よくある間違い問題正しい対応
noindex ページをサイトマップに含める矛盾するシグナルnoindex ページは除外する
リダイレクト URL を含める最終 URL が正しく伝わらないリダイレクト先の最終 URL のみ記載
lastmod を毎日一括更新Google が lastmod を無視するようになる実際の更新日のみ記載
サイトマップを提出しないURL 発見の遅延Search Console で提出
古いサイトマップを放置存在しない URL がクロール対象になる定期的にサイトマップを更新

サイトマップと IndexNow

2026 年現在、サイトマップに加えて IndexNow プロトコルを併用するサイトが増えています。サイトマップが Google のクロールスケジュールに依存するのに対し、IndexNow はコンテンツの追加・更新を検索エンジンに即座に通知できます。

IndexNow は Bing、Yandex、Naver 等が対応していますが、Google は未対応です。Google に対しては引き続きサイトマップと Search Console の URL 検査ツールが主要な手段です。Googlebot のクロールの仕組みを解説した記事では、IndexNow とGooglebot のクロールプロセスの関係を詳しく紹介しています。

spotyou での活用

spotyou は AI 記事生成とコンプライアンスチェック、SEO/AEO 最適化を一体で提供するサービスです。記事を公開した際にサイトマップが適切に更新される運用体制と組み合わせることで、spotyou で生成した高品質なコンテンツが速やかにインデックスされます。コアアップデート後の順位回復でも解説しているとおり、インデックスの健全性は検索パフォーマンスの土台です。

構造化データに対応した記事構造で出力されるため、Google がコンテンツの意味を正確に理解し、インデックスの精度も向上します。コンプライアンスチェック機能で情報の正確性を担保することで、インデックス後の検索順位にもプラスに作用します。

まとめ

  • サイトマップは Web サイトの URL 一覧を XML で記述し、検索エンジンにサイト構造を伝えるファイル
  • 新規サイトや大規模サイトではサイトマップの設置がインデックス促進に効果的
  • lastmod は実際の更新日のみ記載し、不正確な日付は Google に無視される原因になる
  • インデックス対象の URL のみを含め、noindex ページやリダイレクト URL は除外する
  • 大規模サイトではサイトマップインデックスを活用し、コンテンツ種類ごとにファイルを分割する

よくある質問

Q

XMLサイトマップとは何ですか?

A

XMLサイトマップとは、Webサイト内のページ一覧をXML形式で記述したファイルです。検索エンジンのクローラーに対してサイトの構造やURLの存在を伝え、新規ページや更新ページの発見を促進する役割を持ちます。通常はドメインのルートにsitemap.xmlとして配置します。

Q

サイトマップは必ず必要ですか?

A

小規模サイト(数百ページ以下)で内部リンクが適切に設定されていれば、サイトマップがなくてもGooglebotはページを発見できます。ただし、新規サイト、大規模サイト、頻繁にコンテンツを更新するサイトではサイトマップの設置が強く推奨されます。

Q

サイトマップの上限はありますか?

A

1ファイルあたり50,000URL以内、非圧縮時のファイルサイズが50MB以内という制限があります。これを超える場合はサイトマップインデックスを使って複数のサイトマップファイルに分割します。

Q

lastmodは毎日更新すべきですか?

A

いいえ。lastmodにはページを実際に更新した日付のみを記載します。コンテンツの変更がないのにlastmodを毎日更新すると、Googleはlastmodの値を信頼しなくなり、無視するようになります。

Q

サイトマップに含めてはいけないURLは?

A

noindexを設定しているページ、robots.txtでブロックしているページ、リダイレクト元のURL、404エラーのページはサイトマップに含めるべきではありません。インデックスさせたいURLのみを記載することで、矛盾するシグナルを避けられます。

関連用語

関連記事

SEO と AEO に最適化された記事を、AI で作成

spotyou は検索にもAI検索にも強い記事を自動生成します。無料で試してみませんか?

無料で試す