Domain 6 / 225

サイトマップは Google に重要 URL の在りかを伝える地図

サイトマップ の要点

サイトマップは重要 URL の在りかを Google に伝える地図で、XML / RSS / テキストの 3 形式に対応。1 ファイル 50MB / 5 万 URL まで。Google は priority と changefreq を無視し、lastmod は正確なときのみ参照する

なぜこれを学ぶか

サイトマップは 大規模サイト・新規サイトの URL を Google に発見させる主要手段。 内部リンクが届いていないページや、被リンクがまだ少ないサイトは、サイトマップを送らないと Google にいつまでも見つけられない。

500 ページを超える規模、メディアサイト、ニュースサイト、新規 EC サイトの SEO では、サイトマップ設計の品質がインデックス速度を決める。

学ばないと起きること

よくある事故被害
サイトマップを送らず内部リンクだけに頼る内部リンクが届いていない記事が数ヶ月インデックスされない
50MB / 5 万 URL 上限を超えた巨大サイトマップGoogle が処理できず一部 URL が無視される
サイトマップに canonical 以外の URL を入れるGoogle が重複扱いや URL 選定の混乱を起こし、想定外の URL が検索結果に出る
相対 URL(/page.html)でサイトマップを書くURL を解決できず多くの URL が取り込まれない
priority / changefreq を頑張って細かく設定するGoogle は両方とも無視するため工数の無駄
lastmod を機械的に毎日「今日」で出すGoogle が信頼できないと判断して無視するようになる
サイトマップをサブディレクトリに置いて全ページに効くと期待する親ディレクトリ配下の URL にしか効かない(root に置かないと全体カバーできない)

学ぶメリット

  • 大規模サイトや新規サイトのインデックス速度を最大化できる
  • 画像・動画・ニュースのリッチリザルト用メタデータを Google に渡せる
  • Search Console のサイトマップレポートを正しく読み解けるようになる
  • どのサイトマップ形式(XML / RSS / テキスト)を選ぶべきか論理的に判断できる

仕組み

サイトマップとは

サイト内のページ・動画・画像 URL とそのメタ情報(最終更新日、代替言語版など)を Google に渡すためのファイル。 Google はこれを読んで「このサイトでクロールすべき URL のリスト」を効率的に把握する。

サイトマップが必要なケース・不要なケース

必要不要
大規模サイト(数千ページ以上)500 ページ以下の小規模サイト
新規サイトで被リンクが少ない内部リンクが網羅的に張られている
画像・動画コンテンツが多いリッチメディアが少ない
Google ニュースに掲載されるニュース・メディア配信を行わない

「不要」の条件をすべて満たすサイトでも、送って害はない。むしろ送る方が一般的に推奨される。

3 つのフォーマット比較

Google はどの形式も同等に扱う(優劣なし)。

形式強み弱み
XML サイトマップ拡張性が高く、画像 / 動画 / ニュース / hreflang のメタデータを渡せる大規模サイトで保守が複雑になる
RSS / mRSS / Atom 1.0CMS が自動生成することが多い、動画情報も渡せる画像・ニュースのメタデータは渡せない
テキストサイトマップ1 行 1 URL の最も単純な形式、保守が楽URL のリストのみ、メタデータは渡せない

XML サイトマップの最小例

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://www.example.com/foo.html</loc>
    <lastmod>2026-05-10</lastmod>
  </url>
</urlset>

サイズ上限とサイトマップインデックス

制限上限
1 ファイルのサイズ50MB(gzip 圧縮前)
1 ファイルの URL 数50,000
1 サイトのサイトマップインデックス数500

これを超える場合は、サイトマップインデックスファイルで複数サイトマップをまとめて送信する。

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <sitemap>
    <loc>https://www.example.com/sitemap-articles.xml.gz</loc>
    <lastmod>2026-05-10</lastmod>
  </sitemap>
  <sitemap>
    <loc>https://www.example.com/sitemap-products.xml.gz</loc>
    <lastmod>2026-05-09</lastmod>
  </sitemap>
</sitemapindex>

サイトマップインデックスから参照されるサイトマップは、同じドメインかつ同じディレクトリ階層以下に配置する必要がある。

キー概念

Google が無視するタグ

<priority><changefreq> は Google が完全に無視する。設定しても効果ゼロなので、書かなくていい。

<lastmod> の正しい使い方

Google は <lastmod> を「一貫して正確である場合のみ」参照する。

OK な更新例:

  • 主要コンテンツの修正
  • 構造化データの変更
  • ページ内リンクの追加・変更

NG な更新例:

  • フッターの著作権年だけ更新
  • 全ページの <lastmod> を毎日「今日」に書き換える

機械的に「今日」を出し続けると、Google が「このサイトの lastmod は信頼できない」と判定して無視するようになる。

サイトマップ配置場所のルール

Search Console から送信する場合は任意の場所で OK だが、robots.txtSitemap: 行で参照する場合は、以下のルールがある。

  • サイトマップは parent ディレクトリ配下にしか効かない
  • 例: /public/sitemap.xml/public/ 配下の URL にしか効かない
  • 全 URL をカバーしたい場合は root に置く(https://example.com/sitemap.xml

URL 列挙のベストプラクティス

  • 必ず絶対 URL を使う(/page.html のような相対 URL は NG)
  • canonical URL のみを記載(重複ページや URL パラメータ違いは入れない)
  • 同じコンテンツのモバイル版・デスクトップ版の両方を入れたい場合は専用アノテーションで明示

サイトマップ送信の 3 つの方法

方法強み
Search Console のサイトマップレポート取得状況・エラーを GUI で確認可能
Search Console APIプログラム的に送信、CI/CD で自動化可能
robots.txtSitemap:設定は 1 行のみ、複数行で複数サイトマップを宣言可能
# robots.txt の例
Sitemap: https://example.com/sitemap.xml
Sitemap: https://example.com/blog/sitemap.xml

robots.txt 経由はシンプルだが、エラー監視ができない。Search Console 送信と併用するのが推奨。

よくある誤解

よくある誤解実際のところ出典
サイトマップに載せた URL は必ずインデックスされる保証なし。サイトマップは「クロール対象として知らせる」だけで、インデックスされるかは別判定サイトマップとは
priority を 1.0 に設定すると順位が上がるGoogle は priority を完全に無視するサイトマップの作り方
changefreq で更新頻度を伝えれば優先クロールされるchangefreq も Google は無視する同上
lastmod をすべて「今日」にすれば優先される信頼できない lastmod は逆に Google が無視するようになる同上
1 サイトマップに 100 万 URL でも入れられる50MB / 5 万 URL の上限あり。超える場合はサイトマップインデックスで分割同上
サブディレクトリの sitemap.xml が全体に効く親ディレクトリ配下にしか効かない。全体カバーには root 配置が必要同上
サイトマップは XML 形式じゃないとダメRSS / Atom / プレーンテキスト形式も Google が公式サポート同上
priority changefreq を細かく設定するのが SEO 上手工数の無駄。代わりに lastmod の正確性に投資する同上

実務での適用

CMS が自動生成するサイトマップを使う

WordPress / Wix / Blogger などは標準でサイトマップを生成している。プラグインや theme 設定で出力先 URL を確認する。 代表的な URL: https://example.com/sitemap.xml または https://example.com/sitemap_index.xml

CMS の自動サイトマップでカバーできない URL(カスタム投稿タイプなど)がある場合は、補助サイトマップを別途作って送信する。

大規模 EC サイトのサイトマップ分割例

カテゴリごとに分割すると、Search Console でカテゴリ別のインデックス状況を追跡しやすい。

sitemap-index.xml
  ├─ sitemap-products.xml      (商品ページ、3 万 URL)
  ├─ sitemap-categories.xml    (カテゴリページ、1,000 URL)
  ├─ sitemap-blog.xml          (ブログ記事、500 URL)
  └─ sitemap-static.xml        (静的ページ、20 URL)

robots.txt でサイトマップ宣言

User-agent: *
Disallow: /admin/

Sitemap: https://example.com/sitemap-index.xml

Search Console で送信

  1. Search Console の「サイトマップ」レポートを開く
  2. サイトマップ URL を入力して送信
  3. 取得日時・エラー数・検出 URL 数を定期確認

トラブル別の対処

症状確認すべきこと
Search Console に「読み取り不可」と表示されるサイトマップ URL に直接アクセスして 200 が返るか / robots.txt で Disallow されていないか
サイトマップの URL がインデックスされないURL 検査ツールで個別に状況確認、品質や noindex の有無をチェック
インデックスされた URL 数がサイトマップ送信数より少ないコンテンツ品質、canonical の重複統合、noindex の混入を疑う
サイトマップが古いまま更新されないCMS のキャッシュ・CDN のキャッシュをクリア、自動更新ジョブが動いているか確認
サイトマップにステージング URL が混入自動生成スクリプトの環境変数誤り、ステージング URL を除外する設定を入れる

公式ソース

自己テスト

Q1. サイトマップに載せれば必ず Google にインデックスされるか?

されない。サイトマップは「クロール対象として知らせる」だけ。インデックスされるかは品質・関連性・重複判定など複数要因の判定結果

Q2. `<priority>` を 1.0 に設定すると順位は上がるか?

上がらない。Google は <priority><changefreq> も完全に無視する。 工数を割く意味はない

Q3. 1 つのサイトマップに含められる URL 数の上限は?

50,000 URL。ファイルサイズ上限は 50MB(gzip 圧縮前)。 これを超える場合はサイトマップインデックスファイルで複数のサイトマップをまとめて送信する

Q4. `<lastmod>` を毎日「今日」に書き換えるとクロールされやすくなるか?

ならない。むしろ Google が「このサイトの lastmod は信頼できない」と判定して、無視するようになる。 本当に主要コンテンツが更新された時だけ更新する

Q5. サイトマップを `/blog/sitemap.xml` に置いた場合、サイト全体の URL に効くか?

効かない。robots.txt 経由で参照する場合、サイトマップは parent ディレクトリ配下の URL にしか効かない。 全体カバーには root(https://example.com/sitemap.xml)に置く

Q6. サイトマップを Google に送信する方法は?

3 つある:

  1. Search Console の「サイトマップ」レポートから送信(エラー監視可能)
  2. Search Console API で送信(CI/CD 自動化向け)
  3. robots.txtSitemap: <URL> 行を追加(最もシンプル)

おすすめは Search Console 送信 + robots.txt 宣言の併用

Q7. サイトマップは XML 形式じゃないとダメか?

NG ではない。Google は XML サイトマップ / RSS / mRSS / Atom 1.0 / プレーンテキスト の 4 種類を公式サポートしている。 ただし XML が最も拡張性が高く、画像・動画・ニュースのメタデータも渡せる

Q8. サイトマップに含める URL の選び方は?

canonical URL のみを含める。重複ページや URL パラメータ違いは含めない。 モバイル版・デスクトップ版を両方入れたい場合は専用アノテーションで明示する

これらの内容を採点付きで挑戦したい場合は、本ドメインのプロ試験で 5 問形式で確認できる。