Domain 6 / 225
サイトマップは Google に重要 URL の在りかを伝える地図
サイトマップ の要点
サイトマップは重要 URL の在りかを Google に伝える地図で、XML / RSS / テキストの 3 形式に対応。1 ファイル 50MB / 5 万 URL まで。Google は priority と changefreq を無視し、lastmod は正確なときのみ参照する
なぜこれを学ぶか
サイトマップは 大規模サイト・新規サイトの URL を Google に発見させる主要手段。 内部リンクが届いていないページや、被リンクがまだ少ないサイトは、サイトマップを送らないと Google にいつまでも見つけられない。
500 ページを超える規模、メディアサイト、ニュースサイト、新規 EC サイトの SEO では、サイトマップ設計の品質がインデックス速度を決める。
学ばないと起きること
| よくある事故 | 被害 |
|---|---|
| サイトマップを送らず内部リンクだけに頼る | 内部リンクが届いていない記事が数ヶ月インデックスされない |
| 50MB / 5 万 URL 上限を超えた巨大サイトマップ | Google が処理できず一部 URL が無視される |
| サイトマップに canonical 以外の URL を入れる | Google が重複扱いや URL 選定の混乱を起こし、想定外の URL が検索結果に出る |
相対 URL(/page.html)でサイトマップを書く | URL を解決できず多くの URL が取り込まれない |
priority / changefreq を頑張って細かく設定する | Google は両方とも無視するため工数の無駄 |
lastmod を機械的に毎日「今日」で出す | Google が信頼できないと判断して無視するようになる |
| サイトマップをサブディレクトリに置いて全ページに効くと期待する | 親ディレクトリ配下の URL にしか効かない(root に置かないと全体カバーできない) |
学ぶメリット
- 大規模サイトや新規サイトのインデックス速度を最大化できる
- 画像・動画・ニュースのリッチリザルト用メタデータを Google に渡せる
- Search Console のサイトマップレポートを正しく読み解けるようになる
- どのサイトマップ形式(XML / RSS / テキスト)を選ぶべきか論理的に判断できる
仕組み
サイトマップとは
サイト内のページ・動画・画像 URL とそのメタ情報(最終更新日、代替言語版など)を Google に渡すためのファイル。 Google はこれを読んで「このサイトでクロールすべき URL のリスト」を効率的に把握する。
サイトマップが必要なケース・不要なケース
| 必要 | 不要 |
|---|---|
| 大規模サイト(数千ページ以上) | 500 ページ以下の小規模サイト |
| 新規サイトで被リンクが少ない | 内部リンクが網羅的に張られている |
| 画像・動画コンテンツが多い | リッチメディアが少ない |
| Google ニュースに掲載される | ニュース・メディア配信を行わない |
「不要」の条件をすべて満たすサイトでも、送って害はない。むしろ送る方が一般的に推奨される。
3 つのフォーマット比較
Google はどの形式も同等に扱う(優劣なし)。
| 形式 | 強み | 弱み |
|---|---|---|
| XML サイトマップ | 拡張性が高く、画像 / 動画 / ニュース / hreflang のメタデータを渡せる | 大規模サイトで保守が複雑になる |
| RSS / mRSS / Atom 1.0 | CMS が自動生成することが多い、動画情報も渡せる | 画像・ニュースのメタデータは渡せない |
| テキストサイトマップ | 1 行 1 URL の最も単純な形式、保守が楽 | URL のリストのみ、メタデータは渡せない |
XML サイトマップの最小例
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://www.example.com/foo.html</loc>
<lastmod>2026-05-10</lastmod>
</url>
</urlset>
サイズ上限とサイトマップインデックス
| 制限 | 上限 |
|---|---|
| 1 ファイルのサイズ | 50MB(gzip 圧縮前) |
| 1 ファイルの URL 数 | 50,000 |
| 1 サイトのサイトマップインデックス数 | 500 |
これを超える場合は、サイトマップインデックスファイルで複数サイトマップをまとめて送信する。
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>https://www.example.com/sitemap-articles.xml.gz</loc>
<lastmod>2026-05-10</lastmod>
</sitemap>
<sitemap>
<loc>https://www.example.com/sitemap-products.xml.gz</loc>
<lastmod>2026-05-09</lastmod>
</sitemap>
</sitemapindex>
サイトマップインデックスから参照されるサイトマップは、同じドメインかつ同じディレクトリ階層以下に配置する必要がある。
キー概念
Google が無視するタグ
<priority> と <changefreq> は Google が完全に無視する。設定しても効果ゼロなので、書かなくていい。
<lastmod> の正しい使い方
Google は <lastmod> を「一貫して正確である場合のみ」参照する。
OK な更新例:
- 主要コンテンツの修正
- 構造化データの変更
- ページ内リンクの追加・変更
NG な更新例:
- フッターの著作権年だけ更新
- 全ページの
<lastmod>を毎日「今日」に書き換える
機械的に「今日」を出し続けると、Google が「このサイトの lastmod は信頼できない」と判定して無視するようになる。
サイトマップ配置場所のルール
Search Console から送信する場合は任意の場所で OK だが、robots.txt の Sitemap: 行で参照する場合は、以下のルールがある。
- サイトマップは parent ディレクトリ配下にしか効かない
- 例:
/public/sitemap.xmlは/public/配下の URL にしか効かない - 全 URL をカバーしたい場合は root に置く(
https://example.com/sitemap.xml)
URL 列挙のベストプラクティス
- 必ず絶対 URL を使う(
/page.htmlのような相対 URL は NG) - canonical URL のみを記載(重複ページや URL パラメータ違いは入れない)
- 同じコンテンツのモバイル版・デスクトップ版の両方を入れたい場合は専用アノテーションで明示
サイトマップ送信の 3 つの方法
| 方法 | 強み |
|---|---|
| Search Console のサイトマップレポート | 取得状況・エラーを GUI で確認可能 |
| Search Console API | プログラム的に送信、CI/CD で自動化可能 |
robots.txt の Sitemap: 行 | 設定は 1 行のみ、複数行で複数サイトマップを宣言可能 |
# robots.txt の例
Sitemap: https://example.com/sitemap.xml
Sitemap: https://example.com/blog/sitemap.xml
robots.txt 経由はシンプルだが、エラー監視ができない。Search Console 送信と併用するのが推奨。
よくある誤解
| よくある誤解 | 実際のところ | 出典 |
|---|---|---|
| サイトマップに載せた URL は必ずインデックスされる | 保証なし。サイトマップは「クロール対象として知らせる」だけで、インデックスされるかは別判定 | サイトマップとは |
priority を 1.0 に設定すると順位が上がる | Google は priority を完全に無視する | サイトマップの作り方 |
changefreq で更新頻度を伝えれば優先クロールされる | changefreq も Google は無視する | 同上 |
lastmod をすべて「今日」にすれば優先される | 信頼できない lastmod は逆に Google が無視するようになる | 同上 |
| 1 サイトマップに 100 万 URL でも入れられる | 50MB / 5 万 URL の上限あり。超える場合はサイトマップインデックスで分割 | 同上 |
| サブディレクトリの sitemap.xml が全体に効く | 親ディレクトリ配下にしか効かない。全体カバーには root 配置が必要 | 同上 |
| サイトマップは XML 形式じゃないとダメ | RSS / Atom / プレーンテキスト形式も Google が公式サポート | 同上 |
priority changefreq を細かく設定するのが SEO 上手 | 工数の無駄。代わりに lastmod の正確性に投資する | 同上 |
実務での適用
CMS が自動生成するサイトマップを使う
WordPress / Wix / Blogger などは標準でサイトマップを生成している。プラグインや theme 設定で出力先 URL を確認する。
代表的な URL: https://example.com/sitemap.xml または https://example.com/sitemap_index.xml
CMS の自動サイトマップでカバーできない URL(カスタム投稿タイプなど)がある場合は、補助サイトマップを別途作って送信する。
大規模 EC サイトのサイトマップ分割例
カテゴリごとに分割すると、Search Console でカテゴリ別のインデックス状況を追跡しやすい。
sitemap-index.xml
├─ sitemap-products.xml (商品ページ、3 万 URL)
├─ sitemap-categories.xml (カテゴリページ、1,000 URL)
├─ sitemap-blog.xml (ブログ記事、500 URL)
└─ sitemap-static.xml (静的ページ、20 URL)
robots.txt でサイトマップ宣言
User-agent: *
Disallow: /admin/
Sitemap: https://example.com/sitemap-index.xml
Search Console で送信
- Search Console の「サイトマップ」レポートを開く
- サイトマップ URL を入力して送信
- 取得日時・エラー数・検出 URL 数を定期確認
トラブル別の対処
| 症状 | 確認すべきこと |
|---|---|
| Search Console に「読み取り不可」と表示される | サイトマップ URL に直接アクセスして 200 が返るか / robots.txt で Disallow されていないか |
| サイトマップの URL がインデックスされない | URL 検査ツールで個別に状況確認、品質や noindex の有無をチェック |
| インデックスされた URL 数がサイトマップ送信数より少ない | コンテンツ品質、canonical の重複統合、noindex の混入を疑う |
| サイトマップが古いまま更新されない | CMS のキャッシュ・CDN のキャッシュをクリア、自動更新ジョブが動いているか確認 |
| サイトマップにステージング URL が混入 | 自動生成スクリプトの環境変数誤り、ステージング URL を除外する設定を入れる |
公式ソース
自己テスト
Q1. サイトマップに載せれば必ず Google にインデックスされるか?
されない。サイトマップは「クロール対象として知らせる」だけ。インデックスされるかは品質・関連性・重複判定など複数要因の判定結果
Q2. `<priority>` を 1.0 に設定すると順位は上がるか?
上がらない。Google は <priority> も <changefreq> も完全に無視する。
工数を割く意味はない
Q3. 1 つのサイトマップに含められる URL 数の上限は?
50,000 URL。ファイルサイズ上限は 50MB(gzip 圧縮前)。 これを超える場合はサイトマップインデックスファイルで複数のサイトマップをまとめて送信する
Q4. `<lastmod>` を毎日「今日」に書き換えるとクロールされやすくなるか?
ならない。むしろ Google が「このサイトの lastmod は信頼できない」と判定して、無視するようになる。 本当に主要コンテンツが更新された時だけ更新する
Q5. サイトマップを `/blog/sitemap.xml` に置いた場合、サイト全体の URL に効くか?
効かない。robots.txt 経由で参照する場合、サイトマップは parent ディレクトリ配下の URL にしか効かない。
全体カバーには root(https://example.com/sitemap.xml)に置く
Q6. サイトマップを Google に送信する方法は?
3 つある:
- Search Console の「サイトマップ」レポートから送信(エラー監視可能)
- Search Console API で送信(CI/CD 自動化向け)
robots.txtにSitemap: <URL>行を追加(最もシンプル)
おすすめは Search Console 送信 + robots.txt 宣言の併用
Q7. サイトマップは XML 形式じゃないとダメか?
NG ではない。Google は XML サイトマップ / RSS / mRSS / Atom 1.0 / プレーンテキスト の 4 種類を公式サポートしている。 ただし XML が最も拡張性が高く、画像・動画・ニュースのメタデータも渡せる
Q8. サイトマップに含める URL の選び方は?
canonical URL のみを含める。重複ページや URL パラメータ違いは含めない。 モバイル版・デスクトップ版を両方入れたい場合は専用アノテーションで明示する
これらの内容を採点付きで挑戦したい場合は、本ドメインのプロ試験で 5 問形式で確認できる。