クロールバジェット / Crawl Budget
要約
Googlebotが一定期間内にサイトをクロールできるページ数の上限。大規模サイトでは重要なページが優先的にクロールされるよう、不要ページの制御とサイトマップの最適化が必要
クロールバジェット(Crawl Budget)とは、Googlebot が一定期間内に Web サイトをクロールできるページ数や帯域幅の上限を指す概念です。Google はサイトごとにクロールの時間とリソースを割り当てており、この配分量がクロールバジェットと呼ばれます。大規模サイトでは、限られたクロールバジェットの中で重要なページが優先的にクロールされるよう、不要ページの制御とサイトマップの最適化が不可欠です。
クロールバジェットは「クロール需要(Crawl Demand)」と「クロール容量制限(Crawl Capacity Limit)」の 2 つの要因で構成されています。クロール需要はサイトの規模や更新頻度、コンテンツの品質に基づいて Google が判断する「クロールしたい量」であり、クロール容量制限はサーバーがパフォーマンスに影響を与えずに処理できるクロール量の上限です。
なぜクロールバジェットが重要か
クロールバジェットは、すべてのサイトで問題になるわけではありません。Google 公式ドキュメントでも明記されているとおり、数千ページ以下の小規模サイトではクロールバジェットを意識する必要はほとんどありません。Googlebot は小規模サイトを十分にクロールできるためです。
一方で、以下のようなサイトではクロールバジェットの最適化が SEO の成果を大きく左右します。
| サイトの特徴 | クロールバジェットの影響 | 具体例 |
|---|---|---|
| 50 万ページ以上の大規模サイト | 全ページのクロールに数週間かかる | EC サイト、求人サイト、不動産サイト |
| URL パラメータが多いサイト | 重複 URL がクロールバジェットを浪費 | フィルター機能付きの EC サイト |
| 新規コンテンツを頻繁に公開するサイト | 新ページのインデックスが遅延する | ニュースサイト、メディアサイト |
| JavaScript に依存するサイト | レンダリングクロールが追加で必要 | SPA(シングルページアプリケーション) |
クロールバジェットが不足すると、新しく公開した記事や商品ページが Google の検索結果に表示されるまでに想定以上の時間がかかります。SEO の施策を実行しても、そもそもクロールされていなければ効果は発揮されません。
クロールバジェットの構成要素
クロールバジェットを構成する 2 つの要因について、それぞれ詳しく解説します。
| 要因 | 定義 | 影響する項目 |
|---|---|---|
| クロール需要 | Google がサイトからクロールしたい量 | サイト規模、更新頻度、ページ品質、人気度 |
| クロール容量制限 | サーバーが処理できるクロール量の上限 | サーバー応答速度、同時接続数、エラー率 |
クロール需要が高くても、サーバーの応答が遅ければクロール容量制限によってクロール量は制限されます。逆に、サーバーが高速でもコンテンツの品質が低ければクロール需要が下がり、Googlebot の訪問頻度は減少します。
Google Search Console の「クロールの統計情報」レポートで、Googlebot がサイトにアクセスした頻度、リクエスト数、平均応答時間を確認できます。クロール頻度が急激に低下している場合は、サーバー側の問題かクロールバジェットの浪費を疑います。
クロールバジェットを浪費する主な原因
クロールバジェットの無駄遣いを特定し、解消することが最適化の第一歩です。
| 原因 | 問題の内容 | 対策 |
|---|---|---|
| パラメータ URL の増殖 | ソート、フィルター、セッション ID で大量の重複 URL が発生 | robots.txt でパラメータ URL をブロック |
| リダイレクトチェーン | A → B → C → D のように複数回リダイレクト | 最終 URL への直接リダイレクトに修正 |
| ソフト 404 | 存在しないページが 200 ステータスを返す | 適切な 404 または 410 ステータスコードを返す |
| 重複コンテンツ | www あり/なし、http/https の混在 | canonical タグと 301 リダイレクトで統一 |
| 低品質ページ | 内容が薄いタグページや検索結果 0 件のページ | noindex 設定またはページ削除 |
| 孤立ページ | 内部リンクがなく発見されにくいページ | 内部リンクの追加またはサイトマップへの掲載 |
EC サイトでよく見られるのが、カラーやサイズのフィルター組み合わせにより URL が数万件に膨れ上がるケースです。これらの URL がすべてクロール対象になると、本来優先すべき商品ページやカテゴリページのクロールが後回しになります。
クロールバジェットの最適化手法
クロールバジェットを有効活用するための具体的な施策を優先度順に整理します。
不要な URL のクロールをブロックする
robots.txt を活用して、クロールが不要なパスをブロックします。検索結果ページ、印刷用ページ、セッション付き URL などは、Googlebot にクロールさせる必要がありません。ただし、robots.txt によるブロックはインデックスの防止を保証しないため、確実にインデックスから除外したい場合は noindex メタタグと併用します。
サーバー応答速度を改善する
TTFB(Time To First Byte)を 200ms 以下に抑えることで、Googlebot は同じ時間内により多くのページをクロールできるようになります。CDN の導入、HTTP/2 または HTTP/3 の採用、サーバーリソースのスケーリングが有効です。
XML サイトマップを最適化する
サイトマップにはインデックス対象の URL のみを記載し、noindex ページやリダイレクト先の URL は除外します。lastmod の日付は実際の更新日を正確に記載します。不正確な lastmod は Google に無視される原因になります。
内部リンク構造を最適化する
重要なページへの内部リンクを増やし、ホームページから 3 クリック以内でアクセスできる構造にします。クロール深度が浅いページほど Googlebot に優先的にクロールされる傾向があります。
クロールバジェットの問題は、多くの場合「不要な URL が多すぎる」ことに起因します。サイト内に存在する URL の総数を把握し、本当にインデックスが必要な URL がどれだけあるかを棚卸しすることが、最適化の出発点です。
クロールバジェットと AI クローラー
2026 年現在、Web サイトには Googlebot だけでなく、GPTBot や ClaudeBot などの AI クローラーもアクセスしています。AI クローラーのアクセスが増加すると、サーバー負荷が上がり、結果として Googlebot のクロール容量制限に影響する可能性があります。
AI 検索オプトアウトの最新動向でも解説していますが、AI クローラーの管理は robots.txt で行います。AI クローラーを許可するかどうかは、サーバーリソースとの兼ね合いも含めた判断が必要です。
Googlebot のクロールの仕組みを詳しく解説した記事では、IndexNow プロトコルや JavaScript レンダリング対策など、クロール効率をさらに高める実践的な方法を紹介しています。
spotyou での活用
spotyou は AI 記事生成とコンプライアンスチェック、SEO/AEO 最適化を一体で提供するサービスです。生成する記事は構造化データに対応した設計で出力されるため、Googlebot が効率的にコンテンツを理解でき、クロールバジェットの無駄遣いを防ぎます。
また、コンプライアンスチェック機能により情報の正確性を担保し、E-E-A-T の信頼性要件を満たすコンテンツ品質を確保します。品質の高いコンテンツは Google のクロール需要を高め、クロール頻度の向上につながります。
まとめ
- クロールバジェットは Googlebot がサイトをクロールできる量の上限で、クロール需要とクロール容量制限の 2 要因で決まる
- 50 万ページ以上の大規模サイトや URL パラメータが多いサイトで特に重要
- パラメータ URL の制御、リダイレクトチェーンの解消、サーバー応答速度の改善が最適化の基本
- robots.txt と XML サイトマップを適切に設定し、重要なページが優先的にクロールされるようにする
- AI クローラーのアクセス増加がサーバー負荷に影響する点にも注意が必要
よくある質問
クロールバジェットとは何ですか?
クロールバジェットとは、Googlebotが一定期間内にWebサイトをクロールできるページ数や帯域幅の上限を指します。Googleはクロール需要とクロール容量制限の2つの要因でクロール量を決定しており、この2つのバランスがクロールバジェットです。
クロールバジェットを気にすべきサイトの規模は?
一般的に50万ページ以上の大規模サイトでクロールバジェットが問題になります。数千ページ以下の小規模サイトでは、Googlebotが十分にクロールできるため、クロールバジェットを意識する必要はほとんどありません。
クロールバジェットが不足するとどうなりますか?
重要なページがクロールされず、検索インデックスへの登録が遅延します。新しい記事や商品ページが検索結果に表示されるまでに数週間かかったり、更新した内容が検索結果に反映されないといった問題が発生します。
クロールバジェットを改善する方法は?
不要なURLのクロールをrobots.txtでブロックする、リダイレクトチェーンを解消する、サーバー応答速度を改善する(TTFB 200ms以下)、XMLサイトマップを適切に設定する、ソフト404を修正するなどの方法が効果的です。
Search Consoleでクロールバジェットを確認できますか?
はい。Google Search Consoleの「クロールの統計情報」レポートで、Googlebotがサイトをクロールした頻度やリクエスト数、応答時間を確認できます。クロール頻度が低下している場合はクロールバジェットの問題が疑われます。