Googlebot

要約

GoogleがWebページの情報を収集するために使用するクローラー。2段階処理(クロール→レンダリング)でページを理解し、検索インデックスに登録する。AI検索の普及に伴い、AIクローラーとの違いも重要になっている

Googlebot とは、Google が Web ページの情報を収集するために使用する自動プログラム(クローラー / ウェブスパイダー)です。Web サイトを巡回してページの HTML コンテンツを取得し、Google の検索インデックスに登録する役割を担っています。Googlebot がアクセスできないページは Google 検索に表示されないため、SEO の土台となる存在です。

Googlebot のクロールプロセスは 2 段階で構成されています。まず HTML をダウンロードしてリンクや基本コンテンツを取得する「HTML クロール」を行い、次に JavaScript を実行してページの完全な DOM を構築する「レンダリングクロール」に進みます。この 2 段階処理を理解することが、テクニカル SEO の基本です。

なぜ Googlebot の理解が重要か

Googlebot はすべての SEO 施策の入口に位置します。どれほど優れたコンテンツを作成しても、Googlebot が正しくクロールできなければ検索結果に表示されません。

2026 年現在、Googlebot に加えて AI クローラー(GPTBot、ClaudeBot、PerplexityBot 等)も Web サイトにアクセスしています。Googlebot は検索インデックスの構築を目的とするのに対し、AI クローラーは LLM の学習データ収集やリアルタイム検索を目的としており、robots.txt での管理が重要な課題になっています。パブリッシャーの 33.2% が AI クローラーのオプトアウトを予定しているというデータもあり、Googlebot と AI クローラーを区別して管理する意識が必要です。

Googlebot のクロールの仕組み

Googlebot がページを発見し、検索インデックスに登録するまでのプロセスを整理します。

ステップ処理内容補足
1. URL 発見リンク、サイトマップ、Search Console 経由で URL を発見内部リンクが多いページほど発見されやすい
2. クロールキュー優先度に基づいて URL をキューに追加更新頻度が高いページは優先される
3. robots.txt チェッククロール前に robots.txt でアクセス可否を確認Disallow されたページはクロールしない
4. HTML クロールHTTP リクエストでページの HTML を取得この段階ではリンクと基本テキストのみ
5. レンダリングJavaScript を実行して完全な DOM を構築リソース集約的で数秒〜数日の遅延あり
6. インデックスコンテンツを解析し検索インデックスに登録noindex 指定があればインデックスされない

レンダリングの段階では、Google の Web Rendering Service(WRS)が Chromium ベースのレンダラーを使用して JavaScript を実行します。SPA(シングルページアプリケーション)やクライアントサイドレンダリングに依存するサイトでは、このレンダリング待ちがインデックス遅延の原因になります。

JavaScript に依存するコンテンツがある場合、SSR(サーバーサイドレンダリング)または SSG(静的サイト生成)の導入が推奨されます。レンダリングを待つ必要がなくなり、Googlebot が即座にコンテンツを取得できるようになります。

クロール頻度に影響する要因

Googlebot がサイトをどの程度の頻度でクロールするかは、複数の要因で決まります。

要因影響度改善方法
ページの更新頻度定期的にコンテンツを更新する
サイトの権威性E-E-A-T の強化、被リンクの獲得
サーバー応答速度TTFB を 200ms 以下に改善、CDN の活用
内部リンク構造重要ページへの内部リンクを増やす
サイトマップの存在XML サイトマップを設定し Search Console に提出
コンテンツの量新規コンテンツの定期的な公開

Google はクロール量を「クロール需要」と「クロール容量制限」の 2 つの要因で決定します。クロール需要はサイトの規模や更新頻度、ページ品質に基づき、クロール容量制限はサーバーがパフォーマンスに影響なく処理できるクロール量を指します。この 2 つのバランスがクロールバジェットです。

小規模サイト(数千ページ以下)ではクロールバジェットが問題になることはほとんどありませんが、50 万ページ以上の大規模サイトでは最適化が必須です。

Googlebot と AI クローラーの違い

2026 年現在、Web サイトには Googlebot 以外にも多数のクローラーがアクセスしています。目的と挙動の違いを理解することが、適切なアクセス管理の前提です。

項目GooglebotAI クローラー(GPTBot 等)
目的検索インデックスの構築LLM の学習データ収集、リアルタイム検索
運営者GoogleOpenAI、Anthropic、Microsoft 等
robots.txt 遵守厳密に遵守基本的に遵守(一部で議論あり)
アクセスをブロックした場合Google 検索に表示されなくなるAI の回答に自社情報が使われなくなる
クロール頻度の管理Search Console で確認可能サーバーログでの確認が主

AI クローラーの管理は robots.txt で行います。Googlebot は許可しつつ AI クローラーをブロックする、またはその逆の設定も可能です。AI 検索オプトアウトの最新動向で詳しく解説していますが、AI クローラーをブロックすると AI 検索での引用機会を失うトレードオフがあります。

AI クローラーを一律にブロックするのではなく、コンテンツの種類に応じて判断することを推奨します。公開情報やブランド認知に寄与するコンテンツは AI クローラーに公開し、有料コンテンツや独自データは保護するという使い分けが実務的です。

Googlebot のクロールを最適化する方法

Googlebot がサイトを効率的にクロールできるよう、以下の施策を実施します。

robots.txt の適切な設定

robots.txt はサイトのルートディレクトリに配置し、クロールを許可するパスとブロックするパスを指定します。CSS や JavaScript ファイルのクロールをブロックすると、Googlebot がページをレンダリングできなくなるため注意が必要です。

XML サイトマップの活用

XML サイトマップにインデックス対象の URL を記載し、Search Console に提出します。lastmod の日付は実際の更新日を正確に記載します。不正確な日付は Google に無視されるためです。1 ファイルあたり 50,000 URL 以内に収め、大規模サイトではサイトマップインデックスを活用します。

構造化データの実装

JSON-LD 形式で Article、FAQPage、HowTo などの構造化データスキーマを設定します。Googlebot がコンテンツの意味と構造を正確に理解できるようになり、リッチリザルトの表示にもつながります。構造化データを適切に実装しているサイトは、CTR が平均 30% 向上するというデータがあります。

サーバー応答速度の改善

TTFB(Time To First Byte)を 200ms 以下に抑え、HTTP/2 または HTTP/3 を導入します。サーバーが高速に応答できれば、Googlebot は同じ時間内により多くのページをクロールできます。

さらに詳しく知りたい場合

Googlebot のクロールの仕組みを詳しく解説した記事では、IndexNow プロトコル、JavaScript レンダリングの対策など、実践的な対応方法を解説しています。

spotyou での活用

spotyou で生成する記事は、Googlebot と AI 検索エンジンの両方に最適化された構造で出力されます。冒頭定義文の配置、FAQ 構造の組み込み、構造化データに対応したコンテンツ設計により、Googlebot のクロールと AI の引用の両方で有利なコンテンツを効率的に制作できます。

さらにコンプライアンスチェック機能で情報の正確性を担保し、E-E-A-T の信頼性要件を満たすコンテンツ品質を確保します。

まとめ

  • Googlebot は Google が Web ページの情報を収集するクローラーで、HTML クロールとレンダリングの 2 段階でページを処理する
  • クロール頻度はページの更新頻度、サイトの権威性、サーバー応答速度、内部リンク構造など複数の要因で決まる
  • 2026 年現在、Googlebot と AI クローラーを区別して robots.txt で管理することが重要
  • JavaScript に依存するサイトでは SSR/SSG の導入がインデックス遅延の防止に有効
  • 構造化データの実装はリッチリザルト獲得と AI 引用の両方に効果がある

よくある質問

Q

Googlebotとは何ですか?

A

GoogleがWebページの情報を収集するために使用する自動プログラム(クローラー)です。Webサイトを巡回してページの内容を取得し、Googleの検索インデックスに登録する役割を担っています。

Q

GooglebotとAIクローラーの違いは何ですか?

A

Googlebotは検索インデックスの構築を目的としており、robots.txtを厳密に遵守します。一方、GPTBotやClaudeBot等のAIクローラーはLLMの学習データ収集を目的としており、収集した情報の使われ方が異なります。

Q

Googlebotのクロール頻度を上げるにはどうすればよいですか?

A

サーバーの応答速度を改善すること(TTFB 200ms以下)、XMLサイトマップを適切に設定すること、コンテンツを定期的に更新すること、内部リンク構造を最適化することが効果的です。

Q

Googlebotがアクセスできないとどうなりますか?

A

Googlebotがアクセスできないページは検索インデックスに登録されず、Google検索の結果に一切表示されません。robots.txtの設定ミスやサーバーエラーが原因になることが多いです。

Q

Googlebotはスマートフォン版で来ますか?

A

はい。2019年以降、Googlebotはモバイルファーストインデックスに基づき、主にスマートフォン版のGooglebot(Googlebot Smartphone)でクロールします。モバイル対応していないサイトはインデックスに不利になります。

関連用語

関連記事

SEO と AEO に最適化された記事を、AI で作成

spotyou は検索にもAI検索にも強い記事を自動生成します。無料で試してみませんか?

無料で試す