llms.txt
要約
Webサイトのルートディレクトリに配置するテキストファイルで、LLMに対してサイトの構造や主要コンテンツの概要を伝えるための仕組み。robots.txtのAI版として注目されている
llms.txt とは、Web サイトのルートディレクトリ(https://example.com/llms.txt)に配置するテキストファイルで、LLM(大規模言語モデル)に対してサイトの構造や主要コンテンツの概要を伝えるための仕組みです。robots.txt がクローラーにアクセス制御のルールを伝えるのと同様に、llms.txt は AI にサイトの全体像を効率的に伝える役割を担います。
2024 年に Jeremy Howard 氏が提唱し、2025 年以降急速に普及が進んでいます。AI 検索エンジンが Web 上の情報を収集・理解するプロセスにおいて、llms.txt はサイト運営者が AI に対して主体的に情報を提供する手段です。LLMO 対策として、構造化データと並ぶ技術的施策のひとつになりつつあります。
なぜ llms.txt が重要か
llms.txt が注目される背景には、AI の情報取得方法の課題があります。
LLM が Web から情報を取得する際、通常の Web クローラーと同様にページを巡回します。しかし、LLM のコンテキストウィンドウには限りがあり、サイト内のすべてのページを一度に処理することはできません。そのため、AI はサイトの一部しか認識できず、重要なコンテンツが見落とされる可能性があります。
llms.txt はこの課題に対するサイト運営者側の解決策です。サイトの主要コンテンツとその構造を 1 つのファイルにまとめて提供することで、AI がサイトの全体像を効率的に把握できるようにします。
| 課題 | llms.txt による解決 |
|---|---|
| AI がサイト全体を巡回しきれない | 主要コンテンツの URL と概要を一覧で提供 |
| サイト構造が AI に伝わらない | カテゴリ構造を明示して全体像を伝達 |
| 重要なコンテンツが見落とされる | 優先度の高いページを明示的に案内 |
| AI がコンテンツの文脈を誤解する | サイトの目的と対象読者を説明 |
| 更新頻度が AI に伝わらない | 最終更新日や更新パターンを記載可能 |
AI 検索のオプトアウトとオプトインの戦略でも解説していますが、AI 検索への対応は「拒否するか受け入れるか」の二択ではありません。llms.txt は AI に対して積極的にオプトインする具体的な方法です。オプトアウトを選ぶパブリッシャーがいる中で、llms.txt を設置してオプトインすることは、AI 検索での可視性を高める差別化要因になります。
llms.txt の仕様と構造
llms.txt は Markdown 形式で記述するテキストファイルです。ファイルの構造は以下のとおりです。
基本構造
llms.txt は次のセクションで構成されます。
| セクション | 必須/任意 | 内容 |
|---|---|---|
| タイトル(H1) | 必須 | サイト名またはプロジェクト名 |
| 概要段落 | 必須 | サイトの目的と内容の簡潔な説明 |
| セクション(H2) | 任意 | コンテンツのカテゴリ分類 |
| リンクリスト | 任意 | 各ページの URL と説明 |
| Optional セクション | 任意 | 詳細ドキュメントへのリンク |
llms-full.txt との違い
llms.txt には、簡易版の llms.txt と詳細版の llms-full.txt の 2 種類があります。
llms.txt はサイトの概要と主要ページの一覧を簡潔にまとめたファイルです。LLM のコンテキストウィンドウを圧迫しないよう、コンパクトに設計します。
llms-full.txt はより詳細な情報を含むファイルで、各ページの全文やより詳しい説明を記載できます。コンテキストウィンドウに余裕がある LLM や、詳細な情報を必要とする用途で参照されます。
まずは llms.txt の作成から始め、必要に応じて llms-full.txt を追加するのが実践的です。
llms.txt は Markdown 形式で記述しますが、複雑な Markdown 構文は避けてシンプルに記述します。LLM が効率的にパースできることが最優先です。リンクは - [ページタイトル](URL): 説明文 の形式で統一します。
llms.txt の書き方
llms.txt を実際に作成する際のポイントを解説します。
1. サイトの目的を明確に記述する
ファイルの冒頭でサイトの目的、対象読者、提供する価値を 1〜2 段落で簡潔に説明します。AI がサイト全体の文脈を理解するための最も重要な情報です。「何のサイトか」「誰に向けたサイトか」「どのような情報があるか」を明示します。
2. 主要ページを厳選する
すべてのページを列挙するのではなく、AI に認識してほしい主要なページを厳選して記載します。10〜30 ページ程度が目安です。各ページには URL と 1 行の説明文を付けます。説明文はそのページの核心を伝える内容にします。
3. カテゴリ構造を反映する
サイトのコンテンツをカテゴリ別に整理して記載します。H2 見出しでカテゴリを区切り、その下に該当ページを列挙します。AI がサイトのトピック構造を理解しやすくなり、関連コンテンツ間の関係性も伝わります。
4. 定期的に更新する
新しいコンテンツを公開した際や、サイト構造を変更した際には llms.txt も更新します。古い情報が残っていると、AI がサイトの現状を正確に把握できなくなります。CMS との連動で自動更新する仕組みを構築するのが理想的です。
llms.txt と他の AI 対応技術の比較
llms.txt は AI 検索への対応技術の 1 つですが、他の技術と組み合わせることで効果が最大化されます。
| 技術 | 役割 | 対象 | llms.txt との関係 |
|---|---|---|---|
| robots.txt | クローラーのアクセス制御 | 検索エンジンクローラー | 補完関係(制御 vs 案内) |
| sitemap.xml | ページの URL 一覧 | 検索エンジンクローラー | 補完関係(URL 一覧 vs コンテンツ概要) |
| 構造化データ | ページ内容の意味づけ | 検索エンジン、AI | 補完関係(ページ単位 vs サイト単位) |
| llms.txt | サイトの構造と概要 | LLM | サイト全体の案内役 |
構造化データがページ単位の意味づけを行うのに対し、llms.txt はサイト全体の構造と概要を提供します。両者を組み合わせることで、AI はサイトの全体像(llms.txt)と個別ページの詳細(構造化データ)の両方を把握できます。
Googlebot のクロールの仕組みでも解説されていますが、クローラーがサイトを効率的に巡回するための技術(robots.txt、sitemap.xml)と、AI がコンテンツを理解するための技術(構造化データ、llms.txt)は、それぞれ異なるレイヤーで機能します。
llms.txt の設置は、robots.txt や sitemap.xml と同様にサイトのルートディレクトリにファイルを 1 つ追加するだけです。技術的なハードルは低く、即日対応可能な施策です。まずシンプルな内容で作成し、AI の反応を見ながら内容を充実させていくアプローチが実践的です。
llms.txt の導入状況
2026 年時点で、llms.txt の導入は急速に拡大しています。
技術系メディア、SaaS プロダクト、開発者向けドキュメントサイトを中心に導入が進んでおり、特に AI 関連サービスでの採用率が高い傾向にあります。大手 CMS プラットフォームでは llms.txt の自動生成機能を提供するプラグインも登場しています。
ただし、すべての AI サービスが llms.txt を参照するわけではありません。対応状況はサービスごとに異なり、仕様の標準化も進行中です。それでも、llms.txt の設置コストは極めて低い(テキストファイル 1 つの追加)ため、対応する AI サービスが増えた際にすぐ効果を得られるよう、早期に設置しておくことが推奨されます。
AEO の観点では、llms.txt は「AI に選ばれる」ための能動的なアプローチです。AI がサイトを巡回してくるのを待つのではなく、こちらから AI に情報を提供するという発想は、AI 検索時代のコンテンツ戦略の基本姿勢と合致します。
spotyou での活用
spotyou では、ユーザーのサイトに合わせた llms.txt の設計をコンテンツ戦略の一環として支援します。記事生成時に各ページの概要を自動的に生成し、llms.txt に反映できる形式で出力します。
サイトの主要コンテンツが AI に正確に認識されることは、個々の記事が引用される前提条件です。LLMO 対策として記事の品質を高めても、AI がそもそもサイトの存在を認識していなければ意味がありません。llms.txt はその前提条件を整える基盤施策です。
まとめ
- llms.txt はサイトのルートディレクトリに配置するテキストファイルで、LLM にサイトの構造と概要を伝える仕組み
- robots.txt がアクセス制御、sitemap.xml が URL 一覧を提供するのに対し、llms.txt はコンテンツの概要と構造を提供する
- Markdown 形式で記述し、サイト名、概要、主要ページの URL と説明をカテゴリ別に整理する
- 構造化データとの併用で、サイト全体の案内(llms.txt)と個別ページの詳細(構造化データ)の両方を AI に提供できる
- 設置コストが低く即日対応可能なため、早期に設置して AI 検索への対応を始めるのが実践的
よくある質問
llms.txtとは何ですか?
Webサイトのルートディレクトリに配置するテキストファイルで、LLM(大規模言語モデル)に対してサイトの構造や主要コンテンツの概要を伝えるための仕組みです。robots.txtがクローラーにアクセス制御を伝えるのと同様に、llms.txtはAIにサイトの全体像を効率的に伝えます。
llms.txtとrobots.txtの違いは何ですか?
robots.txtはクローラーにアクセスの許可・禁止を伝えるファイルです。llms.txtはLLMにサイトの構造や主要コンテンツの概要を伝えるファイルです。robots.txtが「どこにアクセスしてよいか」を制御するのに対し、llms.txtは「何が重要なコンテンツか」を案内します。
llms.txtはすべてのAIに対応していますか?
2026年時点では、すべてのAIがllms.txtを参照するわけではありません。対応状況はサービスによって異なります。ただし、llms.txtの仕様策定が進んでおり、今後対応するAIサービスが増加すると予想されています。早期に設置しておくことで、対応開始時にすぐ効果が得られます。
llms.txtにはどのような内容を記載しますか?
サイト名と概要、主要ページのURLとその説明、コンテンツのカテゴリ構造、オプションで詳細ドキュメントへのリンクを記載します。Markdown形式で記述し、LLMが効率的にサイトの全体像を把握できるようにします。
小規模なサイトでもllms.txtは必要ですか?
小規模サイトほど効果が大きい場合があります。大規模サイトはすでに多くのページがクロール・インデックスされていますが、小規模サイトはAIに認識されていないページが多い可能性があります。llms.txtで主要コンテンツを明示することで、AIに効率的にサイトの価値を伝えられます。