llms.txt : faut-il vraiment en créer un pour le GEO en 2026 ?

Ce que c'est : un fichier texte placé à la racine d'un site (/llms.txt), proposé fin 2024 par Jeremy Howard (Answer.AI), censé offrir aux IA un plan lisible et hiérarchisé du contenu d'un site.
L'adoption : elle reste marginale. Selon une étude SERanking de novembre 2025 portant sur près de 300 000 domaines, 10,13 % seulement disposent d'un llms.txt, avec un taux quasi identique quel que soit le trafic du site.
L'effet mesuré : à ce jour, rien ne montre qu'avoir un llms.txt améliore les citations par ChatGPT, Gemini, Claude ou Perplexity. Les logs serveurs montrent que les robots IA ne le demandent quasiment jamais.
La position de Google : John Mueller le compare à la balise meta keywords abandonnée, et indique que le moteur de recherche ne s'en sert pas. Nuance de mi-2026 : l'outil de Google lui-même, PageSpeed Insights, audite pourtant le llms.txt dans sa nouvelle catégorie « Navigation agentique ». Deux usages différents, pas une contradiction.
Mon verdict : ce n'est pas nuisible, ça ne fait pas être cité, mais c'est en train de devenir une case à cocher du web agentique. À la mi-2026, en créer un propre devient un « pourquoi pas » un peu plus légitime qu'avant, sans jamais passer avant les leviers à effet démontré.

Le fichier llms.txt revient sans cesse dans les discussions GEO, souvent présenté comme « le robots.txt des IA » qu'il faudrait absolument mettre en place pour être visible dans ChatGPT ou les AI Overviews. La réalité, à la lumière des données disponibles à la mi-2026, est plus nuancée. Faisons le point honnêtement : ce que c'est, ce que ça fait vraiment, et s'il faut y consacrer du temps.

Qu'est-ce que llms.txt, concrètement ?

llms.txt est une proposition de standard ouvert, lancée en septembre 2024 par Jeremy Howard, cofondateur d'Answer.AI et figure connue du machine learning. L'idée : placer à la racine d'un site un fichier au format Markdown qui résume et hiérarchise son contenu pour les modèles de langage, de la même façon que robots.txt donne des instructions aux robots d'indexation classiques.

Le format prévoit un titre, une courte description du site, puis des listes de liens annotés vers les pages jugées importantes. L'intention de départ est louable : aider les IA, dont la fenêtre de contexte est limitée, à trouver l'information essentielle sans avoir à parser tout le HTML d'un site.

llms.txt n'est pas robots.txt. La comparaison est trompeuse. robots.txt est un standard respecté depuis des décennies, que les crawlers consultent réellement. llms.txt est une proposition récente qu'aucun grand fournisseur d'IA n'a officiellement adoptée comme signal. Le nom évoque une autorité que le fichier n'a pas (encore) dans les faits.

L'adoption réelle : faible et plate

C'est le premier point factuel important. L'étude la plus solide à ce jour vient de SERanking (novembre 2025), qui a analysé près de 300 000 domaines.

Adoption de llms.txt par niveau de trafic

Part des domaines disposant d'un fichier llms.txt | SERanking, novembre 2025, ~300 000 domaines

Faible trafic 9,88 %
Trafic moyen 10,54 %
Fort trafic 8,27 %

Deux enseignements. D'abord, l'adoption globale tourne autour de 10 %, ce qui reste faible pour un fichier présenté comme indispensable. Ensuite, et c'est plus parlant : les gros sites à fort trafic ne l'adoptent pas davantage que les petits, ils l'adoptent même légèrement moins. Si llms.txt apportait un avantage clair, on s'attendrait à le voir massivement chez les sites les plus avancés en SEO. Ce n'est pas le cas.

L'effet sur les citations : quasi nul à ce jour

Le point décisif. Avoir un llms.txt change-t-il vos chances d'être cité par une IA ? Les données disponibles disent non, ou très peu.

Les robots IA ne le lisent quasiment pas. L'analyse de logs serveurs de SERanking montre que les crawlers d'OpenAI, Google et Anthropic ne demandent pratiquement jamais le fichier. Sur des dizaines de milliers de visites de robots IA observées, l'accès au llms.txt est négligeable.
Les tests contrôlés ne trouvent pas d'effet. L'expérience publiée par Otterly AI sur la mise en place d'un llms.txt ne met pas en évidence de gain mesurable de visibilité dans les réponses IA.
Aucun fournisseur ne l'utilise comme signal déclaré. Ni OpenAI, ni Anthropic, ni Google n'ont annoncé prendre llms.txt en compte pour sélectionner ou citer des sources.

Honnêteté sur le flou. « Aucun effet mesuré aujourd'hui » ne veut pas dire « aucun effet possible demain ». Le standard pourrait être adopté par un acteur majeur à l'avenir, ce qui changerait la donne. On documente l'état des connaissances à la mi-2026, pas une vérité définitive. Le GEO bouge vite, cette page est datée pour cette raison.

Ce qu'en dit Google

La position de Google est l'une des plus claires du marché. John Mueller, de l'équipe Search, a comparé publiquement llms.txt à la balise meta keywords, abandonnée depuis longtemps parce qu'elle laissait le site déclarer lui-même de quoi il parlait, sans vérification possible. Interrogé sur le fait de savoir si Google utilisait llms.txt, sa réponse a été directement négative.

La logique de fond est solide : un fichier que le propriétaire du site rédige lui-même, sans contrôle externe, est un signal facile à manipuler. Les moteurs, qu'ils soient classiques ou génératifs, ont appris à se méfier des déclarations auto-proclamées et à privilégier des signaux qu'ils peuvent vérifier (le contenu réel, les mentions tierces, l'autorité observée).

Une remarque honnête sur la fiabilité de la source : les communicants de Google ont déjà, par le passé, entretenu un certain flou sur le SEO, parfois de façon assez stratégique pour ne pas donner d'avantage aux référenceurs. Donc je ne prends jamais une déclaration de Google pour argent comptant par principe. Mais sur ce point précis, je crois Mueller. La comparaison avec la balise meta keywords est techniquement juste, elle est cohérente avec la doctrine constante de Google sur les signaux auto-déclarés, et surtout elle est corroborée par des données indépendantes : l'adoption faible, l'absence d'effet mesuré, les logs qui montrent que les robots ne lisent pas le fichier. Quand le discours officiel et les chiffres tiers pointent dans la même direction, l'argument me paraît fiable.

Le paradoxe de mi-2026 : l'outil de Google, lui, vérifie le llms.txt

Voici le détail qui trouble le message « Google ne s'en sert pas », et qui mérite d'être posé honnêtement. Depuis 2026, PageSpeed Insights (l'outil d'audit public de Google, adossé à Lighthouse) affiche une nouvelle catégorie expérimentale baptisée « Navigation agentique ». Parmi ses vérifications : un audit intitulé « llms.txt suit les recommandations ». Le libellé exact précise que si le fichier ne suit pas les recommandations, « les grands modèles de langage ne comprennent pas comment votre site doit être exploré ou utilisé pour l'entraînement », et qu'il doit être « un fichier Markdown contenant au moins un en-tête H1 ».

Alors, Google se contredit-il ? Non, et c'est le point important à comprendre. Il faut distinguer deux usages qui n'ont rien à voir :

La sélection de sources pour répondre à une requête (ce qui nous intéresse en GEO : être cité dans une réponse IA ou un AI Overview). Là, le llms.txt ne compte pas, et c'est ce dont parle John Mueller.
La navigation agentique (des agents IA qui parcourent et agissent sur votre site : réserver, acheter, extraire une information pour un utilisateur). C'est un chantier émergent, lié à des standards comme WebMCP, et c'est ce que mesure la nouvelle catégorie de PageSpeed Insights. Dans ce contexte, un llms.txt bien formé est traité comme une recommandation.

Statut de l'audit : « non noté ». Dans PageSpeed Insights, cette catégorie est explicitement présentée comme « encore en cours de développement et susceptible d'être modifiée », et l'audit llms.txt est marqué « non noté » : il n'entre pas dans un score, il informe. Ce n'est donc pas un facteur de classement. Mais c'est un signal faible et concret que le fichier gagne une utilité côté web agentique, là où il n'en avait aucune côté citations.

La lecture juste, à la mi-2026 : le llms.txt ne vous fera pas citer davantage aujourd'hui, mais il entre dans la check-list du web agentique que Google commence à outiller. C'est précisément pour ça qu'en créer un propre, une fois, coûte peu et couvre l'avenir.

Mon verdict : pas nuisible, et désormais une case à cocher du web agentique

En synthèse, voici comment je situerais llms.txt dans une stratégie GEO en 2026.

Question	Réponse à la mi-2026
Est-ce que ça aide à être cité ?	Aucun effet démontré à ce jour
Est-ce que ça peut nuire ?	Non, sauf à y exposer des URL sensibles
Est-ce que les IA le lisent ?	Quasiment pas pour citer, selon les logs
Est-ce utile pour le web agentique ?	Oui, recommandation naissante (audit PageSpeed Insights)
Faut-il en faire une priorité GEO ?	Non. Mais en créer un propre, une fois, se justifie

Concrètement : si vous avez dix heures à investir dans le GEO ce mois-ci, mettre en place un llms.txt n'est pas le meilleur usage de ce temps. Les leviers à effet démontré sont ailleurs : la structure et le front-loading du contenu, les citations d'experts, les statistiques sourcées, le brand search volume et les mentions sur plateformes tierces.

Si vous voulez en créer un, allez-y : vérifiez simplement qu'il respecte le format (Markdown, un en-tête H1, des liens annotés), qu'il ne liste pas d'URL que vous préférez garder discrètes, puis passez à des chantiers plus rentables. C'est exactement ce qu'on a fait ici : ce site a désormais son propre llms.txt, propre et à jour, parce que le coût est nul et qu'il coche la case du web agentique. Ce n'est pas un « il faut absolument pour être cité », c'est un « autant le faire bien une fois ».

Cas particulier : la documentation technique. Le seul contexte où llms.txt semble avoir un intérêt pratique réel est celui des sites de documentation pour développeurs, où des assistants de code consomment directement les fichiers indiqués. C'est un usage de niche, très différent de l'objectif « être cité dans les réponses grand public » qui intéresse la plupart des lecteurs de ce site.

Sources

llmstxt.org - la proposition de standard originale (Jeremy Howard, Answer.AI, septembre 2024).
SERanking | LLMs.txt: Why Brands Rely On It and Why It Doesn't Work - étude sur ~300 000 domaines (10,13 % d'adoption) et analyse des logs serveurs (novembre 2025).
Otterly AI | The llms.txt experiment - test de l'effet d'un llms.txt sur la visibilité IA.
Search Engine Roundtable | Google Search Team Does Not Endorse LLMs.txt Files - la position de John Mueller (comparaison avec la balise meta keywords).
Google PageSpeed Insights - catégorie expérimentale « Navigation agentique », qui inclut l'audit « llms.txt suit les recommandations » (non noté, en cours de développement).

Pour aller plus loin sur le site :

Étude GEO-SFE - la structure du contenu, elle, a un effet mesuré sur les citations.
Guide front-loading - placer l'essentiel en tête de contenu.
Comment Google AIO choisit ses sources - pourquoi Google privilégie les signaux vérifiables.
Glossaire GEO - les termes techniques expliqués.
Toutes les études GEO du site

llms.txt : faut-il vraiment en créer un pour le GEO ?