[1] llm-geo.fr
veille en direct FR / EN

Guide pratiquellms.txtMai 2026

llms.txt : faut-il vraiment en créer un pour le GEO ?

Mise à jour : 21 mai 2026 Sources : spec llmstxt.org, SERanking, Otterly, Google / John Mueller Lecture : ~9 min
  • Ce que c'est : un fichier texte placé à la racine d'un site (/llms.txt), proposé fin 2024 par Jeremy Howard (Answer.AI), censé offrir aux IA un plan lisible et hiérarchisé du contenu d'un site.
  • L'adoption : elle reste marginale. Selon une étude SERanking de novembre 2025 portant sur près de 300 000 domaines, 10,13 % seulement disposent d'un llms.txt, avec un taux quasi identique quel que soit le trafic du site.
  • L'effet mesuré : à ce jour, rien ne montre qu'avoir un llms.txt améliore les citations par ChatGPT, Gemini, Claude ou Perplexity. Les logs serveurs montrent que les robots IA ne le demandent quasiment jamais.
  • La position de Google : John Mueller le compare à la balise meta keywords abandonnée, et indique que Google ne s'en sert pas. Mon verdict : ce n'est pas nuisible, mais en faire une priorité GEO me paraît une erreur d'allocation.

Le fichier llms.txt revient sans cesse dans les discussions GEO, souvent présenté comme « le robots.txt des IA » qu'il faudrait absolument mettre en place pour être visible dans ChatGPT ou les AI Overviews. La réalité, à la lumière des données disponibles à la mi-2026, est plus nuancée. Faisons le point honnêtement : ce que c'est, ce que ça fait vraiment, et s'il faut y consacrer du temps.

Qu'est-ce que llms.txt, concrètement ?

llms.txt est une proposition de standard ouvert, lancée en septembre 2024 par Jeremy Howard, cofondateur d'Answer.AI et figure connue du machine learning. L'idée : placer à la racine d'un site un fichier au format Markdown qui résume et hiérarchise son contenu pour les modèles de langage, de la même façon que robots.txt donne des instructions aux robots d'indexation classiques.

Le format prévoit un titre, une courte description du site, puis des listes de liens annotés vers les pages jugées importantes. L'intention de départ est louable : aider les IA, dont la fenêtre de contexte est limitée, à trouver l'information essentielle sans avoir à parser tout le HTML d'un site.

llms.txt n'est pas robots.txt. La comparaison est trompeuse. robots.txt est un standard respecté depuis des décennies, que les crawlers consultent réellement. llms.txt est une proposition récente qu'aucun grand fournisseur d'IA n'a officiellement adoptée comme signal. Le nom évoque une autorité que le fichier n'a pas (encore) dans les faits.

L'adoption réelle : faible et plate

C'est le premier point factuel important. L'étude la plus solide à ce jour vient de SERanking (novembre 2025), qui a analysé près de 300 000 domaines.

Adoption de llms.txt par niveau de trafic

Part des domaines disposant d'un fichier llms.txt · SERanking, novembre 2025, ~300 000 domaines

  • Faible trafic 9,88 %
  • Trafic moyen 10,54 %
  • Fort trafic 8,27 %

Deux enseignements. D'abord, l'adoption globale tourne autour de 10 %, ce qui reste faible pour un fichier présenté comme indispensable. Ensuite, et c'est plus parlant : les gros sites à fort trafic ne l'adoptent pas davantage que les petits, ils l'adoptent même légèrement moins. Si llms.txt apportait un avantage clair, on s'attendrait à le voir massivement chez les sites les plus avancés en SEO. Ce n'est pas le cas.

L'effet sur les citations : quasi nul à ce jour

Le point décisif. Avoir un llms.txt change-t-il vos chances d'être cité par une IA ? Les données disponibles disent non, ou très peu.

  • Les robots IA ne le lisent quasiment pas. L'analyse de logs serveurs de SERanking montre que les crawlers d'OpenAI, Google et Anthropic ne demandent pratiquement jamais le fichier. Sur des dizaines de milliers de visites de robots IA observées, l'accès au llms.txt est négligeable.
  • Les tests contrôlés ne trouvent pas d'effet. L'expérience publiée par Otterly AI sur la mise en place d'un llms.txt ne met pas en évidence de gain mesurable de visibilité dans les réponses IA.
  • Aucun fournisseur ne l'utilise comme signal déclaré. Ni OpenAI, ni Anthropic, ni Google n'ont annoncé prendre llms.txt en compte pour sélectionner ou citer des sources.
Honnêteté sur le flou. « Aucun effet mesuré aujourd'hui » ne veut pas dire « aucun effet possible demain ». Le standard pourrait être adopté par un acteur majeur à l'avenir, ce qui changerait la donne. On documente l'état des connaissances à la mi-2026, pas une vérité définitive. Le GEO bouge vite, cette page est datée pour cette raison.

Ce qu'en dit Google

La position de Google est l'une des plus claires du marché. John Mueller, de l'équipe Search, a comparé publiquement llms.txt à la balise meta keywords, abandonnée depuis longtemps parce qu'elle laissait le site déclarer lui-même de quoi il parlait, sans vérification possible. Interrogé sur le fait de savoir si Google utilisait llms.txt, sa réponse a été directement négative.

La logique de fond est solide : un fichier que le propriétaire du site rédige lui-même, sans contrôle externe, est un signal facile à manipuler. Les moteurs, qu'ils soient classiques ou génératifs, ont appris à se méfier des déclarations auto-proclamées et à privilégier des signaux qu'ils peuvent vérifier (le contenu réel, les mentions tierces, l'autorité observée).

Une remarque honnête sur la fiabilité de la source : les communicants de Google ont déjà, par le passé, entretenu un certain flou sur le SEO, parfois de façon assez stratégique pour ne pas donner d'avantage aux référenceurs. Donc je ne prends jamais une déclaration de Google pour argent comptant par principe. Mais sur ce point précis, je crois Mueller. La comparaison avec la balise meta keywords est techniquement juste, elle est cohérente avec la doctrine constante de Google sur les signaux auto-déclarés, et surtout elle est corroborée par des données indépendantes : l'adoption faible, l'absence d'effet mesuré, les logs qui montrent que les robots ne lisent pas le fichier. Quand le discours officiel et les chiffres tiers pointent dans la même direction, l'argument me paraît fiable.

Mon verdict : pas nuisible, mais pas une priorité

En synthèse, voici comment je situerais llms.txt dans une stratégie GEO en 2026.

Question Réponse à la mi-2026
Est-ce que ça aide à être cité ? Aucun effet démontré à ce jour
Est-ce que ça peut nuire ? Non, sauf à y exposer des URL sensibles
Est-ce que les IA le lisent ? Quasiment pas, selon les logs
Faut-il en faire une priorité ? Non. À réserver aux sites qui ont déjà tout le reste

Concrètement : si vous avez dix heures à investir dans le GEO ce mois-ci, mettre en place un llms.txt n'est pas le meilleur usage de ce temps. Les leviers à effet démontré sont ailleurs : la structure et le front-loading du contenu, les citations d'experts, les statistiques sourcées, le brand search volume et les mentions sur plateformes tierces.

Si vous tenez à en créer un (par curiosité, ou parce que votre CMS le génère automatiquement), aucun problème : vérifiez simplement qu'il ne liste pas d'URL que vous préférez garder discrètes, et passez à des chantiers plus rentables. C'est un « pourquoi pas », pas un « il faut absolument ».

Cas particulier : la documentation technique. Le seul contexte où llms.txt semble avoir un intérêt pratique réel est celui des sites de documentation pour développeurs, où des assistants de code consomment directement les fichiers indiqués. C'est un usage de niche, très différent de l'objectif « être cité dans les réponses grand public » qui intéresse la plupart des lecteurs de ce site.

Sources

Pour aller plus loin sur le site :