- Ce que c'est : un fichier texte placé à la racine d'un site (
/llms.txt), proposé fin 2024 par Jeremy Howard (Answer.AI), censé offrir aux IA un plan lisible et hiérarchisé du contenu d'un site. - L'adoption : elle reste marginale. Selon une étude SERanking de novembre 2025 portant sur près de 300 000 domaines, 10,13 % seulement disposent d'un llms.txt, avec un taux quasi identique quel que soit le trafic du site.
- L'effet mesuré : à ce jour, rien ne montre qu'avoir un llms.txt améliore les citations par ChatGPT, Gemini, Claude ou Perplexity. Les logs serveurs montrent que les robots IA ne le demandent quasiment jamais.
- La position de Google : John Mueller le compare à la balise meta keywords abandonnée, et indique que Google ne s'en sert pas. Mon verdict : ce n'est pas nuisible, mais en faire une priorité GEO me paraît une erreur d'allocation.
Le fichier llms.txt revient sans cesse dans les discussions GEO, souvent présenté comme « le robots.txt des IA » qu'il faudrait absolument mettre en place pour être visible dans ChatGPT ou les AI Overviews. La réalité, à la lumière des données disponibles à la mi-2026, est plus nuancée. Faisons le point honnêtement : ce que c'est, ce que ça fait vraiment, et s'il faut y consacrer du temps.
Qu'est-ce que llms.txt, concrètement ?
llms.txt est une proposition de standard ouvert, lancée en septembre 2024 par Jeremy Howard, cofondateur d'Answer.AI et figure connue du machine learning. L'idée : placer à la racine d'un site un fichier au format Markdown qui résume et hiérarchise son contenu pour les modèles de langage, de la même façon que robots.txt donne des instructions aux robots d'indexation classiques.
Le format prévoit un titre, une courte description du site, puis des listes de liens annotés vers les pages jugées importantes. L'intention de départ est louable : aider les IA, dont la fenêtre de contexte est limitée, à trouver l'information essentielle sans avoir à parser tout le HTML d'un site.
robots.txt est un standard respecté depuis des décennies, que les crawlers consultent réellement. llms.txt est une proposition récente qu'aucun grand fournisseur d'IA n'a officiellement adoptée comme signal. Le nom évoque une autorité que le fichier n'a pas (encore) dans les faits.
L'adoption réelle : faible et plate
C'est le premier point factuel important. L'étude la plus solide à ce jour vient de SERanking (novembre 2025), qui a analysé près de 300 000 domaines.
Adoption de llms.txt par niveau de trafic
Part des domaines disposant d'un fichier llms.txt · SERanking, novembre 2025, ~300 000 domaines
Deux enseignements. D'abord, l'adoption globale tourne autour de 10 %, ce qui reste faible pour un fichier présenté comme indispensable. Ensuite, et c'est plus parlant : les gros sites à fort trafic ne l'adoptent pas davantage que les petits, ils l'adoptent même légèrement moins. Si llms.txt apportait un avantage clair, on s'attendrait à le voir massivement chez les sites les plus avancés en SEO. Ce n'est pas le cas.
L'effet sur les citations : quasi nul à ce jour
Le point décisif. Avoir un llms.txt change-t-il vos chances d'être cité par une IA ? Les données disponibles disent non, ou très peu.
- Les robots IA ne le lisent quasiment pas. L'analyse de logs serveurs de SERanking montre que les crawlers d'OpenAI, Google et Anthropic ne demandent pratiquement jamais le fichier. Sur des dizaines de milliers de visites de robots IA observées, l'accès au llms.txt est négligeable.
- Les tests contrôlés ne trouvent pas d'effet. L'expérience publiée par Otterly AI sur la mise en place d'un llms.txt ne met pas en évidence de gain mesurable de visibilité dans les réponses IA.
- Aucun fournisseur ne l'utilise comme signal déclaré. Ni OpenAI, ni Anthropic, ni Google n'ont annoncé prendre llms.txt en compte pour sélectionner ou citer des sources.
Ce qu'en dit Google
La position de Google est l'une des plus claires du marché. John Mueller, de l'équipe Search, a comparé publiquement llms.txt à la balise meta keywords, abandonnée depuis longtemps parce qu'elle laissait le site déclarer lui-même de quoi il parlait, sans vérification possible. Interrogé sur le fait de savoir si Google utilisait llms.txt, sa réponse a été directement négative.
La logique de fond est solide : un fichier que le propriétaire du site rédige lui-même, sans contrôle externe, est un signal facile à manipuler. Les moteurs, qu'ils soient classiques ou génératifs, ont appris à se méfier des déclarations auto-proclamées et à privilégier des signaux qu'ils peuvent vérifier (le contenu réel, les mentions tierces, l'autorité observée).
Une remarque honnête sur la fiabilité de la source : les communicants de Google ont déjà, par le passé, entretenu un certain flou sur le SEO, parfois de façon assez stratégique pour ne pas donner d'avantage aux référenceurs. Donc je ne prends jamais une déclaration de Google pour argent comptant par principe. Mais sur ce point précis, je crois Mueller. La comparaison avec la balise meta keywords est techniquement juste, elle est cohérente avec la doctrine constante de Google sur les signaux auto-déclarés, et surtout elle est corroborée par des données indépendantes : l'adoption faible, l'absence d'effet mesuré, les logs qui montrent que les robots ne lisent pas le fichier. Quand le discours officiel et les chiffres tiers pointent dans la même direction, l'argument me paraît fiable.
Mon verdict : pas nuisible, mais pas une priorité
En synthèse, voici comment je situerais llms.txt dans une stratégie GEO en 2026.
| Question | Réponse à la mi-2026 |
|---|---|
| Est-ce que ça aide à être cité ? | Aucun effet démontré à ce jour |
| Est-ce que ça peut nuire ? | Non, sauf à y exposer des URL sensibles |
| Est-ce que les IA le lisent ? | Quasiment pas, selon les logs |
| Faut-il en faire une priorité ? | Non. À réserver aux sites qui ont déjà tout le reste |
Concrètement : si vous avez dix heures à investir dans le GEO ce mois-ci, mettre en place un llms.txt n'est pas le meilleur usage de ce temps. Les leviers à effet démontré sont ailleurs : la structure et le front-loading du contenu, les citations d'experts, les statistiques sourcées, le brand search volume et les mentions sur plateformes tierces.
Si vous tenez à en créer un (par curiosité, ou parce que votre CMS le génère automatiquement), aucun problème : vérifiez simplement qu'il ne liste pas d'URL que vous préférez garder discrètes, et passez à des chantiers plus rentables. C'est un « pourquoi pas », pas un « il faut absolument ».
Sources
- llmstxt.org - la proposition de standard originale (Jeremy Howard, Answer.AI, septembre 2024).
- SERanking · LLMs.txt: Why Brands Rely On It and Why It Doesn't Work - étude sur ~300 000 domaines (10,13 % d'adoption) et analyse des logs serveurs (novembre 2025).
- Otterly AI · The llms.txt experiment - test de l'effet d'un llms.txt sur la visibilité IA.
- Search Engine Roundtable · Google Search Team Does Not Endorse LLMs.txt Files - la position de John Mueller (comparaison avec la balise meta keywords).
- Étude GEO-SFE - la structure du contenu, elle, a un effet mesuré sur les citations.
- Guide front-loading - placer l'essentiel en tête de contenu.
- Comment Google AIO choisit ses sources - pourquoi Google privilégie les signaux vérifiables.
- Glossaire GEO - les termes techniques expliqués.
- Toutes les études GEO du site