[1] llm-geo.fr
veille en direct FR / EN

RéférenceTerminologie GEO & LLMAvril 2026

Glossaire GEO : RAG, grounding, AIO, answer share - 25 termes définis

Mise à jour : 29.04.2026 25 termes · classement alphabétique Lecture : ~10 min
À qui sert ce glossaire
  • Le vocabulaire du GEO mélange des termes SEO classiques, du jargon ML (machine learning) et des néologismes marketing. Certains termes sont utilisés de façon interchangeable alors qu'ils désignent des choses différentes (GEO vs AEO, grounding vs RAG).
  • Ce glossaire définit chaque terme avec précision, signale les usages ambigus, et renvoie vers les pages du site où le concept est appliqué concrètement.

A

AEO - Answer Engine Optimization
Ensemble des techniques visant à faire apparaître un contenu dans les réponses directes des moteurs IA, indépendamment de son positionnement organique. L'AEO se concentre sur la structuration des contenus en fragments de réponse autonomes (question en H2, réponse courte en premier paragraphe, schema FAQ). Souvent utilisé comme synonyme de GEO - à tort : l'AEO désigne plus spécifiquement l'optimisation pour les extraits de réponse, là où le GEO englobe l'ensemble de la visibilité dans les LLMs.
AIO - AI Overviews
Fonctionnalité de Google Search qui affiche une synthèse générée par IA en haut de la page de résultats, avant les résultats organiques classiques. Lancée en mai 2024 aux États-Unis, progressivement déployée en Europe. Les AIO s'appuient sur un modèle LLM interne à Google et citent des sources depuis l'index Google - avec un overlap de 54,5 % avec les résultats organiques selon BrightEdge. À ne pas confondre avec Google AI Mode (interface conversationnelle distincte, déploiement séparé).
Answer Share
Aussi appelé Mention Rate. Pourcentage des requêtes suivies (sur un ensemble de prompts définis) où un domaine ou une marque est explicitement cité dans la réponse d'un LLM. C'est le KPI central des outils de tracking GEO (Peec.ai, Otterly, AthenaHQ). Dépend fortement de la liste de prompts choisie - deux outils mesurant le même site sur des prompts différents donneront des Answer Share très différents. Voir : outils de tracking GEO.

B

Brand Search Lift
Hausse mesurée des recherches brandées (nom de marque, domaine) dans Google Search Console, utilisée comme proxy indirect de la visibilité dans les LLMs. Le raisonnement : un utilisateur qui voit une marque citée dans une réponse IA mais ne clique pas peut rechercher le nom de la marque dans Google plus tard. MaximusLabs mesure une corrélation de 0,334 entre volume de recherches branded et citations LLM. C'est le KPI business le plus accessible sans outil de tracking dédié. Voir : mesurer sa visibilité IA.

C

Chunking
Découpage d'un document en fragments (chunks) pour l'indexation dans une base vectorielle. Un système RAG ne stocke pas les documents entiers - il les découpe en segments de 200 à 500 tokens, chacun vectorisé séparément. La taille et la méthode de découpage (par phrase, par paragraphe, par section sémantique) influencent directement quels passages seront retrouvés lors d'une requête. Pour un rédacteur GEO, le chunking implicite que fait un LLM sur votre contenu favorise les paragraphes courts, autonomes et factuellement denses.
Citation Bias
Tendance d'un LLM à sur-représenter certains types de sources dans ses réponses indépendamment de leur qualité réelle. Exemples documentés : ChatGPT sur-cite Wikipedia (47,9 % selon Digital Bloom), Perplexity sur-cite Reddit (46,7 %), Gemini sur-cite les sites de marques (52,15 % selon Yext). Ce biais n'est pas délibéré - il reflète la composition du corpus d'entraînement et la stratégie de grounding de chaque modèle. Voir : top domaines cités par les IA.

D

Dark Traffic IA
Trafic généré indirectement par une citation dans une réponse LLM, mais non attribué à un canal IA dans GA4. Il prend plusieurs formes : copier-coller d'URL (arrive en Direct), recherche branded différée (arrive en Organic/Google sur une requête de marque), clic depuis l'app mobile (referrer supprimé). C'est l'angle mort principal de la mesure GEO. Estimation : le dark traffic IA représente plusieurs fois le trafic referral IA visible dans GA4. Voir : mesurer sa visibilité IA.
Dynamic Retrieval
Mécanisme de Gemini (Google) qui décide dynamiquement, pour chaque requête, si une recherche web en temps réel est nécessaire ou si les données d'entraînement suffisent. Paramétrable via l'API Google AI avec un seuil de confiance (défaut : 0,7). En dessous du seuil, Gemini répond depuis ses poids. Au-dessus, il effectue un grounding via Google Search. Crucial pour comprendre pourquoi Gemini ne cite pas les mêmes sources selon le type de requête. Voir : comment Gemini choisit ses sources.

E

E-E-A-T - Experience, Expertise, Authoritativeness, Trustworthiness
Cadre d'évaluation de la qualité des contenus issu des Quality Rater Guidelines de Google. Le premier E (Experience) a été ajouté en 2022 pour valoriser le vécu de terrain en plus de l'expertise théorique. En GEO, l'E-E-A-T est transposé implicitement par les LLMs : ils sur-pondèrent les sources avec auteur identifié (nom + titre + affiliation), date de mise à jour récente et citations de sources primaires. Voir : guide citations d'experts en GEO.
Embedding
Représentation d'un texte sous forme de vecteur numérique (liste de flottants) dans un espace à plusieurs centaines de dimensions. Deux textes sémantiquement proches auront des vecteurs proches (distance cosinus faible). Les embeddings sont le moteur des systèmes RAG : la requête est vectorisée, les chunks les plus proches dans l'espace vectoriel sont retrouvés et fournis au LLM. La qualité du modèle d'embedding détermine la pertinence de ce qui est retrouvé.

G

GEO - Generative Engine Optimization
Ensemble des pratiques visant à maximiser la visibilité d'un contenu dans les réponses générées par les LLMs (ChatGPT, Perplexity, Gemini, Claude, AI Overviews). Formalisé académiquement par Pranjal Aggarwal et al. (Princeton, 2023) dans le papier « GEO : Generative Engine Optimization ». Recouvre à la fois l'optimisation technique (schema.org, structure de contenu, fraîcheur) et l'optimisation éditoriale (citations d'experts, statistiques sourcées, contenu difficile à synthétiser). À ne pas confondre avec AEO (plus étroit) ni avec LLMO (plus large, inclut les usages non-search des LLMs).
Grounding
Mécanisme par lequel un LLM ancre sa réponse dans des sources web récupérées en temps réel plutôt que dans ses seules données d'entraînement. Le grounding réduit les hallucinations et lie la réponse à des sources vérifiables. Perplexity est grounded par design (toujours). Gemini utilise le Dynamic Retrieval (conditionnel). ChatGPT en mode Search est grounded sur certaines requêtes. Un LLM non-grounded répond depuis ses poids - ses « citations » ne sont pas des liens vers des sources réelles mais des références mémorisées à l'entraînement. Voir : comment Perplexity choisit ses sources.

H

Hallucination
Production par un LLM d'une information fausse présentée avec la même assurance qu'une information vraie. Les hallucinations ne sont pas des « erreurs » au sens classique - elles résultent de la nature probabiliste des LLMs, qui génèrent le token le plus probable même en l'absence de donnée factuelle fiable. Le grounding réduit (mais n'élimine pas) les hallucinations. Pour un site GEO, être une source bien représentée dans l'index d'un LLM réduit le risque qu'il hallucine des informations vous concernant.
HHI - Herfindahl-Hirschman Index (appliqué au GEO)
Indice de concentration emprunté à l'économie (mesure de monopole sectoriel), repris par le LLM Research Lab Q1 2026 pour mesurer la concentration des citations IA. Un HHI proche de 1 = un seul domaine capte toutes les citations. Le rapport mesure un HHI de 0,365 sur les 6 LLMs analysés - une concentration modérée, indiquant que les citations sont distribuées mais pas uniformément. Voir : analyse du rapport LLM Research Lab Q1 2026.

L

LLM - Large Language Model
Modèle de langage entraîné sur de très grandes quantités de texte, capable de générer du texte, répondre à des questions et raisonner. ChatGPT (OpenAI), Claude (Anthropic), Gemini (Google), Mistral et Perplexity sont des produits construits sur des LLMs. La distinction importante pour le GEO : le LLM lui-même (poids, connaissances d'entraînement) vs le produit qui l'enrobe (interface, grounding, plugins). Optimiser pour « ChatGPT » c'est optimiser pour le produit - pas seulement pour GPT-4o.
LLMO - Large Language Model Optimization
Terme plus large que GEO, couvrant l'ensemble des stratégies visant à influencer le comportement d'un LLM en lien avec une marque ou un contenu - y compris hors des moteurs de recherche (chatbots d'entreprise, assistants embarqués, etc.). Moins utilisé dans la pratique que GEO ou AEO, mais conceptuellement plus précis pour désigner l'optimisation pour des LLMs non-search.

P

PerplexityBot
Robot d'indexation de Perplexity, distinct de Googlebot et Bingbot. Perplexity maintient son propre index web de plus de 200 milliards d'URLs et le rafraîchit indépendamment. Identifier PerplexityBot dans vos logs serveur vous indique que Perplexity crawle votre site. Le bloquer dans robots.txt exclut votre site de l'index Perplexity - et donc de ses réponses. Voir : comment Perplexity choisit ses sources.
Prompt
Texte envoyé par un utilisateur à un LLM pour obtenir une réponse. En GEO, le prompt est l'équivalent de la requête SEO - mais il est souvent plus long, plus conversationnel, et peut inclure un contexte. La formulation du prompt influence fortement les sources citées et les informations présentées. Les outils de tracking GEO définissent des listes de prompts représentatifs des requêtes de la cible pour mesurer la visibilité d'une marque.

R

RAG - Retrieval-Augmented Generation
Architecture combinant un système de recherche documentaire (retrieval) et un LLM (generation). Fonctionnement : (1) la requête est vectorisée, (2) les chunks les plus proches sémantiquement sont récupérés dans une base vectorielle, (3) ces chunks sont fournis en contexte au LLM qui génère la réponse. Le RAG permet à un LLM d'accéder à des informations récentes ou propriétaires sans avoir à être ré-entraîné. Perplexity est architecturellement un RAG sur index web. La différence avec le grounding simple : RAG implique une base vectorielle indexée, le grounding peut aussi désigner un simple appel web en temps réel.

S

Schema.org
Vocabulaire de balisage structuré (JSON-LD, Microdata ou RDFa) standardisé par Google, Microsoft, Yahoo et Yandex. Permet de qualifier le type d'un contenu et ses attributs (Article, Product, Review, Person, LocalBusiness, MedicalWebPage...). En GEO, le schema.org a un impact documenté : le LLM Research Lab Q1 2026 mesure +28 % de citations globales pour les pages balisées, montant à +32 % pour les types Review et AggregateRating. Voir : analyse LLM Research Lab Q1 2026.
Share of Voice IA
Part des citations d'un domaine rapportée à l'ensemble des citations de la concurrence sur les mêmes prompts. Si votre marque est citée dans 30 % des réponses et vos 3 concurrents dans 25, 25 et 20 %, votre Share of Voice IA est de 30/100 = 30 %. Métrique relative plus stable que le Mention Rate absolu, car elle filtre les variations liées aux prompts choisis ou aux mises à jour de modèle.

Y & Z

YMYL - Your Money, Your Life
Catégorie de contenus définie par Google dans ses Quality Rater Guidelines, regroupant les sujets à fort impact potentiel sur la vie des utilisateurs : santé, finance, droit, sécurité. Les contenus YMYL sont soumis à des critères de qualité plus stricts (E-E-A-T élevé exigé). En GEO, la catégorie YMYL détermine souvent le comportement des IA : forte couverture AIO sur le contenu éducatif santé et finance, mais exclusions totales sur les sujets à risque (crise mentale, automutilation). Voir : GEO Santé · GEO Finance.
Zero-Click
Recherche Google qui se termine sans qu'aucun utilisateur ne clique sur un résultat. En 2025, 60 % des recherches Google se terminent sans clic selon SparkToro - une hausse directement liée à la généralisation des AI Overviews qui répondent aux requêtes sans nécessiter de visite sur un site. En GEO, l'objectif n'est plus seulement d'être cliqué mais d'être cité - même dans une réponse qui ne génère pas de trafic direct. Voir : étude SparkToro sur le zero-click.
Ce glossaire est vivant

Le vocabulaire du GEO se stabilise mais reste en mouvement. Certains termes (LLMO, AEO) sont utilisés différemment selon les auteurs. Nous mettons à jour ce glossaire au fil des publications et des usages qui s'imposent. Si vous repérez une définition inexacte ou un terme manquant, les sources primaires utilisées sont liées pour que vous puissiez vérifier.