Glossaire GEO : RAG, grounding, AIO, answer share - 31 termes définis (mai 2026)

À qui sert ce glossaire

Le vocabulaire du GEO mélange des termes SEO classiques, du jargon ML (machine learning) et des néologismes marketing. Certains termes sont utilisés de façon interchangeable alors qu'ils désignent des choses différentes (GEO vs AEO, grounding vs RAG).
Ce glossaire définit chaque terme avec précision, signale les usages ambigus, et renvoie vers les pages du site où le concept est appliqué concrètement.

A

AEO - Answer Engine Optimization: Ensemble des techniques visant à faire apparaître un contenu dans les réponses directes des moteurs IA, indépendamment de son positionnement organique. L'AEO se concentre sur la structuration des contenus en fragments de réponse autonomes (question en H2, réponse courte en premier paragraphe, schema FAQ). Souvent utilisé comme synonyme de GEO - à tort : l'AEO désigne plus spécifiquement l'optimisation pour les extraits de réponse, là où le GEO englobe l'ensemble de la visibilité dans les LLMs.
AI Mode (Google): Interface conversationnelle de Google Search où l'utilisateur dialogue directement avec un modèle Gemini intégré, distinct des AI Overviews classiques. AI Mode permet une conversation multi-tours, là où les AIO sont une réponse synthétique unique au-dessus des résultats. Selon Yext & Superlines, AI Mode favorise les propriétés Google (LinkedIn, YouTube, sources Google) avec environ 93 % de zero-click. Les sources citées par AI Mode chevauchent peu celles de ChatGPT (cf. Semrush 100 M citations).
AIO - AI Overviews: Fonctionnalité de Google Search qui affiche une synthèse générée par IA en haut de la page de résultats, avant les résultats organiques classiques. Lancée en mai 2024 aux États-Unis, progressivement déployée en Europe. Les AIO s'appuient sur un modèle LLM interne à Google et citent des sources depuis l'index Google - avec un overlap de 54,5 % avec les résultats organiques (BrightEdge) ou de 76 % sur le top 10 Google (Ahrefs, périmètre long-tail). À ne pas confondre avec Google AI Mode (interface conversationnelle distincte, déploiement séparé).
Answer Share: Aussi appelé Mention Rate. Pourcentage des requêtes suivies (sur un ensemble de prompts définis) où un domaine ou une marque est explicitement cité dans la réponse d'un LLM. C'est le KPI central des outils de tracking GEO (Peec.ai, Otterly, AthenaHQ). Dépend fortement de la liste de prompts choisie - deux outils mesurant le même site sur des prompts différents donneront des Answer Share très différents. Voir : outils de tracking GEO.

B

Brand Search Lift: Hausse mesurée des recherches brandées (nom de marque, domaine) dans Google Search Console, utilisée comme proxy indirect de la visibilité dans les LLMs. Le raisonnement : un utilisateur qui voit une marque citée dans une réponse IA mais ne clique pas peut rechercher le nom de la marque dans Google plus tard. C'est le KPI business le plus accessible sans outil de tracking dédié. Voir : mesurer sa visibilité IA.
Brand Search Volume: Volume absolu (et non sa variation) des recherches contenant le nom d'une marque dans Google. Distinct du Brand Search Lift, qui en mesure la hausse. Le Digital Bloom 2025 mesure une corrélation de 0,334 entre brand search volume et probabilité d'être cité par un LLM, ce qui en fait le premier prédicteur de visibilité IA mesuré à ce jour - devant le domain authority (0,18) et les backlinks (0,12). Voir : Digital Bloom 2025 et guide brand search volume en GEO.

C

Chunking: Découpage d'un document en fragments (chunks) pour l'indexation dans une base vectorielle. Un système RAG ne stocke pas les documents entiers - il les découpe en segments de 200 à 500 tokens, chacun vectorisé séparément. La taille et la méthode de découpage (par phrase, par paragraphe, par section sémantique) influencent directement quels passages seront retrouvés lors d'une requête. Pour un rédacteur GEO, le chunking implicite que fait un LLM sur votre contenu favorise les paragraphes courts, autonomes et factuellement denses.
Citation Bias: Tendance d'un LLM à sur-représenter certains types de sources dans ses réponses indépendamment de leur qualité réelle. Exemples documentés : ChatGPT sur-cite Wikipedia (47,9 % selon Digital Bloom), Perplexity sur-cite Reddit (46,7 %), Gemini sur-cite les sites de marques (52,15 % selon Yext). Ce biais n'est pas délibéré : il reflète la composition du corpus d'entraînement et la stratégie de grounding de chaque modèle, et il évolue rapidement (cf. l'effondrement Reddit sur ChatGPT entre juillet et octobre 2025 mesuré par Semrush). Voir : top domaines cités par les IA.
Citation Drift: Volatilité des sources citées par un LLM dans le temps : le même prompt peut être répondu avec des sources différentes d'une semaine à l'autre, parfois d'un jour à l'autre. Digital Bloom mesure 59,3 % de citation drift mensuel. Le cas le plus documenté : la part de Reddit dans les citations ChatGPT, passée de 60 % à 10 % en 13 semaines (juillet à octobre 2025) selon Semrush. Conséquence opérationnelle : une stratégie GEO sérieuse mesure ses citations de façon récurrente, pas en photo annuelle.
CTR - Click-Through Rate: Pourcentage d'affichages d'un résultat de recherche qui aboutissent à un clic. En SEO classique, le CTR de la position n°1 organique tournait autour de 30 % sur les requêtes informationnelles. Ahrefs mesure une chute de 58 % sur les requêtes déclenchant un AI Overview. Mais pour les marques effectivement citées dans un AIO, Seer Interactive documente une remontée de 1,3 % (déc. 2025) à 2,4 % (fév. 2026). Le CTR reste le premier indicateur de la valeur d'une position dans Google.

D

Dark Traffic IA: Trafic généré indirectement par une citation dans une réponse LLM, mais non attribué à un canal IA dans GA4. Il prend plusieurs formes : copier-coller d'URL (arrive en Direct), recherche branded différée (arrive en Organic/Google sur une requête de marque), clic depuis l'app mobile (referrer supprimé). C'est l'angle mort principal de la mesure GEO. Estimation : le dark traffic IA représente plusieurs fois le trafic referral IA visible dans GA4. Voir : mesurer sa visibilité IA.
Dynamic Retrieval: Mécanisme de Gemini (Google) qui décide dynamiquement, pour chaque requête, si une recherche web en temps réel est nécessaire ou si les données d'entraînement suffisent. Paramétrable via l'API Google AI avec un seuil de confiance (défaut : 0,7). En dessous du seuil, Gemini répond depuis ses poids. Au-dessus, il effectue un grounding via Google Search. Crucial pour comprendre pourquoi Gemini ne cite pas les mêmes sources selon le type de requête. Voir : comment Gemini choisit ses sources.

E

E-E-A-T - Experience, Expertise, Authoritativeness, Trustworthiness: Cadre d'évaluation de la qualité des contenus issu des Quality Rater Guidelines de Google. Le premier E (Experience) a été ajouté en 2022 pour valoriser le vécu de terrain en plus de l'expertise théorique. En GEO, l'E-E-A-T est transposé implicitement par les LLMs : ils sur-pondèrent les sources avec auteur identifié (nom + titre + affiliation), date de mise à jour récente et citations de sources primaires. Voir : guide citations d'experts en GEO.
Embedding: Représentation d'un texte sous forme de vecteur numérique (liste de flottants) dans un espace à plusieurs centaines de dimensions. Deux textes sémantiquement proches auront des vecteurs proches (distance cosinus faible). Les embeddings sont le moteur des systèmes RAG : la requête est vectorisée, les chunks les plus proches dans l'espace vectoriel sont retrouvés et fournis au LLM. La qualité du modèle d'embedding détermine la pertinence de ce qui est retrouvé.

F

Front-loading: Pratique éditoriale qui consiste à placer la réponse principale, les chiffres clés et les définitions dans le premier tiers d'un contenu - typiquement les 200 premiers mots ou la première section après le H1. Levier central du GEO : 44 % des citations LLM viennent du premier tiers du contenu (Growth Memo, repris par ConvertMate). Concrètement : question en H2, réponse synthétique en première phrase, statistique sourcée dans le paragraphe d'ouverture, plutôt que de garder le « payoff » pour la fin comme en rédaction journalistique classique. Voir : guide front-loading pour le GEO.

G

GEO - Generative Engine Optimization: Ensemble des pratiques visant à maximiser la visibilité d'un contenu dans les réponses générées par les LLMs (ChatGPT, Perplexity, Gemini, Claude, AI Overviews). Formalisé académiquement par Pranjal Aggarwal et al. (Princeton, 2023) dans le papier « GEO : Generative Engine Optimization ». Recouvre à la fois l'optimisation technique (schema.org, structure de contenu, fraîcheur) et l'optimisation éditoriale (citations d'experts, statistiques sourcées, contenu difficile à synthétiser). À ne pas confondre avec AEO (plus étroit) ni avec LLMO (plus large, inclut les usages non-search des LLMs).
Grounding: Mécanisme par lequel un LLM ancre sa réponse dans des sources web récupérées en temps réel plutôt que dans ses seules données d'entraînement. Le grounding réduit les hallucinations et lie la réponse à des sources vérifiables. Perplexity est grounded par design (toujours). Gemini utilise le Dynamic Retrieval (conditionnel). ChatGPT en mode Search est grounded sur certaines requêtes. Un LLM non-grounded répond depuis ses poids - ses « citations » ne sont pas des liens vers des sources réelles mais des références mémorisées à l'entraînement. Voir : comment Perplexity choisit ses sources.

H

Hallucination: Production par un LLM d'une information fausse présentée avec la même assurance qu'une information vraie. Les hallucinations ne sont pas des « erreurs » au sens classique - elles résultent de la nature probabiliste des LLMs, qui génèrent le token le plus probable même en l'absence de donnée factuelle fiable. Le grounding réduit (mais n'élimine pas) les hallucinations. Pour un site GEO, être une source bien représentée dans l'index d'un LLM réduit le risque qu'il hallucine des informations vous concernant.
HHI - Herfindahl-Hirschman Index (appliqué au GEO): Indice de concentration emprunté à l'économie (mesure de monopole sectoriel), repris par le LLM Research Lab Q1 2026 pour mesurer la concentration des citations IA. Un HHI proche de 1 = un seul domaine capte toutes les citations. Le rapport mesure un HHI de 0,365 sur les 6 LLMs analysés - une concentration modérée, indiquant que les citations sont distribuées mais pas uniformément. Voir : analyse du rapport LLM Research Lab Q1 2026.

L

LLM - Large Language Model: Modèle de langage entraîné sur de très grandes quantités de texte, capable de générer du texte, répondre à des questions et raisonner. ChatGPT (OpenAI), Claude (Anthropic), Gemini (Google), Mistral et Perplexity sont des produits construits sur des LLMs. La distinction importante pour le GEO : le LLM lui-même (poids, connaissances d'entraînement) vs le produit qui l'enrobe (interface, grounding, plugins). Optimiser pour « ChatGPT » c'est optimiser pour le produit - pas seulement pour GPT-4o.
LLMO - Large Language Model Optimization: Terme plus large que GEO, couvrant l'ensemble des stratégies visant à influencer le comportement d'un LLM en lien avec une marque ou un contenu - y compris hors des moteurs de recherche (chatbots d'entreprise, assistants embarqués, etc.). Moins utilisé dans la pratique que GEO ou AEO, mais conceptuellement plus précis pour désigner l'optimisation pour des LLMs non-search.

M

Mention Rate: Pourcentage des prompts d'un panel sur lesquels une marque ou un domaine est explicitement cité dans la réponse d'un LLM. Très proche de l'Answer Share, parfois utilisé comme synonyme, parfois distingué (le Mention Rate compte toute mention textuelle de la marque, l'Answer Share compte uniquement les citations avec lien sortant). Métrique de premier ordre dans les outils de tracking GEO. Sa valeur dépend fortement de la liste de prompts choisie : comparer deux outils sans aligner la liste de prompts donne des chiffres peu comparables.
Multi-turn (conversation): Échange en plusieurs tours entre un utilisateur et un LLM, par opposition à la requête unique du moteur de recherche classique. Une session ChatGPT ou Perplexity dure typiquement 3 à 7 tours. Cette dynamique change profondément la nature des sources retenues : le LLM affine sa compréhension du besoin au fil de la conversation, et la citation finale dépend de l'historique du dialogue, pas seulement du dernier prompt. C'est aussi pourquoi le visiteur arrivé d'un LLM est souvent plus mûr qu'un visiteur organique (cf. Semrush 4,4×), même si la mesure exacte fait débat (cf. Amsive).

P

PerplexityBot: Robot d'indexation de Perplexity, distinct de Googlebot et Bingbot. Perplexity maintient son propre index web de plus de 200 milliards d'URLs et le rafraîchit indépendamment. Identifier PerplexityBot dans vos logs serveur vous indique que Perplexity crawle votre site. Le bloquer dans robots.txt exclut votre site de l'index Perplexity - et donc de ses réponses. Voir : comment Perplexity choisit ses sources.
Prompt: Texte envoyé par un utilisateur à un LLM pour obtenir une réponse. En GEO, le prompt est l'équivalent de la requête SEO - mais il est souvent plus long, plus conversationnel, et peut inclure un contexte. La formulation du prompt influence fortement les sources citées et les informations présentées. Les outils de tracking GEO définissent des listes de prompts représentatifs des requêtes de la cible pour mesurer la visibilité d'une marque.

R

RAG - Retrieval-Augmented Generation: Architecture combinant un système de recherche documentaire (retrieval) et un LLM (generation). Fonctionnement : (1) la requête est vectorisée, (2) les chunks les plus proches sémantiquement sont récupérés dans une base vectorielle, (3) ces chunks sont fournis en contexte au LLM qui génère la réponse. Le RAG permet à un LLM d'accéder à des informations récentes ou propriétaires sans avoir à être ré-entraîné. Perplexity est architecturellement un RAG sur index web. La différence avec le grounding simple : RAG implique une base vectorielle indexée, le grounding peut aussi désigner un simple appel web en temps réel.

S

Schema.org: Vocabulaire de balisage structuré (JSON-LD, Microdata ou RDFa) standardisé par Google, Microsoft, Yahoo et Yandex. Permet de qualifier le type d'un contenu et ses attributs (Article, Product, Review, Person, LocalBusiness, MedicalWebPage...). En GEO, le schema.org a un impact documenté : le LLM Research Lab Q1 2026 mesure +28 % de citations globales pour les pages balisées, montant à +32 % pour les types Review et AggregateRating. Voir : analyse LLM Research Lab Q1 2026.
Share of Voice IA: Part des citations d'un domaine rapportée à l'ensemble des citations de la concurrence sur les mêmes prompts. Si votre marque est citée dans 30 % des réponses et vos 3 concurrents dans 25, 25 et 20 %, votre Share of Voice IA est de 30/100 = 30 %. Métrique relative plus stable que le Mention Rate absolu, car elle filtre les variations liées aux prompts choisis ou aux mises à jour de modèle.

T

Topic Cluster (cluster thématique): Architecture de contenu où une page principale (pillar page) couvre un sujet large, entourée de pages détaillées (cluster pages) qui approfondissent les sous-sujets, le tout maillé en interne. Le concept vient du SEO classique mais devient particulièrement pertinent en GEO : les LLMs détectent la cohérence thématique d'un site comme signal d'expertise, et citent plus volontiers les domaines reconnus comme « entité de référence » sur un sujet précis. Ahrefs (août 2025) recommande explicitement la construction de topic clusters comme l'un des trois leviers principaux pour gagner des citations IA.

Y & Z

YMYL - Your Money, Your Life: Catégorie de contenus définie par Google dans ses Quality Rater Guidelines, regroupant les sujets à fort impact potentiel sur la vie des utilisateurs : santé, finance, droit, sécurité. Les contenus YMYL sont soumis à des critères de qualité plus stricts (E-E-A-T élevé exigé). En GEO, la catégorie YMYL détermine souvent le comportement des IA : forte couverture AIO sur le contenu éducatif santé et finance, mais exclusions totales sur les sujets à risque (crise mentale, automutilation). Voir : GEO Santé, GEO Finance.
Zero-Click: Recherche Google qui se termine sans qu'aucun utilisateur ne clique sur un résultat. En 2025, 60 % des recherches Google se terminent sans clic selon SparkToro - une hausse directement liée à la généralisation des AI Overviews qui répondent aux requêtes sans nécessiter de visite sur un site. En GEO, l'objectif n'est plus seulement d'être cliqué mais d'être cité - même dans une réponse qui ne génère pas de trafic direct. Voir : étude SparkToro sur le zero-click.

Ce glossaire est vivant

Le vocabulaire du GEO se stabilise mais reste en mouvement. Certains termes (LLMO, AEO) sont utilisés différemment selon les auteurs. Nous mettons à jour ce glossaire au fil des publications et des usages qui s'imposent. Si vous repérez une définition inexacte ou un terme manquant, les sources primaires utilisées sont liées pour que vous puissiez vérifier.