Comment Gemini choisit ses sources : grounding Google Search, knowledge graph et schema.org

Gemini sélectionne ses sources via le mécanisme officiel de grounding with Google Search, documenté publiquement par Google. Une recherche Google est exécutée en temps réel, les résultats sont rerangés, puis injectés dans le contexte du modèle.
Conséquence directe : la SERP Google détermine largement le pool de sources Gemini. Une marque bien classée dans la SERP traditionnelle est plus visible chez Gemini.
Selon Yext (octobre 2025), 52,15 % des citations Gemini viennent de sites de marques officiels. C'est l'inverse exact de ChatGPT (qui privilégie les sites tiers à 48,73 %).
Trois leviers techniques pèsent particulièrement : schema.org structuré, fraîcheur du contenu, et présence dans le knowledge graph Google (Wikipedia, fiches officielles, sameAs cohérent).

Gemini est paradoxalement le moteur dont le mécanisme de sélection des sources est le mieux documenté publiquement par son éditeur, et pourtant celui dont l'optimisation reste la plus mal comprise. Google publie la documentation complète du grounding sur ai.google.dev. Le voici décrypté avec ce que les études tierces apportent en complément.

Le grounding with Google Search

Le mécanisme officiel s'appelle « grounding with Google Search ». Documentation officielle disponible sur ai.google.dev et cloud.google.com.

Le parcours quand un utilisateur pose une question à Gemini :

Évaluation de la nécessité de grounder. Le modèle évalue si une recherche en temps réel apporte une valeur. Sur les questions d'actualité, factuelles ou demandant des informations à jour, le grounding se déclenche.
Génération de requêtes Google. Le modèle reformule la question utilisateur en une ou plusieurs requêtes de recherche Google optimisées.
Exécution sur Google Search. Les requêtes sont envoyées à Google Search (le moteur classique), qui retourne ses résultats organiques avec métadonnées.
Récupération du contenu. Pour les pages retenues comme pertinentes, le contenu est récupéré.
Reranking. Les sources sont réordonnées selon leur pertinence pour la question, leur autorité, leur fraîcheur.
Injection dans le contexte du modèle. Le contenu textuel des sources retenues est ajouté au contexte du modèle Gemini.
Composition de la réponse. Le modèle compose une réponse à partir du contexte enrichi, avec attribution sous forme de groundingChunks (URI + titre) et groundingSupports (mapping entre segments de réponse et sources).

Dynamic retrieval et seuil de confiance

Particularité technique de Gemini documentée par Google : le mécanisme de dynamic retrieval. Quand un développeur active le grounding, il peut configurer un seuil de prédiction qui détermine quand le grounding se déclenche.

Le modèle évalue chaque prompt et lui assigne un prediction score entre 0 et 1.
Le seuil par défaut est de 0,7.
Si le score dépasse le seuil, le grounding se déclenche ; sinon, le modèle répond depuis sa connaissance interne.
Le seuil peut être ajusté de 0 (toujours grounder) à 1 (jamais grounder).

Cette mécanique signifie que toutes les questions ne déclenchent pas une recherche. Sur les questions générales pour lesquelles le modèle a déjà une bonne connaissance interne, il répond sans aller chercher. Sur les questions à enjeu d'actualité ou de fait précis, le grounding est activé.

Le rôle de la SERP organique

Conséquence majeure du grounding : la SERP Google traditionnelle alimente directement le pool de sources Gemini. Une marque bien classée organiquement entre dans le pool ; une marque non classée, non.

Sur les Google AI Overviews (déclinaison « dans la SERP » de Gemini), BrightEdge mesure 54,5 % de citations issues du classement organique (toutes positions confondues). Sur le top 10 strict, ce pourcentage tombe à 16,7 %. La majorité des citations vient de positions 21-100, ce qui ouvre le terrain à des marques qui ne sont pas dans le podium organique.

Le biais « sites de marques »

52,15 % Part des citations Gemini qui proviennent de sites officiels de marques selon Yext (analyse de 6,8 M de citations, octobre 2025). C'est le profil exactement inverse de ChatGPT, qui privilégie les sites tiers à 48,73 %. Source : Yext · AI Visibility in 2025

Verbatim Yext : « 52.15% of Gemini citations came from brand-owned websites. » Pourquoi ce biais structurel :

Confiance dans le knowledge graph Google. Le knowledge graph valide les marques et les ancre comme entités fiables. Quand Gemini cherche une information sur une marque, il privilégie naturellement la source officielle validée.
Schema.org structuré. Les sites de marques bien balisés exposent des données structurées (Organization, Product, Service, FAQ) que Gemini extrait facilement.
Cohérence éditoriale. Un site officiel est cohérent dans son discours sur la marque, ce qui simplifie l'extraction.
Logique d'écosystème Google. Google a construit son moteur sur la confiance accordée aux sites bien optimisés. Cette confiance se transmet à Gemini par construction.

Tension avec PR Lab 2026. L'étude Occurrence pour SCRP / Union des Marques mesure 26 % de sources propriétaires chez Gemini sur le marché français en mars 2026. Soit la moitié de la mesure Yext sur le marché US. La divergence vient probablement d'une combinaison de marché, de définition stricte de « site propriétaire », et de période. Sur le marché français, le poids des sites institutionnels (.gouv.fr, fédérations) est plus marqué, ce qui dilue mécaniquement la part des sites de marques.

Les signaux de classement

Schema.org structuré et empilé

Le balisage de données structurées sert deux fonctions chez Gemini : aider à comprendre le contenu et alimenter le knowledge graph qui valide les entités. Selon LLM Research Lab Q1 2026, le schema apporte un boost mesuré : +28 % global, +24 % Product, +32 % Review/AggregateRating.

Types de schema qui pèsent particulièrement :

Organization avec sameAs vers les profils officiels (Wikipedia, LinkedIn, Crunchbase, profils sectoriels).
Article ou NewsArticle avec datePublished et dateModified.
FAQPage sur les pages questions/réponses.
Product ou SoftwareApplication sur les fiches produits.
Review/AggregateRating quand il y a des avis structurés.
Person sur les pages auteurs.

Fraîcheur

Gemini privilégie les contenus récents, comme le confirme la documentation officielle du grounding (les pages servies sont celles que Google Search renvoie au moment de la requête). Les pages avec dates explicites (publication ET mise à jour) et balisage dateModified à jour sont préférées.

Présence dans le knowledge graph

Les marques avec une fiche Wikipedia bien tenue, un knowledge panel Google, des fiches Google Business Profile complètes ressortent plus volontiers. Le knowledge graph est l'infrastructure qui valide les entités ; en faire partie est un avantage structurel pour Gemini.

E-E-A-T

Les principes E-E-A-T (Experience, Expertise, Authoritativeness, Trustworthiness) que Google applique depuis longtemps dans son SEO classique se transmettent à Gemini. Une marque qui a une autorité reconnue dans son secteur a plus de chances d'être citée.

Le schéma de décision en pratique

Quand Gemini reçoit une question :

Évaluation du prediction score. Le modèle estime si le grounding apporte une valeur. Score > 0,7 : grounding activé.
Génération des requêtes Google. Une ou plusieurs requêtes optimisées sont produites.
Exécution sur Google Search. La SERP organique répond avec ses résultats classiques.
Sélection des sources retenues. Reranking selon la pertinence pour la question, l'autorité, la fraîcheur, le balisage structuré.
Récupération de contenu. Le contenu textuel des pages retenues est extrait.
Composition de la réponse. Le modèle compose la réponse en s'appuyant sur le contexte des sources, avec citations sous forme de groundingChunks.
Affichage des sources. Les sources cliquables apparaissent en pied de réponse, avec snippet et lien.

Gemini vs Google AI Overviews

Distinction utile : Gemini (interface chat) et Google AI Overviews (intégrés dans la SERP) partagent essentiellement le même mécanisme de grounding, mais ne s'affichent pas de la même manière.

Aspect	Gemini chat	Google AI Overviews
Interface	Chat dédié (gemini.google.com)	Intégré dans la SERP Google traditionnelle
Mécanisme grounding	Grounding avec Google Search	Grounding avec Google Search (variante)
Sources affichées	Sources cliquables en pied de réponse	Sources affichées dans un encart à part dans la SERP
Audience	Utilisateurs qui cherchent une réponse via chat	1,5 milliard d'utilisateurs mensuels selon Superlines (mars 2026)

Implication pratique : optimiser pour Gemini, c'est essentiellement optimiser pour les AI Overviews et inversement. Pour le détail, voir notre fiche dédiée comment les AIO choisissent leurs sources.

Comment Gemini évolue

Versions successives. Gemini 1.0, 1.5, 2.0, 2.5... Chaque nouvelle version peut ajuster la pondération des signaux et le périmètre des données.
Élargissement géographique. Les AI Overviews ont été déployés progressivement sur de plus en plus de marchés en 2024-2026.
Dynamic retrieval rendu plus systématique. Le grounding est de plus en plus déclenché par défaut pour réduire le risque de fabrication.
Search Console enrichie. Google a ouvert des segments dédiés AI Overviews dans Search Console pour aider les éditeurs à suivre leur performance.
Knowledge graph en expansion. Plus d'entités validées, plus de relations entre entités. Les sites qui s'ancrent dans le knowledge graph en bénéficient.

Ce que ça implique pour le GEO

Garder une stratégie SEO classique solide. Top 10 organique sur les requêtes cibles est un prérequis. Cocon thématique, autorité de domaine, contenu de fond.
Schema.org empilé et propre. Article + Person + Organization + BreadcrumbList sur les pages prioritaires. Validation Rich Results Test.
SameAs cohérent. Pointage vers les profils officiels (Wikipedia, LinkedIn, profils sectoriels) pour ancrer l'entité.
Datage et fraîcheur. Date de publication ET de mise à jour visibles, refresh trimestriel ou semestriel sur les contenus prioritaires, dateModified à jour dans le balisage.
Knowledge graph travaillé. Wikipedia (si applicable), Google Business Profile, knowledge panel.
Signaux d'autorité E-E-A-T. Auteurs identifiés, biographies professionnelles, profils Person bien remplis avec affiliations.

Limites de ce qu'on sait

Documentation officielle partielle. Google publie le mécanisme de grounding mais pas les pondérations exactes ni les critères de reranking.
Tension entre études. Yext mesure 52,15 % sites de marques sur le marché US, PR Lab 26 % sur le marché français. La vérité dépend du contexte.
Évolution rapide. Chaque version de Gemini et chaque update des AIO peut bouger les comportements. Les chiffres 2026 ne sont pas durables.
Beaucoup de chiffres GEO non sourcés. La quasi-totalité des publications « guide Gemini SEO » citent des pourcentages précis (3× cité si top 10, 23 % refresh mensuel, etc.) sans source primaire identifiable. À écarter par principe.
Marché francophone moins documenté. La majorité des données Yext et BrightEdge sont US. Pour la France, PR Lab apporte un éclairage mais avec ses propres limites.

Sources

Sources qui alimentent cette page :

Google AI for Developers · Grounding with Google Search (documentation officielle de l'API Gemini)
Google Cloud Vertex AI · Grounding overview
Google Cloud Vertex AI · Grounding with Google Search (détail technique)
Google Developers Blog · Gemini API and AI Studio now offer Grounding with Google Search
Yext · AI Visibility in 2025 - chiffre 52,15 % sites de marques.
BrightEdge · Weekly AI Search Insights - analyses Google AIO.
Superlines · AI Search Statistics 2026 - chiffre 1,5 milliard utilisateurs/mois AIO.
LLM Research Lab · Q1 2026 Report - effets schema +28 %.

Études couvertes sur le site qui alimentent cette page : Yext & Superlines, BrightEdge overlap 54 %, LLM Research Lab Q1 2026, PR Lab 2026 (Occurrence).

Pour aller plus loin :