[1] llm-geo.fr
veille en direct FR / EN

Fiche étudeOccurrence pour SCRP et Union des MarquesMars 2026

PR Lab 2026 (Occurrence) : 21 % des sources IA viennent des sites propriétaires en France

Étude présentée le 20 mars 2026 (PR Lab, Paris) Auteur : Assaël Adary, Occurrence Lecture : ~13 min
  • L'étude PR Lab 2026, menée par Occurrence pour le SCRP (Syndicat du Conseil en Relations Publiques) et l'Union des Marques, mesure la nature des sources mobilisées par les IA génératives sur le marché français.
  • 21 % des sources utilisées par les IA proviennent de sites propriétaires (sites corporates des marques). Le reste se répartit entre 15 % de médias, 15 % de sites institutionnels, et seulement 1 % de réseaux sociaux.
  • Le profil change selon le moteur. ChatGPT est le plus dépendant des sites de marques (32 %), suivi par Gemini (26 %), Mistral (22 %), Perplexity (19 %), Claude (17 %) et Grok (13 %).
  • L'étude est en tension méthodologique avec Yext (qui mesurait 52,15 % pour Gemini en octobre 2025 sur le marché US). Les deux études donnent des chiffres différents parce qu'elles ne mesurent pas la même chose. À lire avec rigueur.

Le 20 mars 2026, le SCRP et l'Union des Marques ont présenté à Paris une étude commandée à Occurrence, cabinet d'études et de mesure dirigé par Assaël Adary. L'étude posait une question simple : quand les IA génératives répondent à des prompts qui concernent des marques, sur quelles sources s'appuient-elles ? La réponse révèle des biais marqués qui ont des implications directes pour les stratégies GEO françaises.

Contexte et statut de l'étude

L'étude a été commandée par deux structures professionnelles :

  • SCRP : Syndicat du Conseil en Relations Publiques. Représente les agences et conseils RP en France. URL : relations-publics.org
  • Union des Marques : anciennement UDA, l'association des annonceurs en France. URL : uniondesmarques.fr

L'étude a été réalisée par Occurrence (cabinet d'études fondé par Assaël Adary) et présentée publiquement à PR Lab 2026, l'événement organisé par les deux structures à Paris en mars 2026. Elle s'inscrit dans une réflexion plus large des professionnels des relations publiques sur leur rôle dans la nouvelle ère des moteurs IA.

Statut. Étude professionnelle commandée par des syndicats, réalisée par un cabinet d'études privé. Pas une étude académique peer-reviewed. Le périmètre (nombre de prompts, modèles testés, période) n'est pas entièrement public à la date de cette fiche. À lire en ordre de grandeur sur le marché français, et à contextualiser face aux études anglo-saxonnes qui mesurent souvent des choses voisines mais pas identiques.

Les résultats globaux

L'étude répartit les sources consultées par les IA en quatre grandes catégories :

Type de source Part des citations Lecture stratégique
Sites propriétaires (corporates des marques) 21 % Le travail sur le site officiel reste fondamental
Médias 15 % Earned media reste un levier (presse, médias spécialisés)
Sites institutionnels 15 % .gouv.fr, INSEE, Légifrance, syndicats, fédérations
Réseaux sociaux 1 % Le social ne remonte presque jamais comme source
Autres (forums, communautés, plateformes tierces, sources non classées) ~ 48 % Catégorie résiduelle non détaillée publiquement à ce stade

Verbatim Assaël Adary à PR Lab 2026 : « Les IA cherchent de la crédibilité, et donc des sources d'autorité. » Les LLMs privilégient les contenus structurés et légitimes, ce qui valorise les sites institutionnels, les médias et les sites de marques bien tenus, au détriment des contenus rapides et auto-déclaratifs des réseaux sociaux.

La part des sites propriétaires par moteur

Le visuel central de l'étude PR Lab 2026 montre la part des sites propriétaires dans les sources de chaque LLM. Les écarts sont marqués :

Les sites propriétaires, première source d'influence pour les IA

20 mars 2026
  • ChatGPT
    32 %
  • Gemini
    26 %
  • Mistral AI
    22 %
  • Perplexity
    19 %
  • Claude
    17 %
  • Grok
    13 %

Moyenne pondérée : 21 % des sources utilisées par les IA proviennent des sites propriétaires des marques. Source : étude Occurrence pour SCRP et Union des Marques, présentée à PR Lab 2026 (Paris, 20 mars 2026).

Trois lectures :

  • ChatGPT en tête. Les sites de marques pèsent un tiers de ses sources sur le marché français. Sur ce moteur, le travail sur le site officiel paie directement.
  • Mistral à la moyenne européenne. Le moteur français se positionne entre Gemini et Perplexity. Le profil ressemble plus à celui des moteurs occidentaux qu'à un comportement spécifiquement français.
  • Claude et Grok plus diversifiés. Ces moteurs tirent moins des sites de marques : leur composition de sources est plus orientée presse, communautés, sources tierces.

Les implications selon Occurrence et le SCRP

Au-delà des chiffres bruts, l'étude porte une thèse : les RP sont mieux placés que le SEO classique pour optimiser la présence des marques dans les IA. Plusieurs verbatims structurent l'argumentaire :

« Nous sommes dans une bataille de crédibilité, plus que de visibilité. »
Céline Tondi, conseil d'administration du SCRP, directrice associée de Mot compte double

Selon Céline Tondi, 30 à 40 % des sources mobilisées par les IA seraient « maîtrisables par les communicants » (sites de marques + une partie des médias et des contenus institutionnels où les RP peuvent intervenir). C'est cette zone d'action qui justifie le repositionnement des RP comme acteurs centraux de la stratégie GEO.

« Les marques doivent créer des clusters de concepts et de sources dans lesquels les IA puisent. C'est un graphe de connaissances qu'il faut construire, pas une liste de mots-clés. »
Rachid Hammouda, directeur stratégie IA, data et digital, FDJ United

Le concept de graphe de connaissances introduit par Rachid Hammouda renvoie à une logique d'écosystème : ce qui compte n'est pas une page isolée, mais la cohérence d'un ensemble de contenus, de mentions et de relations qui ancre la marque dans un contexte. Sur ce terrain, les RP ont des compétences plus matures que le SEO classique.

Le communiqué de presse comme « projectile »

Verbatim Assaël Adary : le communiqué de presse est « un projectile redoutable pour cibler les IA ». Les raisons :

  • Format structuré. Titre, date, bullet points, données chiffrées, citations. Tout ce qui rend un contenu « digestible » par un LLM.
  • Compte double. Envoyé à la presse (avec risque de reprise éditoriale qui devient elle-même source IA), et hébergé sur le site de l'entreprise (qui devient source propriétaire IA).
  • Datable. Un communiqué a une date claire, ce qui aide les LLMs à juger la fraîcheur.
  • Citation prête à l'emploi. La citation officielle dans un CP est attribuée nominativement à un dirigeant identifiable.

La tension méthodologique avec Yext

Le chiffre PR Lab pour Gemini (26 % de sites propriétaires) est en apparence en contradiction frontale avec celui mesuré par Yext en octobre 2025 : 52,15 %. Ce n'est pas une contradiction réelle, c'est une divergence méthodologique qui mérite d'être détaillée.

Critère Yext (oct. 2025) PR Lab / Occurrence (mars 2026)
Marché États-Unis France
Échantillon 6,8 M de citations sur 1,6 M de réponses Périmètre exact non public
Période Avant octobre 2025 Début 2026
Définition « sites de marques » « Brand-owned websites » (sens large) « Sites propriétaires » (corporates au sens strict)
Cadre des prompts Mix de requêtes informationnelles et commerciales Cadre exact non public

Plusieurs hypothèses peuvent expliquer l'écart, sans qu'on puisse trancher en l'état des données publiques :

  • Différence de marché. Les LLMs peuvent privilégier différemment les sources selon la langue de la requête. Sur les requêtes en français, les sites de marques peuvent peser moins parce que les sources institutionnelles (Service-Public, INSEE, Légifrance) ont un rôle plus structurant.
  • Définition de « site de marque ». Yext compte large (peut inclure des sous-domaines, profils sur des plateformes de marques, etc.), Occurrence semble compter strict (corporate seulement).
  • Évolution dans le temps. Entre octobre 2025 et mars 2026, les LLMs ont pu rééquilibrer leurs sources.
  • Type de requêtes échantillonnées. Sur des requêtes purement informationnelles, les sites de marques ressortent moins que sur des requêtes commerciales.
À retenir. Les deux études disent la même chose qualitativement (les sites de marques sont une source majeure pour les LLMs), mais l'amplitude varie selon le marché et la méthodologie. Pour une stratégie française, la référence à utiliser est PR Lab : 26 % pour Gemini, 32 % pour ChatGPT, 21 % en moyenne. Pour une stratégie internationale, Yext apporte un éclairage complémentaire sur le marché US.

Perspectives budgétaires

Au-delà des chiffres directs, l'étude relaie une prédiction de Gartner reprise lors du PR Lab : les budgets earned media et RP devraient doubler d'ici 2027, tandis que les budgets SEO et SEA pourraient diminuer. Cette projection résulte directement du basculement des recherches vers les moteurs IA, qui réduit la valeur du clic Google traditionnel et augmente la valeur du « être cité comme source ».

On notera que cette prédiction Gartner ne distingue pas finement RP et earned media (qui ne sont pas la même chose, même s'ils se chevauchent). Pour la lecture, retenir l'ordre de grandeur : les budgets se déplacent du « j'achète du clic Google » vers le « je construis une autorité éditoriale ». Le RP en bénéficie naturellement, mais ne capte pas tout.

Ce que l'étude ne dit pas (à ce stade)

  • Méthodologie complète. Nombre exact de prompts, distribution par catégorie, intervalles de confiance, langue testée. Tous ces éléments ne sont pas publics au moment de cette fiche.
  • Définition opérationnelle des catégories. La frontière entre « site propriétaire » et « site institutionnel » n'est pas explicitée (un site de fédération sectorielle est-il l'un ou l'autre ?).
  • Robustesse temporelle. Une mesure unique au début 2026 ne dit rien de la stabilité dans le temps. Les chiffres peuvent bouger en deux trimestres.
  • Effet du type de requête. L'étude semble agréger plusieurs types de prompts. Une distinction informationnel / commercial / local pourrait modifier les résultats.
  • Reproductibilité. Les prompts utilisés ne sont pas publics, donc l'étude n'est pas reproductible par un tiers indépendant.

Ce qu'on peut en tirer concrètement pour le GEO

  1. Le site propriétaire reste fondamental sur le marché français. 21 % en moyenne, 32 % chez ChatGPT. Investir dans le contenu, la structure, le schema reste un des leviers les plus directs.
  2. Les médias pèsent toujours. 15 % des sources, c'est plus que les réseaux sociaux et autant que l'institutionnel. Le earned media (RP au sens classique) garde sa pertinence.
  3. L'institutionnel est un terrain sous-investi. 15 % des sources, mais peu de marques travaillent activement leur présence sur les sites institutionnels (fédérations, associations professionnelles, sites publics).
  4. Le réseau social ne porte pas en GEO. 1 % des sources : le LinkedIn corporate ne remplace pas le site corporate. À condition de les utiliser comme amplificateurs, pas comme socle.
  5. Le communiqué de presse retrouve son utilité. Format structuré, dates explicites, citations attribuées. Format « ami du LLM » par construction.
  6. Cartographier les acteurs et concepts du marché plutôt que de cibler des mots-clés. Le concept de graphe de connaissances est plus utile que la liste sémantique en GEO.

Limites des résultats

  • Étude commandée par les acteurs du marché des RP. Le SCRP et l'Union des Marques ont un intérêt direct à valoriser le rôle des RP. À lire en gardant cette distorsion en tête, sans pour autant disqualifier les chiffres.
  • Méthodologie partiellement publique. Les détails opérationnels ne sont pas accessibles en source primaire à cette date.
  • Échantillon temporel court. Une mesure ponctuelle au printemps 2026, pas une série temporelle.
  • Marché français uniquement. Les résultats ne se transposent pas mécaniquement à l'international.
  • Catégorie « autres » résiduelle non détaillée. ~48 % des sources ne sont pas classées dans les quatre catégories principales. Sans détail public, c'est une zone d'ombre.

Sources

Sources qui alimentent cette fiche :

Études comparables couvertes sur le site : Yext & Superlines, Digital Bloom 2025.