- L'étude analyse 1 056 727 citations issues de 75 000 réponses IA sur trois moteurs (ChatGPT, Google AI Mode, Perplexity), via la plateforme de tracking Peec AI. Échantillon segmenté sur 5 secteurs et 4 intentions de recherche.
- Trois formats captent à eux seuls 52 % des citations IA tous segments confondus : listicles (21,9 %), articles (16,7 %) et pages produit (13,7 %).
- L'intention de recherche est un prédicteur plus fort du type de contenu cité que le secteur d'activité ou le moteur. Concrètement : articles dominent l'informationnel (45,48 %), listicles dominent le commercial (40,86 %), pages produit dominent le transactionnel (24,88 %).
- Les biais par moteur restent significatifs : Perplexity tire 17 % de ses citations de discussions (Reddit, forums) - plus du double des autres engines. Google AI Mode propose la distribution la plus équilibrée.
Quand on construit une stratégie GEO, la première question opérationnelle est rarement « comment optimiser ? » mais « quoi optimiser ? ». Quelle page produire en priorité, sous quel format, pour quelle intention de recherche. L'étude publiée par Wix AI Search Lab le 3 mars 2026 apporte des éléments chiffrés solides à cette question, en analysant un volume de données substantiel sur les trois principaux engines.
Comme toujours sur ce site, on regarde la source primaire en détail : qui publie, comment, sur quel échantillon, avec quels biais, et qu'est-ce qu'on peut en tirer concrètement.
Le statut de la source
L'étude est publiée par Wix AI Search Lab, l'unité de recherche du groupe Wix dédiée à l'observation du comportement des moteurs IA. Elle est signée par Tom Wells, chercheur GEO, et mise en ligne sur le site institutionnel Wix Studio le 3 mars 2026.
À noter : l'article francophone d'Eloq qui circule depuis fin mars relaye fidèlement les chiffres principaux de l'étude Wix sans la republier. Plusieurs chiffres détaillés (80,9 % de listicles tiers neutres, +48,3 % de surperformance des guides pratiques, etc.) y sont attribués à Wix mais ne figurent pas tels quels dans la version publique de l'étude originale : à utiliser avec la mention « selon Eloq, attribué à Wix » plutôt que « selon Wix ».
La méthodologie en détail
Le protocole d'observation est l'un des plus larges publiés à ce jour sur le sujet du contenu cité par les LLMs.
| Paramètre | Valeur | Commentaire |
|---|---|---|
| Citations analysées | 1 056 727 | Volume très supérieur aux études concurrentes |
| Réponses IA générées | 75 000 | Soit ~14 citations par réponse en moyenne |
| Moteurs testés | 3 | ChatGPT, Google AI Mode, Perplexity |
| Secteurs couverts | 5 | eCommerce, Health & Wellness, Home Repair, Professional Services, SaaS |
| Intentions de recherche | 4 | Informationnelle, Commerciale, Navigationnelle/locale, Transactionnelle |
| Plateforme de tracking | Peec AI | Couvert dans notre comparatif d'outils GEO |
| Période d'observation | Non précisée | Limite méthodologique mineure |
L'étude classe les pages citées dans une taxonomie de types de contenus (listicles, articles, pages produit, homepages, guides, discussions, etc.) et calcule leur poids relatif dans les citations selon trois axes croisés : type de contenu, intention de recherche, moteur IA.
La distribution globale des citations
Le résultat le plus directement actionnable de l'étude est cette photographie des types de contenus qui dominent les citations IA, tous secteurs et toutes intentions confondus.
Top 3 des types de contenus cités par les LLMs
Part du total des 1 056 727 citations · Wix AI Search Lab, mars 2026
Ces trois formats représentent à eux seuls plus de la moitié des citations toutes catégories confondues. Les 48 % restants se répartissent entre une dizaine de formats secondaires (homepages, guides, FAQ, discussions issues de Reddit ou de forums, pages d'avis, vidéos YouTube, etc.).
À noter que les listicles - les articles structurés en listes type « 10 meilleurs CRM en 2026 » - sortent en tête. C'est cohérent avec l'observation que les LLMs identifient et extraient plus facilement des unités sémantiques courtes et autonomes, ce qu'on a documenté sur notre page front-loading des contenus.
Par intention de recherche : l'angle le plus fort de l'étude
C'est probablement la conclusion la plus actionnable de Wells : l'intention de recherche prédit mieux le type de contenu cité que le secteur d'activité ou le moteur. Autrement dit, peu importe que vous soyez en SaaS, en santé ou en e-commerce : si l'utilisateur pose une question informationnelle, c'est un article qui sera cité, pas une page produit. Et inversement.
| Intention | Type de contenu dominant | Part des citations dans cette intention |
|---|---|---|
| Informationnelle | Articles | 45,48 % |
| Commerciale | Listicles | 40,86 % |
| Transactionnelle | Pages produit | 24,88 % |
| Navigationnelle / locale | Homepages | 13,56 % |
Le contraste est frappant : les articles passent de 45,48 % en informationnel à des niveaux beaucoup plus faibles en commercial et transactionnel. Symétriquement, les pages produit explosent en transactionnel mais sont quasi absentes en informationnel.
Les différences par moteur
Si l'intention pèse plus que le moteur, les biais par engine ne disparaissent pas pour autant. Trois observations claires se dégagent.
Perplexity privilégie les discussions communautaires
17 % des citations Perplexity proviennent de contenus type discussion (Reddit, forums spécialisés, plateformes communautaires comme G2). C'est plus du double de la part observée chez ChatGPT et Google AI Mode. Pour qui veut être cité dans Perplexity, négliger sa présence sur Reddit ou les forums sectoriels est une erreur d'allocation. Cela confirme aussi les observations Digital Bloom sur la place de Reddit (46,7 % des citations) chez Perplexity.
ChatGPT favorise les articles
Les articles sont surreprésentés dans les citations ChatGPT par rapport à la moyenne des trois moteurs. C'est cohérent avec le profil de ChatGPT comme assistant généraliste qui s'appuie volontiers sur des contenus éditoriaux structurés et autoritaires.
Google AI Mode propose la distribution la plus équilibrée
Google AI Mode ne sur-représente aucun type de contenu de manière flagrante. Sa distribution ressemble à une moyenne lissée des autres engines. C'est probablement lié à la diversité des sources que Google peut mobiliser (sa propre base d'index, YouTube, Maps, Reddit qu'il indexe en propre), qui produit une plus grande variété de formats cités.
La conclusion clé : intention > secteur > moteur
Tom Wells résume sa propre étude par une phrase : « l'intention de recherche est un prédicteur plus fort du type de contenu cité que le secteur d'activité ou le choix du modèle ». C'est la phrase à retenir.
En pratique, cela hiérarchise les leviers d'une stratégie GEO :
- Adapter le format au type d'intention ciblée est le levier numéro un. Un listicle pour le commercial, un article pour l'informationnel, une page produit pour le transactionnel, une homepage solide pour le navigationnel.
- Respecter les spécificités sectorielles arrive ensuite. La taxonomie attendue n'est pas exactement la même en SaaS B2B (où les comparatifs comptent énormément) qu'en santé (où l'autorité éditoriale prime).
- Optimiser pour un moteur en particulier est le levier le moins puissant. C'est utile pour aller chercher quelques pourcents supplémentaires sur Perplexity ou Gemini, pas pour bâtir une stratégie de fond.
Ce qu'on peut en tirer concrètement pour le GEO
- Cartographier ses intentions de recherche avant de produire du contenu. La même thématique peut générer 4 ou 5 intentions distinctes, qui exigeront 4 ou 5 formats différents. Fini la page « tout-en-un » qui coche toutes les cases.
- Traiter sérieusement le format listicle. Ce n'est pas un format paresseux, c'est le format que les LLMs extraient le plus naturellement. Mais à condition d'être structuré rigoureusement (listes ordonnées, critères explicites, sources, et pas une suite de paragraphes habillée d'un titre « top »).
- Ne pas négliger les pages produit pour le GEO transactionnel. Beaucoup d'équipes considèrent que les pages produit sont des actifs e-commerce mais pas SEO/GEO. Wix montre qu'elles sont citées massivement dès qu'on entre dans l'intention transactionnelle.
- Investir dans Reddit et les forums communautaires si Perplexity est important pour votre audience. Le contournement par les contenus tiers structurés est plus efficace que d'essayer de faire entrer son propre site dans les citations Perplexity.
- Aligner sa taxonomie de contenu avec les 4 grandes intentions. Avant de lancer un nouveau hub éditorial, demandez-vous lequel des 4 segments d'intention il couvre, et quelle proportion de votre catalogue sert quel segment.
Limites de l'étude
- Conflit d'intérêts éditeur. Wix est vendeur de plateforme et d'outils GEO indirects. La sélection des données et l'interprétation peuvent valoriser le narratif marketing du groupe.
- Données collectées via Peec AI. Donc via API, pas via les interfaces utilisateurs réelles. Les ratios restent valides, l'absolu est à nuancer (cf. notre analyse API vs interface réelle).
- Période d'observation non précisée. On ne sait pas sur combien de jours ou de semaines les 75 000 réponses ont été collectées. Cela limite la comparaison avec d'autres études temporelles.
- 5 secteurs anglo-saxons. eCommerce, Health, Home Repair, Professional Services, SaaS. Aucune couverture du B2B technique européen, de l'industrie, du tourisme, etc. Les ratios peuvent différer fortement sur ces segments non couverts.
- Pas de revue par les pairs. Comme la plupart des publications GEO actuelles, c'est de la recherche industrielle, pas académique. À traiter en ordres de grandeur, pas en mesures de référence absolues.
- Données nord-américaines dominantes. Les requêtes ne sont pas explicitement marquées comme étant en français ou exécutées sur des comptes localisés FR. Sur le marché francophone, certaines tendances peuvent différer (poids des forums vs anglo-saxons, place de YouTube FR, etc.).
Sources
- Wix AI Search Lab · Content types most cited by LLMs (Tom Wells, 3 mars 2026) - source primaire de l'étude.
- Eloq.io · Étude GEO sur les types de contenu que les moteurs IA citent (Harold Paris) - relais francophone de l'étude Wix avec quelques chiffres détaillés additionnels attribués à la source originale.
- Digital Bloom 2025 - 47,9 % des citations ChatGPT viennent de Wikipedia, 46,7 % des citations Perplexity viennent de Reddit. Convergence avec les biais de discussions observés ici.
- Yext & Superlines - les biais de citation par moteur (Gemini privilégie les sites de marques, ChatGPT les sites tiers).
- LLM Research Lab - facteurs de classement détaillés pour le GEO.
- Comparatif ChatGPT vs Perplexity vs Gemini - synthèse opérationnelle des biais par plateforme.
- Retour au hub : toutes les études GEO