Wix AI Search Lab : quels types de contenus les LLMs citent vraiment ? (1 056 727 citations)

L'étude analyse 1 056 727 citations issues de 75 000 réponses IA sur trois moteurs (ChatGPT, Google AI Mode, Perplexity), via la plateforme de tracking Peec AI. Échantillon segmenté sur 5 secteurs et 4 intentions de recherche.
Trois formats captent à eux seuls 52 % des citations IA tous segments confondus : listicles (21,9 %), articles (16,7 %) et pages produit (13,7 %).
L'intention de recherche est un prédicteur plus fort du type de contenu cité que le secteur d'activité ou le moteur. Concrètement : articles dominent l'informationnel (45,48 %), listicles dominent le commercial (40,86 %), pages produit dominent le transactionnel (24,88 %).
Les biais par moteur restent significatifs : Perplexity tire 17 % de ses citations de discussions (Reddit, forums) - plus du double des autres engines. Google AI Mode propose la distribution la plus équilibrée.

Quand on construit une stratégie GEO, la première question opérationnelle est rarement « comment optimiser ? » mais « quoi optimiser ? ». Quelle page produire en priorité, sous quel format, pour quelle intention de recherche. L'étude publiée par Wix AI Search Lab le 3 mars 2026 apporte des éléments chiffrés solides à cette question, en analysant un volume de données substantiel sur les trois principaux engines.

Comme toujours sur ce site, on regarde la source primaire en détail : qui publie, comment, sur quel échantillon, avec quels biais, et qu'est-ce qu'on peut en tirer concrètement.

Le statut de la source

L'étude est publiée par Wix AI Search Lab, l'unité de recherche du groupe Wix dédiée à l'observation du comportement des moteurs IA. Elle est signée par Tom Wells, chercheur GEO, et mise en ligne sur le site institutionnel Wix Studio le 3 mars 2026.

Conflit d'intérêts à connaître. Wix vend une plateforme de création de sites web, dont l'argument commercial intègre désormais l'optimisation pour les LLMs. Une étude de ce type est utile pour la marque comme contenu de thought leadership. Cela ne disqualifie pas les chiffres - la méthodologie est explicite, l'échantillon est exceptionnel par sa taille - mais à intégrer dans la lecture, comme pour Yext et Superlines ou Digital Bloom.

À noter : l'article francophone d'Eloq qui circule depuis fin mars relaye fidèlement les chiffres principaux de l'étude Wix sans la republier. Plusieurs chiffres détaillés (80,9 % de listicles tiers neutres, +48,3 % de surperformance des guides pratiques, etc.) y sont attribués à Wix mais ne figurent pas tels quels dans la version publique de l'étude originale : à utiliser avec la mention « selon Eloq, attribué à Wix » plutôt que « selon Wix ».

La méthodologie en détail

Le protocole d'observation est l'un des plus larges publiés à ce jour sur le sujet du contenu cité par les LLMs.

Paramètre	Valeur	Commentaire
Citations analysées	1 056 727	Volume très supérieur aux études concurrentes
Réponses IA générées	75 000	Soit ~14 citations par réponse en moyenne
Moteurs testés	3	ChatGPT, Google AI Mode, Perplexity
Secteurs couverts	5	eCommerce, Health & Wellness, Home Repair, Professional Services, SaaS
Intentions de recherche	4	Informationnelle, Commerciale, Navigationnelle/locale, Transactionnelle
Plateforme de tracking	Peec AI	Couvert dans notre comparatif d'outils GEO
Période d'observation	Non précisée	Limite méthodologique mineure

L'étude classe les pages citées dans une taxonomie de types de contenus (listicles, articles, pages produit, homepages, guides, discussions, etc.) et calcule leur poids relatif dans les citations selon trois axes croisés : type de contenu, intention de recherche, moteur IA.

L'usage de Peec AI comme source de données. Wix s'appuie sur Peec AI, un outil de tracking GEO commercial, pour collecter les réponses IA. Cela signifie que les requêtes ne sont pas faites directement dans les interfaces utilisateurs (chat.openai.com, perplexity.ai, etc.) mais via les API ou des sessions automatisées que Peec AI orchestre. C'est une limite que nous documentons sur la page outils de tracking GEO : les réponses obtenues via API peuvent différer de ce qu'un utilisateur réel verrait. Les chiffres restent valides en relatif (les ratios entre types de contenus), à nuancer en absolu.

La distribution globale des citations

Le résultat le plus directement actionnable de l'étude est cette photographie des types de contenus qui dominent les citations IA, tous secteurs et toutes intentions confondus.

Top 3 des types de contenus cités par les LLMs

Part du total des 1 056 727 citations · Wix AI Search Lab, mars 2026

Listicles 21,9 %
Articles 16,7 %
Pages produit 13,7 %

Ces trois formats représentent à eux seuls plus de la moitié des citations toutes catégories confondues. Les 48 % restants se répartissent entre une dizaine de formats secondaires (homepages, guides, FAQ, discussions issues de Reddit ou de forums, pages d'avis, vidéos YouTube, etc.).

À noter que les listicles - les articles structurés en listes type « 10 meilleurs CRM en 2026 » - sortent en tête. C'est cohérent avec l'observation que les LLMs identifient et extraient plus facilement des unités sémantiques courtes et autonomes, ce qu'on a documenté sur notre page front-loading des contenus.

Par intention de recherche : l'angle le plus fort de l'étude

C'est probablement la conclusion la plus actionnable de Wells : l'intention de recherche prédit mieux le type de contenu cité que le secteur d'activité ou le moteur. Autrement dit, peu importe que vous soyez en SaaS, en santé ou en e-commerce : si l'utilisateur pose une question informationnelle, c'est un article qui sera cité, pas une page produit. Et inversement.

Intention	Type de contenu dominant	Part des citations dans cette intention
Informationnelle	Articles	45,48 %
Commerciale	Listicles	40,86 %
Transactionnelle	Pages produit	24,88 %
Navigationnelle / locale	Homepages	13,56 %

Le contraste est frappant : les articles passent de 45,48 % en informationnel à des niveaux beaucoup plus faibles en commercial et transactionnel. Symétriquement, les pages produit explosent en transactionnel mais sont quasi absentes en informationnel.

Pourquoi c'est utile en pratique. Cette répartition donne une grille concrète pour décider quel format produire en fonction de la requête cible. Si vous visez « qu'est-ce qu'un CRM » (informationnel), produisez un article. Si vous visez « meilleurs CRM pour PME » (commercial), produisez un listicle. Si vous visez « acheter [produit] en ligne » (transactionnel), travaillez vos pages produit. C'est une logique différente du SEO classique où une seule page bien optimisée pouvait tenter de couvrir plusieurs intentions.

Les différences par moteur

Si l'intention pèse plus que le moteur, les biais par engine ne disparaissent pas pour autant. Trois observations claires se dégagent.

Perplexity privilégie les discussions communautaires

17 % des citations Perplexity proviennent de contenus type discussion (Reddit, forums spécialisés, plateformes communautaires comme G2). C'est plus du double de la part observée chez ChatGPT et Google AI Mode. Pour qui veut être cité dans Perplexity, négliger sa présence sur Reddit ou les forums sectoriels est une erreur d'allocation. Cela confirme aussi les observations Digital Bloom sur la place de Reddit (46,7 % des citations) chez Perplexity.

ChatGPT favorise les articles

Les articles sont surreprésentés dans les citations ChatGPT par rapport à la moyenne des trois moteurs. C'est cohérent avec le profil de ChatGPT comme assistant généraliste qui s'appuie volontiers sur des contenus éditoriaux structurés et autoritaires.

Google AI Mode propose la distribution la plus équilibrée

Google AI Mode ne sur-représente aucun type de contenu de manière flagrante. Sa distribution ressemble à une moyenne lissée des autres engines. C'est probablement lié à la diversité des sources que Google peut mobiliser (sa propre base d'index, YouTube, Maps, Reddit qu'il indexe en propre), qui produit une plus grande variété de formats cités.

La conclusion clé : intention > secteur > moteur

Tom Wells résume sa propre étude par une phrase : « l'intention de recherche est un prédicteur plus fort du type de contenu cité que le secteur d'activité ou le choix du modèle ». C'est la phrase à retenir.

En pratique, cela hiérarchise les leviers d'une stratégie GEO :

Adapter le format au type d'intention ciblée est le levier numéro un. Un listicle pour le commercial, un article pour l'informationnel, une page produit pour le transactionnel, une homepage solide pour le navigationnel.
Respecter les spécificités sectorielles arrive ensuite. La taxonomie attendue n'est pas exactement la même en SaaS B2B (où les comparatifs comptent énormément) qu'en santé (où l'autorité éditoriale prime).
Optimiser pour un moteur en particulier est le levier le moins puissant. C'est utile pour aller chercher quelques pourcents supplémentaires sur Perplexity ou Gemini, pas pour bâtir une stratégie de fond.

Ce qu'on peut en tirer concrètement pour le GEO

Cartographier ses intentions de recherche avant de produire du contenu. La même thématique peut générer 4 ou 5 intentions distinctes, qui exigeront 4 ou 5 formats différents. Fini la page « tout-en-un » qui coche toutes les cases.
Traiter sérieusement le format listicle. Ce n'est pas un format paresseux, c'est le format que les LLMs extraient le plus naturellement. Mais à condition d'être structuré rigoureusement (listes ordonnées, critères explicites, sources, et pas une suite de paragraphes habillée d'un titre « top »).
Ne pas négliger les pages produit pour le GEO transactionnel. Beaucoup d'équipes considèrent que les pages produit sont des actifs e-commerce mais pas SEO/GEO. Wix montre qu'elles sont citées massivement dès qu'on entre dans l'intention transactionnelle.
Investir dans Reddit et les forums communautaires si Perplexity est important pour votre audience. Le contournement par les contenus tiers structurés est plus efficace que d'essayer de faire entrer son propre site dans les citations Perplexity.
Aligner sa taxonomie de contenu avec les 4 grandes intentions. Avant de lancer un nouveau hub éditorial, demandez-vous lequel des 4 segments d'intention il couvre, et quelle proportion de votre catalogue sert quel segment.

Limites de l'étude

Conflit d'intérêts éditeur. Wix est vendeur de plateforme et d'outils GEO indirects. La sélection des données et l'interprétation peuvent valoriser le narratif marketing du groupe.
Données collectées via Peec AI. Donc via API, pas via les interfaces utilisateurs réelles. Les ratios restent valides, l'absolu est à nuancer (cf. notre analyse API vs interface réelle).
Période d'observation non précisée. On ne sait pas sur combien de jours ou de semaines les 75 000 réponses ont été collectées. Cela limite la comparaison avec d'autres études temporelles.
5 secteurs anglo-saxons. eCommerce, Health, Home Repair, Professional Services, SaaS. Aucune couverture du B2B technique européen, de l'industrie, du tourisme, etc. Les ratios peuvent différer fortement sur ces segments non couverts.
Pas de revue par les pairs. Comme la plupart des publications GEO actuelles, c'est de la recherche industrielle, pas académique. À traiter en ordres de grandeur, pas en mesures de référence absolues.
Données nord-américaines dominantes. Les requêtes ne sont pas explicitement marquées comme étant en français ou exécutées sur des comptes localisés FR. Sur le marché francophone, certaines tendances peuvent différer (poids des forums vs anglo-saxons, place de YouTube FR, etc.).

Sources

Wix AI Search Lab · Content types most cited by LLMs (Tom Wells, 3 mars 2026) - source primaire de l'étude.
Eloq.io · Étude GEO sur les types de contenu que les moteurs IA citent (Harold Paris) - relais francophone de l'étude Wix avec quelques chiffres détaillés additionnels attribués à la source originale.

Études complémentaires sur le site :

Digital Bloom 2025 - 47,9 % des citations ChatGPT viennent de Wikipedia, 46,7 % des citations Perplexity viennent de Reddit. Convergence avec les biais de discussions observés ici.
Yext & Superlines - les biais de citation par moteur (Gemini privilégie les sites de marques, ChatGPT les sites tiers).
LLM Research Lab - facteurs de classement détaillés pour le GEO.
Comparatif ChatGPT vs Perplexity vs Gemini - synthèse opérationnelle des biais par plateforme.
Retour au hub : toutes les études GEO