Méthode & Transparence

La preuve : d’une réponse d’IA à un score AGS

Voici, étape par étape, comment un score AGS est réellement produit : on pose une question à un modèle d'IA, on récupère sa réponse brute, on en extrait des faits (la marque est-elle là ? à quelle place ? quels concurrents ? quelles affirmations ?), un jury d'IA note, et tout remonte dans le score. Exemple anonymisé ci-dessous (« Marque B2B IT »).

Exemple illustratif anonymisé : aucun nom réel, aucune URL, aucun claim exact. Le cas est masqué (« Marque B2B IT », concurrents « A » et « B ») et les prompts sont reformulés. Objectif : montrer la mécanique de mesure, pas publier un audit client.

Le pipeline

  1. PROMPT            2. RÉPONSE IA        3. EXTRACTION        4. NOTATION        5. RAPPORT
  (question      -->   (texte brut    -->   (marque ? rang ? -->  (jury d'IA :  -->  (P/I/Q ->
   posée)               du modèle)           concurrents ?         exactitude,        AGS + IC)
                                             claims ?)             sentiment...)

1Cas n°1 : mention positive… mais un claim non vérifié

Prompt (reformulé, anonymisé)

« Pour le support et la maintenance d'infrastructure IT en entreprise, quel fournisseur est le meilleur et pourquoi ? »

Réponse IA (extrait, anonymisé)

« Marque B2B IT s'en sort le mieux pour le support critique… elle met en avant un outil d'analyse prédictive qui résoudrait “plus de 80 % des incidents automatiquement”… Concurrent A reste compétitif sur le coût… »

Extraction (ce que le système détecte)

Marque détectée	Position	Concurrents	Sentiment	Source citée
Oui (mention directe)	1ʳᵉ	Concurrent A, Concurrent B	positif (≈ 0,8 / 1)	aucune

Notation par le jury d’IA

Exactitude : moyenne — un juge flague une affirmation invérifiable : « le chiffre “80 % d'incidents résolus automatiquement” n'est pas vérifiable / possiblement périmé ».
evidence_grounded : false (la réponse n'est appuyée sur aucune source vérifiable).
Confiance du juge : moyenne.

Ce que ça donne dans le rapport

Mention en 1ʳᵉ position et sentiment positif, mais brand-safety abaissée (claim non étayé) : c'est le cas typique « bien cité mais mal soutenu ». Sans cette analyse, on aurait juste vu « cité en n°1, super » ; le système, lui, signale le risque.

2Cas n°2 : la marque n'est pas vraiment connue (cas honnête)

Prompt (reformulé, anonymisé)

« Que peux-tu me dire sur la réputation de Marque B2B IT ? »

Réponse IA (extrait, anonymisé)

« Je n'ai pas d'information vérifiable sur Marque B2B IT dans mes connaissances… »

Extraction & notation

Marque détectée : nom répété, mais is_genuinely_known : false (le modèle ne connaît pas réellement la marque — il paraphrase la question).
Exactitude basse, présence « en écho » et non spontanée.

Dans le rapport

Ce cas ne gonfle pas le score : la présence « écho » (le modèle répète le nom qu'on lui a donné) est distinguée de la visibilité spontanée. C'est précisément ce qui empêche un score flatteur mais faux.

Comment ces réponses deviennent un score

Chaque réponse passe par le jury (plusieurs IA), produit ses notes P / I / Q, et l'AGS agrège le tout en moyenne géométrique, avec intervalle de confiance et GRC (accord inter-juges) publiés. Détail de la formule : voir la page Méthodologie AGS. Limites assumées : voir la page Limites & variabilité.

Note d’honnêteté sur cette page

Cet exemple est anonymisé et reformulé pour illustrer la mécanique sans exposer de client réel. Les chiffres et formulations sont représentatifs, pas un audit nominatif. Prochainement, nous publierons un auto-audit d'AI Labs Audit (nous, nommément), avec des données brutes réelles — y compris nos points faibles.

La méthode

Un exemple anonymisé qui montre comment une réponse d'IA devient réellement un score AGS.

Lire

Limites & variabilité

Mesurer la visibilité IA n'est pas une science exacte. Nous documentons nos limites et comment la méthode les prend en compte.

Lire

Glossaire des termes techniques

Pour aller plus loin

Mesurez la visibilité réelle de votre marque dans les IA

Lancez un audit AGS et obtenez un score auditable, des limites assumées et un plan d'action concret.

Découvrir les tarifs