La détection STS (Semantic Text Similarity) mesure la proximité sémantique entre les réponses générées par les IA et le contenu propre d'une marque. Un score STS élevé indique que l'IA s'appuie fortement sur le contenu de la marque pour formuler ses réponses, signe d'une forte influence GEO.
Qu'est-ce que la détection STS ?
La détection STS (Semantic Text Similarity) est une technique d'analyse qui mesure la proximité sémantique entre deux textes. Dans le contexte GEO, elle compare les réponses générées par les modèles d'IA avec le contenu publié par une marque sur son propre site web.
Un score de similarité élevé signifie que l'IA "emprunte" le vocabulaire, les formulations et les informations de la marque — signe que le contenu influence directement les réponses générées.
Comment fonctionne la détection STS
L'algorithme procède en plusieurs étapes :
- Vectorisation : les textes (réponse IA et contenu marque) sont convertis en vecteurs numériques via des modèles d'embeddings
- Comparaison : la similarité cosinus entre les vecteurs est calculée
- Score : un pourcentage de similarité est attribué (0% = aucun rapport, 100% = identique)
Au-delà de la correspondance exacte
La STS va bien au-delà de la simple correspondance de mots. Elle capte la similarité de sens, même quand les formulations diffèrent. Si votre page dit "notre solution réduit les coûts de 30%" et que ChatGPT répond "cette entreprise permet des économies d'environ un tiers", la STS détecte la proximité sémantique.
Applications dans AI Labs Audit
AI Labs Audit utilise la détection STS pour :
- Mesurer l'influence du contenu de la marque sur les réponses IA
- Identifier quelles pages sont les plus "reprises" par les LLMs
- Suivre l'évolution de cette influence dans le temps
- Comparer l'influence par rapport aux concurrents
Lien avec le taux de mention
La STS complète le taux de mention : tandis que le taux de mention compte si la marque est citée, la STS mesure à quel point le contenu propre de la marque influence la formulation de la réponse.
Une marque peut ne pas être citée explicitement mais voir son contenu largement repris — la STS détecte cette influence "invisible".
Plus de détails dans notre article Tracking des bots IA et mentions LLM.