Qu’est-ce que STS Detection (Similarité Textuelle Sémantique) ?

GEO

STS Detection (Similarité Textuelle Sémantique)

La détection STS (Semantic Text Similarity) mesure la proximité sémantique entre les réponses générées par les IA et le contenu propre d'une marque. Un score STS élevé indique que l'IA s'appuie fortement sur le contenu de la marque pour formuler ses réponses, signe d'une forte influence GEO.

Qu'est-ce que la détection STS ?

La détection STS (Semantic Text Similarity) est une technique d'analyse qui mesure la proximité sémantique entre deux textes. Dans le contexte GEO, elle compare les réponses générées par les modèles d'IA avec le contenu publié par une marque sur son propre site web.

Un score de similarité élevé signifie que l'IA "emprunte" le vocabulaire, les formulations et les informations de la marque — signe que le contenu influence directement les réponses générées.

Comment fonctionne la détection STS

L'algorithme procède en plusieurs étapes :

Vectorisation : les textes (réponse IA et contenu marque) sont convertis en vecteurs numériques via des modèles d'embeddings
Comparaison : la similarité cosinus entre les vecteurs est calculée
Score : un pourcentage de similarité est attribué (0% = aucun rapport, 100% = identique)

Au-delà de la correspondance exacte

La STS va bien au-delà de la simple correspondance de mots. Elle capte la similarité de sens, même quand les formulations diffèrent. Si votre page dit "notre solution réduit les coûts de 30%" et que ChatGPT répond "cette entreprise permet des économies d'environ un tiers", la STS détecte la proximité sémantique.

Applications dans AI Labs Audit

AI Labs Audit utilise la détection STS pour :

Mesurer l'influence du contenu de la marque sur les réponses IA
Identifier quelles pages sont les plus "reprises" par les LLMs
Suivre l'évolution de cette influence dans le temps
Comparer l'influence par rapport aux concurrents

Lien avec le taux de mention

La STS complète le taux de mention : tandis que le taux de mention compte si la marque est citée, la STS mesure à quel point le contenu propre de la marque influence la formulation de la réponse.

Une marque peut ne pas être citée explicitement mais voir son contenu largement repris — la STS détecte cette influence "invisible".

Plus de détails dans notre article Tracking des bots IA et mentions LLM.

Sur les réponses des IA, une marque n'apparaît qu'1 fois sur 6. Et la vôtre ?

Chaque question posée à ChatGPT sans votre nom dans la réponse, c'est un concurrent qui est recommandé à votre place — mesuré sur 6 820 réponses d'IA réelles.

Essayer gratuitement Découvrir la plateforme Vous êtes une marque ? Pré-diagnostic gratuit sur AI Labs Radar

Pour aller plus loin

Découvrez notre article approfondi sur ce sujet

Lire l’article