Die faktische Korrektheit bewertet, ob das, was eine KI über eine Marke behauptet, wahr und belegt ist. Eine nicht überprüfbare oder erfundene Behauptung — selbst eine schmeichelhafte — senkt diese Bewertung und verhindert so, dass eine flüssige Halluzination als gute Antwort durchgeht.
Gutes zu sagen reicht nicht
Eine KI kann eine Marke in lobenden Worten beschreiben und dabei Fakten erfinden: ein Ranking, eine Zertifizierung, eine Zahl. Die faktische Korrektheit (oder grounding) prüft, ob diese Behauptungen wahr und belegt sind, unabhängig von ihrer Tonalität.
Wie es bewertet wird
Die KI-Jury gleicht die Behauptungen mit überprüfbaren Fakten ab. Ein spezifischer Claim, der in den bekannten Fakten fehlt und nicht überprüfbar ist, wird als Halluzination behandelt: Die Korrektheitsbewertung fällt, selbst wenn das Sentiment positiv ist.
Warum das ausschlaggebend ist
Ohne diesen Schutzmechanismus würde eine flüssige Halluzination als exzellente Antwort durchgehen. Die faktische Korrektheit ist die Dimension „Qualität“ des AGS: Sie schützt die Verlässlichkeit des Werts. Ausführliches Beispiel in der Demonstration.
Jede Frage an ChatGPT ohne Ihren Namen in der Antwort ist ein Wettbewerber, der an Ihrer Stelle empfohlen wird — gemessen an 6 820 echten KI-Antworten.