TL;DR: 25 konkrete Maßnahmen, um die Häufigkeit zu erhöhen, mit der ChatGPT, Claude, Gemini und Perplexity Ihre Marke zitieren. Jede Zahl ist belegt. Maßnahme Nr. 2 (llms.txt) wurde neu geschrieben, um abzubilden, was vier unabhängige Studien und auch Google selbst inzwischen dazu sagen.
Am 15. Mai 2026 hat Google seinen AI Optimization Guide veröffentlicht. Die Position ist eindeutig: Aus Sicht von Google Search ist Optimierung für generative KI weiterhin SEO, und Taktiken wie llms.txt, KI-spezifisches Schema.org, Content-Chunking oder unauthentische Erwähnungen werden ausdrücklich verworfen. Google hat ein kommerzielles Interesse, diese Linie zu ziehen. Sein Ökosystem (Search, AI Overviews, Ads) hängt davon ab, einziger Einstiegspunkt zu bleiben. Werkzeuge, die Sichtbarkeit in ChatGPT, Claude oder Perplexity messen, liegen per Definition außerhalb dieses Perimeters.
Das empirische Bild ist differenzierter als beide vereinfachten Lesarten. Limy (515 Millionen Bot-Events), OtterlyAI (90 Tage Daten), ALLMO (94 614 zitierte URLs) und SE Ranking (300 000 Domains) konvergieren: llms.txt hat heute keinen messbaren Einfluss auf KI-Zitate. Google liegt in diesem konkreten Punkt richtig. Allerdings zeigt das Princeton-GEO-Paper (KDD 2024), dass andere Techniken, die Google nie benennt, messbare Effekte erzielen. Quotation Addition ist die am besten abschneidende getestete Methode: +41 % auf Position-Adjusted Word Count, +28 % auf Subjective Impression. Statistics Addition und Cite Sources folgen bei +30 bis +40 % auf derselben Metrik. Cite Sources allein erzeugte +115 % Sichtbarkeit für Sites, die auf Position fünf der SERP starteten, was das Paper als Demokratisierungseffekt bezeichnet.
Die folgende Checkliste basiert auf dieser empirischen Schicht, nicht auf Anbieterpositionen.
Baseline 2026
So nutzen Sie diese Liste
Gehen Sie die fünf Kategorien in der vorgegebenen Reihenfolge durch. Die technischen Grundlagen stehen vorn, weil sie alles Weitere bedingen. Schärfen Sie danach die Inhaltsstruktur, bauen Sie Autoritätssignale auf, erweitern Sie Ihre Präsenz über Google hinaus und installieren Sie zuletzt die Messung. In der Mitte der Liste verweist ein CTA auf ein konkretes Werkzeug, weil ab einem bestimmten Volumen das manuelle Tracking nicht mehr skaliert. Der Rest ist Methode, kein Produkt.
1. Technische Grundlagen
Die Crawl-, Render- und Discovery-Ebene, die alles Weitere bedingtDie ehrliche Version: Ahrefs hat im Mai 2026 1 885 Seiten analysiert und keinen messbaren Lift bei AI-Overview-Zitaten durch Schema.org gefunden, in einigen Segmenten sogar eine leicht negative Korrelation. Der Google-Leitfaden vom Mai 2026 sagt dasselbe. Der Grund, strukturierte Daten auszurollen, bleibt unverändert: Rich Results in klassischen SERPs, saubere Verarbeitung durch Bing und DuckDuckGo, besseres Parsing durch nachgelagerte Knowledge Graphs. Behandeln Sie Schema.org als Pflicht, nicht als GEO-Hebel.
Starten Sie mit Organization auf der Startseite und Article auf jeder redaktionellen Seite. Ergänzen Sie FAQPage dort, wo bereits ein echter FAQ-Block existiert. Validieren Sie mit dem Rich Results Test von Google. Verzichten Sie auf die KI-spezifischen Schema-Erweiterungen, die Google ausdrücklich zu ignorieren rät.
Vier unabhängige Messungen zwischen Ende 2025 und Anfang 2026 kommen zum gleichen Befund. Limy hat 408 Aufrufe von /llms.txt bei 515 Millionen Bot-Events gemessen (statistisch null). OtterlyAI sah 84 Treffer bei 62 100 Bot-Besuchen (0,1 %). ALLMO fand llms.txt in 0,00106 % der zitierten URLs über 11 867 KI-Antworten hinweg. SE Ranking hat ein XGBoost-Modell über 300 000 Domains laufen lassen und keinen Effekt auf die Zitierhäufigkeit gefunden. Der echte Anwendungsfall ist das Agentic Web: Produkte, die von Cursor, Claude Code, Copilot oder MCP-kompatiblen Tools konsumiert werden. Stripe, Vercel und Anthropic veröffentlichen ihr llms.txt genau aus diesem Grund.
Wenn Sie eine API oder eine entwicklergerichtete Dokumentationsseite betreiben, liefern Sie llms.txt und llms-full.txt mit knappen Endpoint-Referenzen aus. Wenn Ihre Zielgruppe Endnutzer sind, die in ChatGPT oder Perplexity suchen, ist Ihre Zeit bei den Maßnahmen Nr. 6 bis Nr. 10 besser investiert. Die differenzierte Lesart von KIME ist die acht Minuten wert.
Die Search-Engine-Land-Analyse über 107 000 Seiten ordnet Core Web Vitals als Schwellenwert ein, nicht als Wachstumshebel. Schlechte Performance korreliert negativ mit der AI-Overviews-Sichtbarkeit (Korrelation zwischen -0,12 und -0,18), aber ein ohnehin akzeptabler Score weiter zu verbessern, bringt keinen messbaren Schub. Der Mechanismus bleibt gültig: Die RAG-Systeme hinter generativen Engines arbeiten mit harten Timeouts pro Quelle, eine langsame Seite wird stillschweigend verworfen, bevor das Modell sie überhaupt sieht. Ziel ist, die Schwelle zu nehmen, nicht sie zu pulverisieren.
Starten Sie PageSpeed Insights zuerst auf Ihren zehn meistzitierten Seiten. WebP oder AVIF für Hero-Bilder, verzögerte Drittanbieter-Skripte, Edge-Caching und ein kritisches CSS-Subset bewegen meist mehr als Mikro-Optimierungen.
Der Mobile-First-Index von Google ist inzwischen der einzige Index. Die ChatGPT-Mobile-App und die Perplexity-Mobile-App rendern die ganze Seite, bevor sie Zitate extrahieren. Ausgeprägter Layout Shift oder unleserliche Typografie senken die Wahrscheinlichkeit, dass Ihre Seite den Zitationsfilter passiert.
Testen Sie auf drei physischen Geräten, nicht im Responsive-Emulator. Tap Targets ≥ 44 px, kein horizontales Scrollen, Viewport-Meta vorhanden, Bodytext ≥ 16 px.
GPTBot, ClaudeBot, PerplexityBot, GoogleOther, Applebot-Extended, Bytespider und die anderen verhalten sich unterschiedlich. Einige respektieren Allow / Disallow streng, andere ignorieren es. GPTBot zu blockieren blockiert nicht das Echtzeit-Browsing von ChatGPT, das einen anderen User-Agent nutzt. Die Frage ist redaktionell: Soll Ihr Content Trainingskorpora speisen, Echtzeit-Retrieval, beides oder keines davon?
Auditieren Sie Ihre aktuelle robots.txt. Für die meisten B2B-Publisher maximiert das Zulassen von GPTBot, ClaudeBot, PerplexityBot und GoogleOther die Zitationsfläche. Wenn Sie Training ausschließen, Retrieval aber zulassen wollen, dokumentieren Sie die Policy öffentlich und nutzen Sie die User-Agent-Strings, die jeder Anbieter publiziert.
2. Inhaltsstruktur
Was das Princeton-GEO-Paper tatsächlich belegt, mit ZahlenGenerative Engines extrahieren die am leichtesten extrahierbare Passage. Eine Seite, die ihre Kernantwort in den ersten 80 bis 120 Wörtern liefert, ist parsebar. Eine Seite, die 600 Wörter Spannung aufbaut, bevor die Antwort kommt, übersteht das Chunking selten.
Formulieren Sie pro Seite die Antwort in zwei Sätzen, bevor Sie den Rest schreiben. Platzieren Sie diese zwei Sätze direkt nach dem H1. Nutzen Sie den Fließtext, um zu nuancieren, zu verteidigen und zu belegen.
Generative Engines behandeln Überschriften als semantische Anker. Eine Überschrift wie „Preise“ ist mehrdeutig. „Wie viel kostet ein Audit für eine Website mit 50 Seiten“ trifft ein tatsächliches Prompt-Muster. Princeton dokumentiert klare Gewinne im Retrieval-Rang, wenn Abschnittsgrenzen auf benutzerformulierte Fragen abgebildet sind.
Holen Sie sich Ihre zwanzig häufigsten Fragen aus Vertriebsgesprächen, Support-Tickets oder AlsoAsked. Übernehmen Sie die exakte Formulierung als H2. Vermeiden Sie Keyword-Stuffing in Überschriften, das der Google-Leitfaden vom Mai 2026 explizit anspricht.
Q/A-Struktur spiegelt das Prompt-Format wider, um das herum generative Engines optimieren. Erfundene FAQ-Blöcke zur SEO-Verschleierung funktionieren nicht mehr und triggern den Scaled-Content-Klassifizierer von Google (Update Mai 2026). Echte FAQs aus tatsächlich wiederkehrenden Fragen helfen weiterhin.
Fünf bis acht Fragen pro Seite, aus Vertriebstranskripten oder Supportdaten gewonnen. Mit FAQPage-Schema kombinieren. Vierteljährlich aktualisieren: Frageformulierungen driften schneller, als man denkt.
Das Princeton-GEO-Paper (KDD 2024, 10 000 Queries über 25 Domains) hat einen Lift von +41 % beim Position-Adjusted Word Count gemessen, wenn Seiten Zitate mit benannter Quelle ergänzten. Generative Engines gewichten Provenienz stark, wenn sie zwischen konkurrierenden Antworten entscheiden.
Ein Zitat einer benannten Expertin, eines Analysten oder einer Führungskraft pro Hauptabschnitt. Funktion und Publikation oder Datum nennen. Formulierungen wie „Branchenexperten sagen“ vermeiden, sie haben keinerlei Retrieval-Gewicht.
Princeton hat einen Lift von +30 bis +40 % auf Position-Adjusted Word Count für Seiten gemessen, die mit belegten Statistiken angereichert sind. Das Paper gruppiert Cite Sources, Quotation Addition und Statistics Addition als die drei stärksten Methoden auf dieser Metrik. Der Mechanismus ist ähnlich wie bei Maßnahme Nr. 9: Provenienz senkt die Modellunsicherheit, also wird die Passage ausgewählt. Anonyme Statistiken bewirken keinen messbaren Lift.
Jede Zahl verlinkt. Jede Zahl datiert. Recyceln Sie nie eine Statistik, ohne das Original zu prüfen. Dieser Artikel ist bewusst so aufgebaut und für jeden überprüfbar.
Sehen Sie Ihren Ausgangspunkt
Bevor Sie die verbleibenden fünfzehn Maßnahmen angehen, machen Sie eine Momentaufnahme Ihrer aktuellen Situation in ChatGPT, Claude, Gemini und Perplexity. Ein kostenloses Audit dauert wenige Minuten und liefert Ihnen die Baseline, gegen die Sie alles Weitere messen.
Kostenloses Audit starten3. Autorität und E-E-A-T
Provenienzsignale, die sowohl Google-Ranking als auch LLM-Zitierlogik standhaltenGenerative Engines entscheiden teils über das Autorensignal: identifizierbare Personen mit LinkedIn-Profil, Publikationshistorie und Credentials wiegen im Retrieval schwerer als anonyme Bylines. E-E-A-T bleibt der operativste Rahmen, den Google veröffentlicht hat, und Princetons Source-Trustworthiness-Konzept passt dazu.
Eine Seite pro Autor unter /autor/{slug}: echtes Foto, 150 bis 200 Wörter Biografie, Credentials, Publikationsliste, LinkedIn-Link. Aus jedem Artikel querverlinken.
Case Studies mit messbaren Ergebnissen, namentlich genannten Kunden (sofern der Vertrag es erlaubt), eigenen Datensätzen und Screenshots aus tatsächlichen Dashboards wiegen mehr als allgemeine Erklärtexte. Das ist das erste „E“ in E-E-A-T und die am schwersten zu fälschende Dimension.
Eine Case Study pro Quartal und Servicelinie. Briefing, Vorgehen und messbares Ergebnis nennen. Bei anonymisierten Daten erklären, warum.
Ein isolierter Artikel wiegt weniger als ein kohärentes Set aus zehn vernetzten Beiträgen, die ein Thema in der Tiefe abdecken. Generative Engines suchen Breite und interne Konsistenz, bevor sie eine Quelle zu einem Thema bevorzugen.
Wählen Sie drei bis fünf Themen, die zu Ihrer tatsächlichen Expertise passen. Pro Thema eine Pillar-Page (ab 2 500 Wörtern) plus acht bis zehn Satelliten (1 200 bis 1 800 Wörter). Systematische interne Verlinkung. Pillar alle sechs Monate auffrischen.
Princeton hat einen Lift von +30 % auf Position-Adjusted Word Count beim Zitieren externer Quellen gemessen. Konkret erzeugte die Cite-Sources-Methode +115 % Sichtbarkeit für Sites, die auf Position fünf der SERP starteten, ein Ergebnis, das das Paper als Demokratisierungseffekt rahmt. Das Umgekehrte gilt ebenfalls: Zitiert zu werden von Fachpresse, Branchenreports oder Peer-reviewed-Arbeiten erhöht die Retrieval-Wahrscheinlichkeit.
Zielen Sie auf drei bis fünf Publikationen pro Quartal für Gastbeiträge, Experten-Interviews oder gemeinsam veröffentlichte Studien. Vermeiden Sie Mass-Guest-Post-Plattformen. Wikipedia ist die Mühe wert, wenn Sie die Notabilitätskriterien wirklich erfüllen.
Die SE-Ranking-Daten, aufbereitet durch ZipTie, weisen aus, dass rund 76 % der am häufigsten von ChatGPT zitierten Seiten in den vorangehenden 30 Tagen substanziell aktualisiert wurden. Aktualität wirkt als Vertrauens-Proxy für das Modell, wenn Themen schnell driften.
Führen Sie einen Refresh-Kalender für Ihre zwanzig strategischsten Seiten. Ein Refresh muss substanziell sein (neue Sektion, aktualisierte Statistiken, gestrichene veraltete Aussage), kein bloßes Datumsänderungen. Machen Sie die Änderung sichtbar, indem Sie das angezeigte Modifikationsdatum aktualisieren.
4. Multi-LLM-Präsenz
Wo GEO/AEO als Disziplin ihre Bedeutung behält, jenseits des Google-PerimetersDer Google-Leitfaden vom Mai 2026 endet am Google-Perimeter. ChatGPT, Claude und Perplexity laufen auf unterschiedlichen Retrieval-Stacks mit unterschiedlichen Quellenpräferenzen. Similarweb hat ChatGPT im März 2026 mit 56,7 % des KI-Assistenten-Traffics gemessen, Gemini bei rund 18 %, der Rest verteilt auf Claude, Perplexity, Copilot und Grok. Eine Marke, die in ChatGPT häufig zitiert wird, kann in Perplexity vollkommen abwesend sein.
Wählen Sie zehn geschäftskritische Prompts aus, die Ihre Interessenten stellen könnten. Lassen Sie sie auf jeder Engine laufen, manuell falls nötig. Protokollieren Sie, ob Sie zitiert werden, an welcher Stelle in der Antwort und mit welchem Kontext. Identifizieren Sie die Engine, in der Sie am stärksten unterrepräsentiert sind.
BrightEdge (Februar 2026) hat AI Overviews bei knapp der Hälfte der Queries in neun kommerziellen Branchen verzeichnet, mit Spitzen bei 88 % in Healthcare, 83 % in Education und 82 % in B2B Tech. Seer Interactive hat einen CTR-Rückgang von 61 % auf den darunter liegenden Page-1-Ergebnissen gemessen (3 119 Queries, 25 Mio. Impressions). seoClarity berichtet, dass 97 % der AIO-Quellen aus den organischen Top 20 stammen, was bedeutet: klassisches SEO bleibt die Eintrittstür.
Lassen Sie Ihre Prioritäts-Keywords auf Google US Desktop laufen. Notieren Sie, welche einen AIO auslösen. Erfassen Sie die zitierten Quellen. Führen Sie einen separaten Tracker für die AIO-Präsenz, getrennt vom organischen Ranking-Monitoring.
ChatGPT-Search und Perplexity indexieren Reddit-Threads und Quora-Antworten massiv. Authentische Diskussionen, hoch bewertete Antworten und Nutzerrezensionen tragen Community-Vertrauenssignale, auf die sich generative Engines stützen, vor allem bei Vergleichs- und How-to-Anfragen.
Identifizieren Sie fünf Subreddits und zehn Quora-Themen, die zur Reise Ihrer Interessenten passen. Tragen Sie authentisch bei. Erwähnen Sie Ihr Produkt nur, wenn es die Frage beantwortet. Spam endet im Bann, und Banns breiten sich aus.
Für Vergleichs- und Empfehlungsanfragen greifen generative Engines auf Branchenverzeichnisse zurück (G2, Capterra, vertikale Listen). Ein vollständiges Profil in den fünf richtigen Verzeichnissen schlägt Präsenz in fünfzig zufälligen.
Identifizieren Sie die fünf am häufigsten zitierten Verzeichnisse Ihrer Branche. Vervollständigen Sie jedes Profil zu 100 %. Bitten Sie zufriedene Kunden um Bewertungen. Halten Sie die NAP-Daten quellenübergreifend konsistent.
Sprachassistenten und Chat-Interfaces bevorzugen Anfragen in natürlicher Sprache: länger, vollständige Sätze, oft als Frage formuliert. Eine Seite, die diese Formulierung im Inhalt aufgreift, tritt leichter als Antwort hervor.
Zielen Sie auf lange Anfragen in natürlicher Sprache („wie wähle ich ein CRM für ein 20-köpfiges Vertriebsteam“ statt „bestes CRM“). Halten Sie Sektionsantworten bei 40 bis 60 Wörtern. Vollständige Sätze. Das SpeakableSpecification-Schema lohnt sich, wenn Sie außerdem Audioinhalte publizieren.
5. Messung
Ohne Messung werden alle anderen Maßnahmen zum BauchgefühlOhne Baseline wird jede spätere Änderung anekdotisch. Manuelles Prompt-Logging trägt für die ersten zwanzig bis dreißig Queries. Jenseits davon braucht es einen dedizierten Tracker, um die Methodik über Wochen und Engines hinweg stabil zu halten.
Konfigurieren Sie das Tracking auf 20 bis 50 strategischen Prompts. Wöchentlich auf vier Engines laufen lassen. Referrer-Traffic von chatgpt.com, perplexity.ai, claude.ai und gemini.google.com in Ihrer Analytics protokollieren. Alarme bei neuen Erwähnungen oder Verlusten.
Sie können nicht jede mögliche Anfrage tracken. Sie können die tracken, die echten Kaufentscheidungen entsprechen. Ein gut gewähltes Set von 30 Prompts liefert ein schärferes Signal als ein unscharfes Set von 300.
Quellen: Pre-Sales-Fragen aus Vertriebsgesprächen, Wettbewerbsvergleiche, „bestes X für Y“-Muster, branchenspezifische Fragen. Nach Kaufphase kategorisieren. Liste vierteljährlich überprüfen.
Der KI-Share-of-Voice misst den Anteil der Zitate, den Sie gegenüber Wettbewerbern auf einem definierten Prompt-Set einsammeln. Es ist das engste Pendant zum SEO-Ranking und der stabilste KPI für Monat-zu-Monat-Tracking.
Listen Sie für jeden strategischen Prompt jede zitierte Marke auf. Berechnen Sie Ihren Anteil als (Ihre Zitate / Gesamtzahl Zitate) × 100. Monatlich beobachten. Mit Sentiment kreuzen: negativ erwähnt zu werden ist nicht dasselbe wie überhaupt erwähnt zu werden.
Was in einer Branche funktioniert, funktioniert nicht zwangsläufig in einer anderen. Der einzig verlässliche Weg, herauszufinden, welche Formate für Ihre Prompts gewinnen, ist Testen: FAQ gegen Fließtext, nummerierte Listen gegen Absätze, kurze gegen ausführliche Antworten.
Jeden Test vier bis sechs Wochen laufen lassen. Pro Test nur eine Variable ändern. Vergleichen Sie die Zitierhäufigkeit vor und nach der Änderung auf den Prompts, die die Seite anvisiert. Generative Engines aktualisieren langsamer als Google, kurze Tests erzeugen Rauschen.
Regelmäßiges Reporting baut das institutionelle Gedächtnis dessen auf, was funktioniert hat, und die Glaubwürdigkeit, weiter in die Disziplin zu investieren. Es ist auch der effizienteste Weg, unerwartete Drift zwischen zwei Modell-Updates zu erkennen.
Maximal zwei Seiten. Share-of-Voice-Trend, neue Zitate, verlorene Zitate, wichtigste Siege und Niederlagen, geplante Maßnahmen für den Folgemonat. Jeden Monat dasselbe Template, damit Veränderungen auf einen Blick sichtbar sind.
Die fünf Kategorien auf einen Blick
- Technik (1-5): Schema als Pflicht, llms.txt nur für Agenten, LCP unter 2,5 s, mobile-first, robots.txt bewusst gesetzt
- Inhalt (6-10): Antwort zuerst, Überschriften als Fragen, echte FAQ, benannte Zitate (+41 %), belegte Statistiken (+37-40 %)
- Autorität (11-15): Autorenseiten, Praxiserfahrung, thematische Cluster, externe Zitate (+30 bis +115 %), 30-Tage-Refresh
- Multi-LLM (16-20): vier Engines testen, AIO beobachten, Reddit/Quora, Branchenverzeichnisse, konversationelle Formulierung
- Messung (21-25): Tracking, Prompt-Set, Share of Voice, A/B-Tests, monatliches Reporting
Abschließend
Das beste Argument gegen Annahmen bleibt die Messung. Die Disziplin GEO und AEO, wie immer Google sie auch nennt, lebt oder stirbt mit Ihrer Fähigkeit, einem Stakeholder zu zeigen, dass sich zwischen Monat eins und Monat zwei etwas bewegt hat. Das verlangt benannte Prompts, benannte Engines und eine Methode, die nicht bei jedem Modell-Retraining wechselt. Die 25 Maßnahmen oben sind das Minimum, um dorthin zu gelangen.
Artikel im Mai 2026 überarbeitet nach Veröffentlichung des KI-Leitfadens von Google. Jede Zahl verweist auf ihre Primärquelle. Methode, Datensatz und Grenzen sind überprüfbar. Wenn eine Zahl sich als falsch erweist oder eine Studie überholt wird, aktualisieren wir.