Wie KI Quellen
auswählt
Wenn ChatGPT, Perplexity oder Google AI eine Antwort generieren, wählen sie aus, welche Quellen sie zitieren. Das ist kein zufälliger Prozess. KI durchläuft einen Selektionsmechanismus, der bestimmt, welche Websites vertrauenswürdig genug sind, welcher Content am relevantesten ist und welche Passagen am besten zitierbar sind. Die Top 15 Domains erhalten 68% aller KI-Zitationen. In diesem Artikel erfährst du genau, wie dieser Selektionsprozess funktioniert, warum Domain Authority kaum noch zählt und was tatsächlich bestimmt, ob KI dich als Quelle wählt.
68%
der KI-Zitationen gehen an die Top 15 Domains
r=0,81
Korrelation zwischen E-E-A-T und KI-Zitationen
4%
der KI-Zitationen vorhergesagt durch Domain Authority
21,9
durchschnittliche Quellen pro Perplexity-Antwort
Die Verschiebung von Ranking zu Quellenselektion
Bei Google geht es um Ranking: Welche Seite steht auf Position 1? Bei KI-Suchmaschinen geht es um Quellenselektion: Welche Seite wird als Quelle in der Antwort zitiert? Das sind fundamental verschiedene Prozesse. Ranking ist eine feste Liste. Quellenselektion ist eine dynamische Wahl, die bei jeder Frage neu getroffen wird. Dieselbe Website kann für eine Frage als Quelle gewählt und für eine ähnliche Frage übersprungen werden.
Der Unterschied wird deutlich, wenn du dir die Zahlen anschaust. Nur 38% der Quellen, die in Google AI Overviews zitiert werden, stehen in den Top 10 der regulären Google-Suchergebnisse. Das heißt: 62% der zitierten Quellen sind Seiten, die du in einer normalen Google-Suche nicht einmal auf der ersten Seite finden würdest. KI wählt Quellen nach anderen Kriterien als Google rankt.
Domain Authority verliert an Bedeutung
Domain Authority, jahrelang einer der wichtigsten Prädiktoren für Google-Ranking, sagt nur 4% der KI-Zitationen voraus. Die Korrelation liegt bei r=0,18. Das ist fast vernachlässigbar. Im Vergleich: E-E-A-T (Experience, Expertise, Authoritativeness, Trustworthiness) korreliert mit r=0,81 mit KI-Zitationen. KI belohnt Expertise und Vertrauenswürdigkeit, nicht Domaingröße. Für den deutschen Mittelstand ist das eine gute Nachricht: Du musst nicht die größte Website deiner Branche betreiben, um von KI zitiert zu werden.
Das öffnet die Tür für kleinere Unternehmen und Nischenseiten. Eine spezialisierte Website über Photovoltaik-Anlagen mit starken E-E-A-T-Signalen (Autoreninformationen, Expertennachweise, Zitationen in Fachpublikationen) kann von KI gegenüber einem großen Energieportal mit hoher Domain Authority, aber generischem Content bevorzugt werden. KI sucht die beste Quelle pro spezifischer Frage, nicht die größte Website der Branche.
Aber es gibt eine Kehrseite. Die Konzentration ist hoch: Die Top 15 Domains erhalten 68% aller KI-Zitationen. Reddit dominiert mit 40% aller Zitationen plattformübergreifend. Wikipedia, YouTube und große Nachrichtenseiten nehmen einen Großteil des Rests ein. Außerhalb dieser Top bleibt ein relativ kleiner Anteil der Zitationen für den Rest des Internets. Es ist möglich, als kleinere Website zitiert zu werden, aber du musst gezielt darauf optimieren.
Die Spielregeln haben sich geändert. Domain Authority ist nicht mehr der Schlüssel. E-E-A-T, semantische Vollständigkeit und plattformspezifische Optimierung bestimmen jetzt, ob du als Quelle gewählt wirst.
Wie RAG funktioniert: Trainingsdaten versus Echtzeit-Retrieval
KI-Suchmaschinen nutzen zwei Wissensquellen. Die erste sind Trainingsdaten: die enorme Menge an Text, auf der das Modell trainiert wurde. ChatGPT, Gemini und Claude haben während ihres Trainings Milliarden von Webseiten, Büchern und Dokumenten verarbeitet. Dieses Wissen ist im Modell eingebrannt. Aber Trainingsdaten haben eine Begrenzung: Sie sind eingefroren auf den Zeitpunkt des Trainings. Alles, was danach veröffentlicht wurde, fehlt.
Die zweite Quelle ist RAG: Retrieval-Augmented Generation. Das ist der Mechanismus, mit dem KI Echtzeit-Informationen aus dem Web abruft. Wenn du eine Frage bei Perplexity oder ChatGPT mit Websuche stellst, durchläuft das System zuerst einen Retrieval-Schritt: Es sucht relevante Seiten im aktuellen Web. Diese Seiten werden verarbeitet und die relevanten Passagen werden als Kontext an das Sprachmodell übergeben. Das Modell generiert dann eine Antwort basierend auf seinem Trainingswissen und den abgerufenen Seiten.
Der Retrieval-Schritt als Flaschenhals
RAG ist entscheidend für die Quellenselektion, weil es bestimmt, welche Seiten tatsächlich abgerufen und verarbeitet werden. Das Retrieval-System ist eine Art Vorfilter. Nur Seiten, die durch den Retrieval-Schritt kommen, haben eine Chance auf Zitation. 73% der Fehler in KI-Antworten entstehen in der Retrieval-Phase, nicht in der Generierungsphase. Das bedeutet: Das Problem ist meist nicht, dass KI deinen Content falsch interpretiert, sondern dass sie ihn nicht findet.
Der Retrieval-Schritt funktioniert über eine Kombination aus Suchanfragen und semantischem Matching. KI formuliert intern eine oder mehrere Suchanfragen basierend auf der Nutzerfrage. Sie sucht über einen Suchindex (Perplexity und ChatGPT nutzen unter anderem Bing) und ruft die relevantesten Ergebnisse ab. Diese Ergebnisse werden dann nach Qualität, Relevanz und Vertrauenswürdigkeit gefiltert.
Moderne RAG-Systeme werden immer ausgefeilter. CRAG (Corrective RAG) überprüft die Qualität abgerufener Dokumente und verwirft Quellen, die nicht vertrauenswürdig genug sind. RA-RAG schätzt die Zuverlässigkeit einer Quelle ein, bevor sie als Kontext an das Modell weitergegeben wird. Diese Systeme werden kontinuierlich verbessert, wodurch die Hürde für Quellenselektion stetig höher wird.
73% der Fehler in KI-Antworten entstehen in der Retrieval-Phase. Das Problem ist meist nicht, dass KI dich falsch interpretiert, sondern dass sie dich nicht findet.
Wirst du als Quelle ausgewählt?
VestVale überwacht automatisch, ob ChatGPT, Gemini, Claude und Google AI dein Unternehmen als Quelle zitieren und bei welchen Fragen.
Plattform-Unterschiede: Jedes KI-System wählt anders
ChatGPT: Web-Konsens
Zitiert durchschnittlich 5 Domains pro Antwort und stützt sich stark auf Web-Konsens. 87% der ChatGPT-Zitationen stimmen mit den Top-10-Ergebnissen von Bing überein. ChatGPT sucht Bestätigung: Es bevorzugt Quellen, die konsistent über mehrere andere Quellen hinweg genannt werden. Wikipedia ist die dominierende Quelle, gefolgt von etablierten Nachrichtenseiten. Für deutsche Unternehmen: Bing-Indexierung und Bing Places sind essenziell.
Perplexity: Quellendiversität
Zitiert mit durchschnittlich 21,9 Quellen pro Antwort bei weitem am meisten. Perplexity arbeitet als klassische Suchmaschine mit KI-Schicht. Es ruft Content in Echtzeit ab, zitiert ausgiebig und verlinkt direkt zu Quellseiten. Perplexity schätzt Diversität: Es zitiert bewusst aus mehreren Quellen für eine ausgewogene Antwort. Für Unternehmen das zugänglichste Plattform für Zitationen.
Gemini: Google-Integration
Hat direkten Zugang zu Googles gesamtem Index, einschließlich Google Business Profilen und Google Maps. Gemini bevorzugt strukturierte Daten und Seiten mit vollständigem Schema Markup. Für lokale deutsche Unternehmen ist Gemini besonders relevant: Ein optimiertes Google Unternehmensprofil ist der direkteste Weg zu Gemini-Zitationen.
Google AI Overviews: Schema Markup
Zitiert durchschnittlich 7,7 Domains pro Antwort und ist am stärksten mit dem traditionellen Suchindex integriert. Bevorzugt gut strukturierte Seiten mit Schema Markup und vollständigen FAQ-Sektionen. Google AI Overviews ist das Plattform, bei dem technische Optimierung den größten Effekt hat, weil es auf demselben Index wie die reguläre Google-Suche aufbaut.
Nur 11% der zitierten Quellen überlappen sich zwischen den Plattformen. Das bedeutet: Optimierung für ein Plattform reicht nicht. Du brauchst eine Multi-Plattform-Strategie, um auf allen KI-Suchmaschinen als Quelle gewählt zu werden. Mehr dazu in Warum KI-Ergebnisse unterschiedlich sind.
So wirst du als Quelle ausgewählt: 5 konkrete Maßnahmen
Die Quellenselektion von KI ist kein Blackbox-Prozess. Aus den Daten lassen sich klare Muster ableiten, die du nutzen kannst, um deine Chancen auf Zitation zu erhöhen.
1. In allen relevanten Suchindizes indexiert sein
Stelle sicher, dass deine Website sowohl bei Google als auch bei Bing indexiert ist. Reiche deine Sitemap bei Google Search Console und Bing Webmaster Tools ein. ChatGPT nutzt Bing, Gemini nutzt Google, Perplexity hat einen eigenen Crawler. Wenn du in einem Index fehlst, bist du für dieses Plattform unsichtbar. Prüfe auch deine robots.txt: GPTBot, ClaudeBot und PerplexityBot dürfen nicht blockiert sein.
2. E-E-A-T-Signale maximieren
E-E-A-T korreliert mit r=0,81 mit KI-Zitationen. Konkret: Autoreninformationen auf jeder Seite, Quellenangaben bei Behauptungen, Veröffentlichungsdaten, vollständige Über-uns-Seite, Impressum mit Handelsregisternummer und physischer Adresse, ProvenExpert- und Google-Bewertungen. Für deutsche Unternehmen: Das Impressum und die DSGVO-Seite sind automatische E-E-A-T-Signale. Stelle sicher, dass sie als HTML (nicht als PDF) vorliegen. Mehr in Wie KI Unternehmen empfiehlt.
3. Zitierfähige Passagen schreiben
KI extrahiert einzelne Passagen, nicht ganze Seiten. Schreibe Absätze, die eigenständig verständlich sind: klare Aussage, konkreter Fakt, ohne Kontext aus den umgebenden Absätzen nötig. Die ersten zwei Sätze unter jeder Überschrift sind die "Zitationszone". Statistiken und konkrete Zahlen erhöhen die Zitationswahrscheinlichkeit signifikant. Mehr in Wie KI Antworten zusammenstellt.
4. Structured Data implementieren
Schema Markup verdreifacht die Zitationswahrscheinlichkeit. FAQPage-Schema wird von ChatGPT 40% stärker gewichtet. Implementiere mindestens: Organization oder LocalBusiness, FAQPage, Service und Review Schema. Google AI Overviews reagiert am stärksten auf Structured Data. Das ist der technische Hebel mit dem höchsten Return.
5. Externe Erwähnungen aufbauen
85% der KI-Empfehlungen basieren auf Drittquellen. Baue Erwähnungen auf vertrauenswürdigen Plattformen auf: Bewertungsportale (ProvenExpert, Trustpilot, Google), Branchenverzeichnisse (IHK, WLW, Gelbe Seiten), Fachmedien, LinkedIn. ChatGPT gewichtet Web-Konsens: Je häufiger dein Unternehmen auf verschiedenen Quellen positiv erwähnt wird, desto wahrscheinlicher die Zitation.
Was Content zitierfähig macht: die Anatomie einer KI-Zitation
KI zitiert nicht willkürlich. Es gibt klare Muster dafür, welche Art von Content häufiger zitiert wird. Passagen mit konkreten Statistiken und Zahlen werden signifikant häufiger gewählt als vage Aussagen. "45% der deutschen Verbraucher nutzen KI für lokale Suche" ist zitierbarer als "immer mehr Kunden nutzen KI zum Suchen." Zahlen machen Aussagen überprüfbar und damit vertrauenswürdiger.
Direkte Antworten auf Fragen werden bevorzugt. Wenn die Überschrift lautet "Was kostet ein Steuerberater für eine GmbH?" und der erste Satz antwortet "Ein Steuerberater für eine GmbH kostet in Deutschland zwischen 150 und 300 Euro pro Stunde, je nach Komplexität und Region", dann ist das eine perfekte Zitationspassage. KI sucht die kürzeste, klarste Antwort auf die Nutzerfrage.
Quellenangaben innerhalb des Contents erhöhen die Zitationswahrscheinlichkeit ebenfalls. "Laut Bitkom-Studie 2025 nutzen 78% der deutschen Unternehmen KI-Tools" ist zitierbarer als "Die meisten Unternehmen nutzen KI-Tools." Die Quellenangabe signalisiert KI, dass die Aussage belegt und damit vertrauenswürdig ist.
Ein oft übersehener Faktor ist die semantische Vollständigkeit. Seiten, die ein Thema umfassend abdecken, alle relevanten Unterfragen beantworten und verwandte Aspekte behandeln, werden von KI als autoritativer eingestuft. Seiten mit einem Vollständigkeitsscore von 8,5+ werden 4,2-mal häufiger zitiert. Das bedeutet: Ein langer, umfassender Artikel ist besser als fünf kurze Seiten zum selben Thema.
Checkliste: Ist dein Content zitierfähig?
Jeder Absatz ist eigenständig verständlich ohne umgebenden Kontext
Die Kernaussage steht in den ersten 2 Sätzen unter jeder Überschrift
Konkrete Zahlen und Statistiken mit Quellenangabe
FAQ-Sektion mit häufig gestellten Fragen und direkten Antworten
Autoreninformation und E-E-A-T-Signale sichtbar auf der Seite
Schema Markup (JSON-LD) für FAQPage, Organization/LocalBusiness
Häufig gestellte Fragen
Warum werde ich bei Google gut gerankt, aber von KI nicht zitiert?
Google-Ranking und KI-Zitation sind verschiedene Prozesse mit verschiedenen Kriterien. Nur 38% der KI-Quellen stehen auch in Googles Top 10. KI gewichtet E-E-A-T, Zitierfähigkeit und semantische Vollständigkeit stärker als Backlinks und Domain Authority. Eine Seite kann bei Google auf Position 1 stehen, aber von KI ignoriert werden, wenn sie nicht zitierfähig strukturiert ist.
Was ist RAG und warum ist es wichtig?
RAG (Retrieval-Augmented Generation) ist der Mechanismus, mit dem KI Echtzeitinformationen aus dem Web abruft. Es bestimmt, welche Seiten überhaupt an das Sprachmodell weitergegeben werden. 73% der Fehler in KI-Antworten entstehen in der Retrieval-Phase. Deine Seite muss den Retrieval-Filter bestehen, um eine Chance auf Zitation zu haben.
Kann ein kleines Unternehmen von KI zitiert werden?
Ja. Domain Authority sagt nur 4% der KI-Zitationen voraus. E-E-A-T korreliert mit r=0,81. Das bedeutet: Eine spezialisierte Nischenseite mit starken Vertrauenssignalen kann von KI gegenüber großen Portalen bevorzugt werden. Für deutsche KMU ist das eine Chance, besonders bei lokalen und branchenspezifischen Anfragen.
Welches KI-Plattform ist am einfachsten zu beeinflussen?
Perplexity, weil es die meisten Quellen pro Antwort zitiert (21,9 im Schnitt) und Quellenvielfalt schätzt. Google AI Overviews, weil technische Optimierung (Schema Markup, Structured Data) dort den größten Effekt hat. Gemini für lokale Unternehmen, weil ein optimiertes Google Unternehmensprofil direkt in Empfehlungen einfließt.
Wirst du als Quelle zitiert?
VestVale überwacht automatisch, ob und wie ChatGPT, Gemini, Claude und Google AI dein Unternehmen zitieren. Miss deinen Quellenstatus auf allen Plattformen.
Ab €19,95/Monat zzgl. MwSt. Monatlich kündbar.