Wie KI Antworten
zusammenstellt
Ein Nutzer fragt ChatGPT: "Wer ist ein guter Steuerberater in Hamburg?" Innerhalb von Sekunden liefert ChatGPT eine Antwort mit konkreten Empfehlungen, Begründungen und manchmal sogar Quellen. Aber wie kommt diese Antwort zustande? Welche Quellen werden ausgewählt, welche ignoriert, und nach welchen Regeln wird zusammengefasst? In diesem Artikel erklären wir den technischen Prozess hinter KI-Antworten und zeigen dir, wie du deine Inhalte so gestaltest, dass KI sie bevorzugt als Quelle nutzt.
3-8
Quellen pro KI-Antwort (Durchschnitt)
90-95%
Genauigkeit mit RAG-Grounding (vs. 80-85% ohne)
5-6%
des Web-Inhalts ist auf Deutsch (vs. ~60% Englisch)
68%
der dt. Unternehmen sehen Genauigkeit als Barriere
Von der Frage zur Antwort: Der Prozess in 5 Schritten
KI-Antworten entstehen nicht zufällig. Sie folgen einem systematischen Prozess namens RAG (Retrieval Augmented Generation). Das klingt technisch, aber das Prinzip ist einfach zu verstehen.
Frage verstehen
KI analysiert zuerst, was du wirklich fragst. "Wer ist ein guter Steuerberater in Hamburg?" wird interpretiert als: Der Nutzer sucht einen Steuerberater, Standort Hamburg, Qualitätsbewertung gewünscht, wahrscheinlich für private oder geschäftliche Steuerfragen. Diese Interpretation bestimmt, welche Art von Quellen gesucht wird. Eine Frage nach einem "günstigen" Steuerberater liefert andere Ergebnisse als eine nach einem "erfahrenen" Steuerberater, weil KI die Intention unterschiedlich interpretiert.
Quellen suchen (Retrieval)
Im zweiten Schritt durchsucht KI seine Datenquellen nach relevanten Informationen. Bei ChatGPT bedeutet das: Bing wird nach "Steuerberater Hamburg" durchsucht und die Top-Ergebnisse werden abgerufen. Gleichzeitig werden die Trainingsdaten nach Informationen über Steuerberater in Hamburg durchsucht. Perplexity nutzt seinen eigenen Index und zieht 20-30 Kandidaten-Seiten heran. Gemini durchsucht das Google-Ökosystem. Das Ergebnis: Ein Pool von 5 bis 30 potenziellen Quellen, die im nächsten Schritt bewertet werden.
Quellen bewerten und ranken
Nicht alle gefundenen Quellen werden verwendet. KI bewertet jede Quelle nach semantischer Relevanz: Wie genau beantwortet diese Quelle die gestellte Frage? Das funktioniert nicht über Keywords wie bei Google, sondern über Bedeutungsähnlichkeit. Eine Seite, die "Steuerberatung für Freiberufler in Hamburg" im Detail beschreibt, rankt höher als eine allgemeine Steuerberater-Listenseite. Frische, strukturierte Inhalte mit klaren Antworten in den ersten Absätzen werden bevorzugt. Aus den 20-30 Kandidaten werden die besten 3-8 ausgewählt.
Antwort generieren
Jetzt kommt der eigentliche Generierungsschritt. Die ausgewählten Quellen werden als Kontext an das Sprachmodell übergeben, zusammen mit der ursprünglichen Frage. Das Modell synthetisiert die Informationen zu einer zusammenhängenden Antwort. Es kombiniert Fakten aus verschiedenen Quellen, ergänzt mit Wissen aus den Trainingsdaten und formuliert alles in natürlicher Sprache. Dabei entscheidet es, welche Informationen direkt übernommen, zusammengefasst oder weggelassen werden. Das ist der Schritt, in dem dein Unternehmen entweder namentlich erwähnt wird oder nicht.
Quellenangabe (bei einigen Plattformen)
Perplexity zeigt immer alle verwendeten Quellen mit klickbaren Links. Google AI Overviews verlinken auf 4-6 Quellen. ChatGPT zeigt Quellen optional an, wenn die Websuche aktiv war. Claude gibt selten explizite Quellenlinks. Für Unternehmen ist Perplexity deshalb besonders wertvoll: Wenn du als Quelle genannt wirst, bekommst du einen direkten, klickbaren Link. Bei ChatGPT und Claude ist die Erwähnung wertvoller als der Link, weil Nutzer bei diesen Plattformen seltener auf Quellen klicken.
Welche Inhalte werden bevorzugt als Quelle gewählt?
KI wählt Quellen nicht nach Domain Authority oder Backlinks aus, wie Google es tut. Die Auswahlkriterien sind anders und in vielerlei Hinsicht demokratischer. Auch kleinere Websites haben eine Chance, wenn der Inhalt stimmt.
Direkte Antworten
Seiten, die die Frage in den ersten 1-2 Absätzen direkt beantworten, werden bevorzugt. "Was kostet ein Steuerberater in Hamburg? Ein Steuerberater in Hamburg kostet durchschnittlich..." ist perfekt für KI-Zitate. Lange Einleitungen werden übersprungen.
Strukturierte Inhalte
Listen, Tabellen, klare Überschriften und FAQ-Formate werden bevorzugt. KI kann strukturierte Inhalte leichter extrahieren und zitieren als lange, unstrukturierte Fließtexte. Eine nummerierte Liste "Die 5 besten Tipps für..." wird häufiger zitiert als ein Absatz mit denselben Informationen.
Aktualität
Frischere Inhalte werden bevorzugt, besonders bei Live-Suchanfragen. Ein Artikel von 2026 rankt höher als einer von 2023. Regelmäßig aktualisierte Seiten signalisieren Relevanz. Seiten, die vierteljährlich nicht aktualisiert werden, verlieren das Dreifache an Zitationswahrscheinlichkeit.
Semantische Vollständigkeit
Seiten, die ein Thema umfassend abdecken (alle wichtigen Aspekte, Unterfragen, verwandte Themen), werden bevorzugt. Ein 2.500-Wort-Artikel, der alle Facetten eines Themas behandelt, wird häufiger zitiert als fünf kurze 300-Wort-Seiten zum gleichen Thema.
Vertrauenswürdige Domains
Etablierte Domains wie IHK, Handelsblatt, Wikipedia und Branchenportale werden stärker gewichtet. Aber: Auch kleinere Websites werden zitiert, wenn der Inhalt hochrelevant und gut strukturiert ist. Es geht um Content-Qualität, nicht nur um Domain-Größe.
Schema Markup
Seiten mit Structured Data (JSON-LD) werden dreimal häufiger als Quelle verwendet. FAQPage-Schema wird von ChatGPT 40% stärker gewichtet. Schema gibt KI-Systemen strukturierte, eindeutige Informationen, die sie nicht erst aus dem Text extrahieren müssen.
Wirst du als Quelle zitiert?
VestVale zeigt dir, ob und wie KI-Plattformen dein Unternehmen in ihren Antworten erwähnen.
Die deutsche Sprach-Chance: Warum weniger Wettbewerb mehr Sichtbarkeit bedeutet
Nur 5-6% der Webinhalte weltweit sind auf Deutsch. Im Vergleich dazu sind etwa 60% auf Englisch. Für die Trainingsdaten von KI-Systemen bedeutet das: Es gibt deutlich weniger deutschsprachige Quellen, aus denen KI schöpfen kann. Das klingt nach einem Nachteil, ist aber tatsächlich eine Chance.
Wenn ein deutscher Nutzer ChatGPT auf Deutsch fragt "Wer ist ein guter Klempner in München?", hat ChatGPT weniger deutschsprachige Quellen zur Auswahl als bei einer englischen Anfrage. Jede zusätzliche deutschsprachige Quelle, die du bereitstellst, hat deshalb proportional mehr Gewicht. Ein umfassender deutscher Fachartikel zu einem Nischenthema hat eine höhere Chance, von KI als Quelle verwendet zu werden, als ein vergleichbarer englischer Artikel in einem Meer von Alternativen.
Das ist besonders relevant für lokale deutsche Unternehmen. Wenn du eine FAQ-Sektion auf Deutsch mit lokalen Bezügen schreibst ("Was kostet eine Heizungswartung in Stuttgart?"), gibt es wahrscheinlich nur eine Handvoll anderer Seiten, die diese spezifische Frage auf Deutsch beantworten. ChatGPT hat wenig Auswahl und wird deine Seite mit höherer Wahrscheinlichkeit zitieren. Bei einer englischen Version der gleichen Frage gibt es möglicherweise Hunderte alternativer Quellen.
Sprach-Verteilung im Web vs. KI-Chance
Weniger deutschsprachige Quellen = jede gute deutsche Seite hat mehr Gewicht bei KI-Antworten. Das ist ein struktureller Vorteil für deutsche Unternehmen, die qualitative Inhalte auf Deutsch erstellen.
Schreibe deine Inhalte auf Deutsch, auch wenn du international tätig bist. Für deutsche KI-Anfragen sind deutschsprachige Quellen Gold wert. Englische Inhalte konkurrieren mit Millionen anderer Seiten. Deutsche Inhalte haben proportional mehr Einfluss.
Warum KI-Antworten manchmal falsch sind und wie RAG das verbessert
Ohne externe Quellen erreichen KI-Sprachmodelle eine Genauigkeit von etwa 80-85% bei Faktenfragen. Das bedeutet: Jede fünfte bis sechste Aussage kann falsch sein. Das ist der Grund, warum ChatGPT manchmal Geschäftsführer-Namen erfindet oder falsche Adressen nennt. Es "halluziniert", weil es nicht genug echte Daten hat.
RAG (Retrieval Augmented Generation) verbessert das erheblich. Wenn KI zuerst relevante Quellen sucht und diese als Kontext nutzt, steigt die Genauigkeit auf 90-95%. Die Halluzinationsrate sinkt von 15-20% auf 3-5%. Deshalb nutzen moderne KI-Suchmaschinen wie Perplexity und der neue ChatGPT-Suchmodus intensiv RAG. Sie geben nicht nur Antworten aus dem Kopf, sondern untermauern sie mit aktuellen Webquellen.
68% der deutschen Unternehmen sehen die Genauigkeit von KI als größte Adoptionsbarriere. Aber genau das macht es umso wichtiger, dass du korrekte Informationen über dein Unternehmen auf vertrauenswürdigen Plattformen bereitstellst. Je mehr verlässliche Quellen KI findet, desto genauer werden die Antworten über dich. Du hast es selbst in der Hand, die Genauigkeit der KI-Antworten über dein Unternehmen zu verbessern. Mehr über die Datenquellen liest du in Wie KI Unternehmensinformationen sammelt.
Genauigkeit: Ohne RAG vs. Mit RAG
15-20% Halluzinationsrate
3-5% Halluzinationsrate
RAG reduziert Halluzinationen um das 4-fache. Deshalb nutzen Perplexity, ChatGPT Search und Google AI Overviews intensiv RAG.
So optimierst du deine Inhalte für KI-Antworten
Jetzt, wo du verstehst, wie KI Antworten zusammenstellt, kannst du deine Inhalte gezielt darauf ausrichten. Das Ziel ist einfach: Deine Seite muss zu den 3-8 Quellen gehören, die KI für eine Antwort auswählt. Dafür musst du relevanter, strukturierter und frischer sein als die Alternativen.
- Beantworte die Frage sofort. Keine langen Einleitungen. Die Antwort gehört in die ersten zwei Sätze unter jeder Überschrift.
- Nutze Listen und Tabellen. Strukturierte Formate werden bevorzugt extrahiert. "Die 5 wichtigsten Faktoren" funktioniert besser als ein langer Absatz.
- Schreibe umfassend. Ein Artikel, der ein Thema vollständig abdeckt, wird 4,2x häufiger zitiert als oberflächliche Kurzartikel.
- Aktualisiere regelmäßig. Vierteljährliche Updates halten deine Inhalte relevant. Veraltete Seiten verlieren das Dreifache an Zitationswahrscheinlichkeit.
- Implementiere Schema Markup. FAQPage-, LocalBusiness- und Service-Schema geben KI strukturierte Daten, die sie nicht erst aus dem Text extrahieren muss.
Denke dabei immer an den RAG-Prozess: KI sucht Quellen, bewertet sie und synthetisiert eine Antwort. Deine Seite muss in jeder Phase überzeugen. In der Suchphase: Bei Bing und Google gut indexiert sein. In der Bewertungsphase: Relevanter und strukturierter sein als die Alternativen. In der Generierungsphase: Klare, zitierbare Aussagen enthalten, die KI direkt übernehmen kann.
Für weiterführende Informationen über die konkreten Schritte zur Optimierung lies Wie wird man sichtbar in ChatGPT? und Wie KI Websites liest.
Häufig gestellte Fragen
Was ist RAG und warum ist es wichtig?
RAG steht für Retrieval Augmented Generation. Es ist der Prozess, bei dem KI zuerst relevante Quellen aus dem Web sucht und diese dann als Grundlage für die Antwort nutzt. RAG reduziert Halluzinationen von 15-20% auf 3-5% und erhöht die Genauigkeit auf 90-95%. Deshalb nutzen alle modernen KI-Suchmaschinen RAG.
Kann ich beeinflussen, ob KI meine Website als Quelle nutzt?
Direkt kontrollieren nicht, aber stark beeinflussen ja. Schreibe Inhalte, die Fragen direkt beantworten. Nutze klare Überschriften, Listen und Schema Markup. Stelle sicher, dass deine Seite bei Bing indexiert ist. Je relevanter und strukturierter dein Inhalt ist, desto höher die Chance, als Quelle gewählt zu werden.
Wie viele Quellen nutzt ChatGPT pro Antwort?
Im Durchschnitt 3-8 Quellen. Perplexity nutzt die meisten (durchschnittlich 21,87 pro Antwort), ChatGPT etwa 7,92 und Gemini 8,34. Je komplexer die Frage, desto mehr Quellen werden herangezogen. Bei einfachen Faktenfragen kann eine einzige Quelle ausreichen.
Warum wird mein Wettbewerber zitiert und ich nicht?
Wahrscheinlich hat die Seite deines Wettbewerbers eine bessere Kombination aus Relevanz, Struktur und Vertrauenssignalen. Prüfe: Beantwortet seine Seite die Frage direkter? Hat er FAQ mit Schema Markup? Ist er bei Bing besser indexiert? Mehr dazu in Warum nennt KI deine Konkurrenten?
Ist es besser, viele kurze Seiten oder eine umfassende Seite zu haben?
Eine umfassende Seite. KI bevorzugt Seiten mit hoher semantischer Vollständigkeit. Ein Artikel, der ein Thema aus allen Perspektiven behandelt, wird 4,2x häufiger als Quelle gewählt als mehrere kurze Seiten zum gleichen Thema. Qualität und Tiefe schlagen Quantität.
Hilft es, meine Seite auf Deutsch und Englisch anzubieten?
Für deutsche Anfragen: Nein, Deutsch ist besser. Deutsche Inhalte haben weniger Wettbewerb (5-6% des Webs) und werden bei deutschsprachigen KI-Anfragen bevorzugt. Biete Englisch nur an, wenn du internationale Kunden ansprechen willst. Für lokale Sichtbarkeit in Deutschland ist Deutsch klar die bessere Wahl.
Wirst du als Quelle zitiert?
VestVale prüft automatisch ChatGPT, Gemini, Claude und Google AI Overviews. Alle 4 Plattformen inklusive.
Ab €19,95/Monat zzgl. MwSt. Monatlich kündbar.