Was ist ein RAG-System? Was heißt RAG?
Ein RAG-System verbindet ein Sprachmodell mit ausgewählten Wissensquellen. RAG steht für Retrieval-Augmented Generation (abrufgestützte Text-Erzeugung).
Gemeint ist ein KI-Verfahren, bei dem eine Anwendung zuerst passende Informationen aus Dokumenten, Datenbanken oder Webseiten sucht. Diese Informationen werden dann an ein Sprachmodell weitergegeben. Das Sprachmodell formuliert daraus eine Antwort.
Kurz gesagt: RAG macht aus einer allgemeinen KI eine KI mit Nachschlagewerk.
Das heißt: Die KI bekommt im übertragenem Sinne vor dem Antworten „passende Unterlagen vorgelegt“.
> Ohne RAG antwortet eine KI aus ihrem gelernten Trainingswissen.
> Mit RAG schaut die Anwendung vorher in ausgewählte Quellen, zum Beispiel in Konzepte, Handbücher, Protokolle, Schulungsunterlagen, Fachtexte oder interne Dokumente.
So funktioniert RAG
- Frage eingeben
Beispiel: „Was steht in unserem Konzept zu Zielgruppen?“ - Retrieval (Abruf/Suche)
Die Anwendung sucht passende Informationen in ausgewählten Quellen. - Augmentation (Anreicherung/Erweiterung)
Die gefundenen Informationen werden der KI als Zusatzwissen mitgegeben. - Generation (Erzeugung/Formulierung)
Das Sprachmodell formuliert daraus eine verständliche Antwort.
Warum ist RAG nützlich?
RAG ist besonders hilfreich, wenn KI-Anwendungen mit eigenen Daten arbeiten sollen, zum Beispiel mit:
- internen Dokumenten
- Förderanträgen
- Fachkonzepten
- Rechts- oder Datenschutztexten
- Wissensdatenbanken
- Schulungsunterlagen
- Chatbots für Organisationen oder Unternehmen
So können Antworten genauer, aktueller und näher an den eigenen Daten sein.
Gut zu wissen:
RAG ist nur so gut wie Quellen, Suche und KI-Modell
RAG bedeutet nicht automatisch, dass jede Antwort stimmt. Die Qualität hängt stark davon ab,
- welche Quellen eingebunden sind,
- wie gut diese Quellen aufbereitet wurden,
- ob die Anwendung die passenden Textstellen findet,
- und welches KI-Modell die gefundenen Informationen auswertet.
Ein günstiges oder kleines KI-Modell kann für einfache Fragen ausreichen, zum Beispiel bei kurzen FAQ-Antworten oder klaren Einzelinformationen. Bei komplexen Themen reicht das oft nicht. Dann muss die KI Zusammenhänge erkennen, Widersprüche einordnen, Quellen gewichten und vorsichtig formulieren. Dafür braucht es meist ein leistungsfähigeres Modell oder eine gut durchdachte Kombination mehrerer Modelle.
Lange PDF-Dokumente sind eine besondere Herausforderung
Problematisch werden RAG-Systeme vor allem bei langen oder schlecht strukturierten PDF-Dokumenten. Ein PDF sieht für Menschen oft übersichtlich aus, kann für eine KI-Anwendung aber schwer auswertbar sein. Das gilt besonders bei Tabellen, Fußnoten, Spalten, Scans, Bildern mit Text oder juristischen und technischen Dokumenten.
Bei RAG werden lange Texte meist in kleinere Abschnitte zerlegt. Das nennt sich Chunking (Aufteilung in Textstücke). Dabei können Zusammenhänge verloren gehen. Überschriften, Tabellen oder Querverweise werden nicht immer richtig zugeordnet. Dann findet das System zwar thematisch passende Stellen, aber nicht unbedingt die besten.
Deshalb gilt:
RAG macht eine KI nicht automatisch zuverlässig.
RAG legt der KI nur die passenden Unterlagen hin. Lesen, verstehen, abwägen und sauber antworten muss das KI-Modell trotzdem. Die Qualität der Ergebnisse hängt daher massiv vom eingesetzten Modell ab.









