RAG — einfach erklärt

RAG

RAG (Retrieval-Augmented Generation) ist ein Verfahren, bei dem das Sprachmodell vor jeder Antwort relevante Dokumente aus Ihrer Wissensbasis sucht und diese als Grundlage für die Antwort nutzt — so antwortet der Agent immer aktuell und mit Quellenangabe.

Auch genannt: Retrieval-Augmented Generation

Im Detail

Sprachmodelle wissen nichts über Ihre Firma, Ihre Produkte oder Ihre Verträge — sie wurden auf öffentlichen Daten trainiert. RAG schließt diese Lücke:

Wir indexieren Ihre Inhalte (PDFs, Hilfe-Center, Notion, FAQs) als Embeddings in einer Vector-Datenbank.
Bei jeder Frage suchen wir die ähnlichsten Dokument-Stücke heraus.
Die werden zusammen mit der Frage an das LLM geschickt — das antwortet auf Basis dieser konkreten Quellen.

Vorteil gegenüber Fine-Tuning: aktuell, günstiger, transparent (mit Quellenangabe), kein Training auf Kundeninhalten nötig.

Im Detail

Verwandte Begriffe