Zum Inhalt springen
Agent Hub
Zurück zum Glossar
architecture

RAG

RAG (Retrieval-Augmented Generation) ist ein Verfahren, bei dem das Sprachmodell vor jeder Antwort relevante Dokumente aus Ihrer Wissensbasis sucht und diese als Grundlage für die Antwort nutzt — so antwortet der Agent immer aktuell und mit Quellenangabe.

Auch genannt: Retrieval-Augmented Generation

Im Detail

Sprachmodelle wissen nichts über Ihre Firma, Ihre Produkte oder Ihre Verträge — sie wurden auf öffentlichen Daten trainiert. RAG schließt diese Lücke:

  1. Wir indexieren Ihre Inhalte (PDFs, Hilfe-Center, Notion, FAQs) als Embeddings in einer Vector-Datenbank.
  2. Bei jeder Frage suchen wir die ähnlichsten Dokument-Stücke heraus.
  3. Die werden zusammen mit der Frage an das LLM geschickt — das antwortet auf Basis dieser konkreten Quellen.

Vorteil gegenüber Fine-Tuning: aktuell, günstiger, transparent (mit Quellenangabe), kein Training auf Kundeninhalten nötig.

Beispiel

Frage: „Wie lange ist die Garantie auf das Modell X-200?“ — RAG findet den passenden Abschnitt im Garantie-PDF, das LLM formuliert die Antwort mit Link auf das Original-PDF.

Verwandte Begriffe