Zum Inhalt springen
Agent Hub
Zurück zum Glossar
architecture

Embedding

Ein Embedding ist eine Zahlen-Repräsentation eines Texts (oder Bildes) in einem hochdimensionalen Raum, in dem ähnliche Inhalte nah beieinander liegen — die Grundlage für semantische Suche und RAG.

Auch genannt: Vektor-Repräsentation

Im Detail

Embeddings übersetzen Text in Vektoren (z.B. 1.536 Zahlen für OpenAI's text-embedding-3-small). Die Vektoren sind so gewählt, dass Kosinus-Ähnlichkeit zwischen zwei Vektoren angibt, wie ähnlich die ursprünglichen Texte sind.

Damit kann ein Computer schnell die thematisch passendsten Dokument-Stücke finden, auch wenn die Worte nicht exakt übereinstimmen — „Wie kündige ich?“ findet auch Texte über Vertragsbeendigung oder Abmeldung.

Beispiel

Wir indexieren Ihre 12.000 Service-Dokumente einmal als Embeddings (~30 Min). Bei jeder neuen Anfrage suchen wir in Millisekunden die 5 ähnlichsten Stücke heraus.

Verwandte Begriffe