Wie wir KI-Agenten bauen, denen man vertrauen kann

Vertrauen ist die wichtigste Währung

Als wir vor zwei Jahren begonnen haben, KI-Agenten zu bauen, war die Frage immer: 'Wie können wir uns sicher sein, dass der Agent das Richtige tut?'

Heute wissen wir: Vertrauen entsteht nicht aus 100% Genauigkeit. Es entsteht aus Transparenz, klaren Übergaben und der Möglichkeit, jederzeit nachzuvollziehen, was passiert ist.

1. Quellenangabe

Jede Antwort kommt mit einem Link auf die Quelle. Der User sieht auf einen Blick, woher die Information stammt, und der Editor kann nachvollziehen, ob der Agent das richtige Dokument zitiert.

2. Konfidenz-Schwellen

Wenn der Agent unsicher ist, sagt er das offen. Wir messen Antwort-Qualität in Echtzeit (Embedding-Distanz, Quellen-Abdeckung, Re-Ranking-Score) und triggern bei niedriger Konfidenz die Mensch-Übergabe.

3. Mensch-Übergabe

Komplexe oder emotional aufgeladene Anfragen werden automatisch an einen Menschen weitergeleitet. Der Agent sagt: 'Ich hole hier kurz einen Kollegen dazu', keinÜberrumpeln, keine Frustration.

4. Audit-Logs

Jedes Gespräch ist nachvollziehbar, werhat was gefragt, was hat der Agent geantwortet, welche Tools wurden aufgerufen. Im Pro-Paket: vollständige Logs, im Enterprise: revisionssicher mit WORM-Storage.

Was als nächstes kommt

Wir arbeiten an einem Trust Score — einer einzelnen Zahl pro Konversation, die diese vier Dimensionen zusammenfasst. Erste Tests zeigen: Konversationen mit Score >85% korrelieren stark mit Customer Satisfaction. Mehr dazu im nächsten Post.