Ein Anbieter erweitert seine KI-Plattform um einen Assistenten, der Contact-Center-Mitarbeitende während Sprach- und Chatinteraktionen unterstützt. Die Lösung erkennt Kundenanliegen, löst Prozesse aus und empfiehlt passende Aktionen innerhalb bestehender Arbeitsumgebungen. Gleichzeitig unterstreicht die Entwicklung die Bedeutung der Agenten-Orchestrierung. Sie koordiniert Aufgaben, Kommunikation, Eskalationen und Ressourcennutzung zwischen mehreren KI-Agenten. Ohne diese Steuerung drohen Fehler, Endlosschleifen und unnötige Kosten. Gerade im Kundenservice entscheidet die Qualität der Orchestrierung darüber, wie effizient, zuverlässig und skalierbar automatisierte Abläufe funktionieren. Praxisbeispiele zeigen deutliche Produktivitätsgewinne
IBM hat gerade die allgemeine Verfügbarkeit von «Agent Assist» in seiner KI-Plattform watsonx Orchestrate bekanntgegeben. Was das für Contact-Center-Agenten bedeutet, ist erheblich. Denn Orchestrierung wird noch immer zu wenig genutzt.
Das neue Tool unterstützt Kundenservice-Mitarbeiter in Echtzeit während laufender Gespräche – per Sprache und Chat. Die Funktion erkennt die Absicht des Anrufers automatisch, löst Prozesse aus und schlägt dem Agenten die jeweils beste nächste Maßnahme vor – alles innerhalb der Oberfläche, die Teams ohnehin nutzen. IBM integriert dazu Genesys Cloud, eine der weltweit führenden Plattformen für Kundenkommunikation.
Laut IBM soll Agent Assist:
- die durchschnittliche Gesprächsdauer senken
- die Erstlösungsrate erhöhen
- Fachwissen gleichmäßiger über die gesamte Belegschaft verteilen
Aber auch dieses Tool kann nur dann seine volle Wirksamkeit entfalten, wenn es in einen Rahmen eingebettet ist. Denn in der Einfachheit, neue Agenten aufzusetzen, lauert eine Gefahr: Nämlich dass sie wie ein Haufen Hühner nur ihren Job machen, es aber keine Verzahnung gibt und keinen Plan, wie was gemacht werden soll. Damit Agenten wirklich in einem Team arbeiten, ist die Orchestrierung notwendig.
Wie ein Fluglotse
So wie ein Agenten-Harness die Regeln vorgibt, nach denen dieser arbeiten soll, schafft die Orchestrierung ein Umfeld, in dem Teams miteinander kommunizieren können und in denen Aufgaben an sie verteilt werden. In einer KI-Struktur ist die Orchestrierung so etwas wie ein Fluglotse: Sie gibt Aufgaben an die richtigen Stellen weiter. Oder wie der Dirigent, der den Takt angibt, aber auch jedem Musiker sagt, was er wie spielen soll.
Sie hat aber auch noch weitere Funktionen: So muss sie die Kommunikation zwischen Agenten sicherstellen, aufpassen, dass es zu keiner Überlastung kommt und bei komplexen Problemen eskalieren und an einen menschlichen Mitarbeiter weiterleiten.
80% der Fehlschläge bei Multi-Agenten-Projekten gehen auf die Orchestrierung zurück – nicht auf die Agenten selbst, heißt es im Blog von Origin 137, einem Anbieter von KI-Lösungen. Die einzelnen Agenten funktionieren. Es ist ihre Koordination, die scheitert: inkonsistente Zustände, Endlosschleifen, unbemerkte Fehler, die sich wiederholen, sowie Token-Kosten, die unkontrolliert in die Höhe schießen.
Eine Rolle für jeden Agenten
KI-Agenten-Orchestrierung bezeichnet die Koordination mehrerer autonomer Agenten, damit sie gemeinsam eine Aufgabe erfüllen können, die keiner von ihnen allein bewältigen würde. Jeder Agent übernimmt eine bestimmte Rolle, verfügt über klar definierte Fähigkeiten und interagiert mit den anderen nach festgelegten Regeln.
Ein Multi-Agenten-System zur Bearbeitung von Beschwerden könnte beispielsweise so funktionieren: Ein erster Agent analysiert das eingehende Dokument und extrahiert die wichtigsten Informationen. Ein zweiter prüft die Einhaltung regulatorischer Vorgaben. Ein dritter erstellt einen Antwortvorschlag. Anschließend validiert ein übergeordneter Kontrollagent sämtliche Ergebnisse, bevor die Antwort versendet wird – oder sie an einen menschlichen Mitarbeiter weiterleitet, falls das Vertrauensniveau für eine automatische Bearbeitung nicht ausreicht. Dieses Beispiel bildet die einfachste Form der Orchestrierung ab, einen linearen Ablauf von Tasks.
Ein etwas komplizierteres Modell hat einen Agenten am Anfang, der dann die gleichen Aufgaben an mehrere Agenten gleichzeitig gibt. Deren Ergebnisse werden zusammengeführt und von einem weiteren Agenten überprüft und finalisiert. Diese Methode ist schnell, verbraucht aber meistens viel KI-Rechenleistung.
Hierarchisches System hat sich bewährt
Bei einem hierarchischen System gibt es einen Agenten, der als Überwachungsagent funktioniert und mehrere, unter ihm arbeitenden Agenten, die von ihm Aufgaben bekommen. Deren Ergebnisse werden dann zu einer Lösung zusammengeführt. Es bildet am besten die Struktur des Einsatzes menschlicher Arbeitskräfte in einem Unternehmen ab.
Mit der Orchestrierung können Fehler schnell erkannt werden, die immer wieder vorkommen. Zum Beispiel kann sich ein Chat-Agent aufhängen und dann die gesamte weitere Produktion oder Kommunikation aufhalten. Hier kann ein Mechanismus helfen, der startet, wenn die nachfolgenden Agenten zu lange auf einen Input warten. Außerdem sollte es Überwachungswerkzeuge geben, die Protokolle anfertigen. Mit ihnen kann man bei Problemen sehen, wann diese das erste Mal aufgetaucht sind. Sie zeigen an, was jeder Agent gemacht hat und ob die Zusammenarbeit stimmt.
Ein übergeordneter Agent, der schlechte Entscheidungen trifft und dabei keine Eskalationsmöglichkeit kennt, ist ein Rezept für Desaster. In der Produktion lassen sich manche Entscheidungen schlicht nicht vollständig automatisieren – und das System muss das erkennen. Explizite Konfidenz-Schwellenwerte sind eine Abhilfe. Unterschreitet ein Score diesen Wert, pausiert der Workflow und eskaliert an einen menschlichen Operator. LangGraph unterstützt dieses Muster nativ über seine Interrupt-Punkte.
Im Kundencenter kann eine Orchestrierung so aussehen:
Ein Routing-Agent klassifiziert eingehende Tickets (Informationsanfrage, Beschwerde, technische Anfrage). Anschließend leitet er sie an einen spezialisierten Agenten weiter, der einen Antwortvorschlag erstellt. Ein Qualitätssicherungs-Agent prüft die Antwort auf Compliance-Anforderungen (Tonfall, fachliche Richtigkeit und Einhaltung der Prozesse). Liegt der Konfidenzwert unter dem definierten Schwellenwert, wird das Ticket zusammen mit dem vollständigen Kontext und einem vorformulierten Antwortentwurf an einen menschlichen Mitarbeiter eskaliert.
Ergebnis: 60 bis 70% der Tickets werden automatisch bearbeitet, die Reaktionszeit bei Standardfällen verkürzt sich um den Faktor 4, und die menschlichen Mitarbeiter können sich auf komplexe, besonders wertschöpfende Fälle konzentrieren.
Thomas Wanhoff
Thomas Wanhoff, Jahrgang 1966, ist ein deutscher Journalist und Autor. Er arbeitete bei Zeitungen wie der “Frankfurter Neuen Presse”, war Produktentwickler bei der “Welt” und schreibt für die Nachrichtenplattform t-online. Außerdem betätigt er sich als freier Autor, mit Schwerpunkten auf CRM und Personalentwicklung. Wanhoff lebt seit 2007 in Südostasien.
