Nächster Schritt bei KI: Der Realitäts-Check

Chat & VoicebotsCRMCustomer ServiceLAMLLM

KI Reality CheckKI Reality Check
KI Reality Check

Unternehmen stehen vor der Herausforderung, KI-Chatbots effektiv in ihre Abläufe zu integrieren. Die Qualität der Outputs ist oft mangelhaft, da viele große Sprachmodelle auf öffentlichen Daten basieren und nicht auf spezifischen Geschäfts- und Kundendaten. Google und Salesforce arbeiten daran, diese Probleme zu lösen, indem sie verlässliche, aktuelle Daten einbinden und Automatisierung sowie Faktenprüfung verbessern. Ziel ist es, KI-Chatbots zuverlässiger und an die Geschäftsbedürfnisse angepasst zu machen.

Die Welt der Chatbots in Unternehmen ist derzeit geteilt: in solche, die mit eigenen Daten arbeiten, und solche, die allgemein verfügbare Daten verwenden. Letztere nutzen meist große LLMs wie ChatGPT oder Claude. Doch dabei stellt sich ein Problem: die Qualität der Outputs. Jayesh Govindarajan von Salesforce warnte kürzlich, dass Chatbots für Unternehmen möglicherweise niemals vollständig für ihre Aufgaben bereit sein könnten. Auch bei Google hat man erkannt, dass es bei der Integration noch einiges zu verbessern gibt.

Die Argumentation des Salesforce-Managers: „KI-Assistenten sind nur so gut wie die Daten, die sie antreiben. Und wie einige Organisationen jetzt lernen, basieren die meisten großen Sprachmodelle (LLMs) auf Informationen, die von öffentlichen Websites stammen – nicht auf den wichtigeren Geschäfts- und Kundendaten“, schreibt Govindarajan im Unternehmensblog. Er glaubt, dass derzeit Consumer Bots den Mitarbeitern nicht ausreichend helfen können, mehr Produkte zu verkaufen, mehr Waren zu vermarkten oder bei ihren täglichen Verpflichtungen und Aktivitäten produktiver zu sein, da es an der Personalisierung und dem Geschäftskontext mangelt, die am Arbeitsplatz erforderlich sind.

Fakten prüfen und Halluzinationen vermeiden

In eine ähnliche Richtung geht auch Google. „Google verstärkt seine Bemühungen, die faktische Grundlage von KI-Chatbots für Unternehmen zu verbessern, indem es reale Finanzdaten aus Unternehmen und Finanzdienstleistungen integriert“, meldete TechRadar.

Die Pläne zielen darauf ab, Ungenauigkeiten in KI-generierten Informationen zu reduzieren und die allgemeine Zuverlässigkeit zu erhöhen, indem Antworten mit verifizierten Daten untermauert werden, um sogenannte „Halluzinationen“ zu vermeiden. Google will neben Websuch- und internen Unternehmensdaten auch Datenquellen von Drittanbietern einbeziehen. Zu den ersten Partnern gehören Moody’s, Thomson Reuters und ZoomInfo.

Google plant sogar, einen Benchmark einzubauen, der anzeigen soll, wie genau die Angaben sind. Fraglich bleibt, ob dieser wiederum akkurat sein kann. Aber die Richtung ist klar: Unternehmen benötigen aktuelle und verlässliche Daten.

Das bringt ein Dilemma mit sich: Zum einen möchte man mehr als nur die eigenen Daten in ein LLM einfließen lassen, zum anderen soll die Sicherheit und Verlässlichkeit optimiert werden. Hier liegt die Herausforderung für die Anbieter der LLMs und KI-Lösungen für Unternehmen.

Salesforce setzt auf Automatisierung

Salesforce schlägt deshalb einen anderen Ansatz vor: KI soll sich von Chatbots, die ein paar «Partytricks» beherrschen – etwa das Erstellen ziemlich guter E-Mails, Essays, Blogs und Grafiken –, zu autonom agierenden Robotern entwickeln, die in der Lage sind, geschäftskritische Bedürfnisse zu erkennen und diese mit wenig oder gar keiner direkten menschlichen Beteiligung zu erfüllen. Diese Automatisierung durch Large Action Models (LAMs), Modelle die selbst aktiv werden, soll Entscheidungen und deren Ausführung vereinen.

Das ist jedoch nur dann sinnvoll, wenn die Datengrundlage gut genug ist. Google setzt dabei auf „Grounding“, um die Outputs der Gemini-KI besser an die Realität anzupassen.

Drei Möglichkeiten bieten sich dabei:

  1. Grounding mit Google Search: Jetzt allgemein verfügbar, wird bald dynamische Abfragen bieten, eine neue Funktion, die Kunden hilft, Qualität und Kosteneffizienz in Einklang zu bringen, indem sie intelligent auswählen, wann sie Google-Suchergebnisse und wann sie die Trainingsdaten des Modells verwenden.
  2. Grounding mit High-Fidelity-Modus: Heute in der experimentellen Vorschau angekündigt, ist eine neue Funktion unserer Grounded Generation API, die Halluzinationen weiter reduzieren wird.
  3. Grounding mit Datensätzen von Drittanbietern: Diese Funktion kommt im dritten Quartal dieses Jahres und wird Kunden helfen, KI-Agenten und -Anwendungen zu erstellen, die genauere und hilfreichere Antworten bieten.

Salesforce hat ebenfalls angekündigt, die Qualität der KI weiter zu verbessern. Das Unternehmen führte im Juli einen LLM-Benchmark für das Kundenbeziehungsmanagement (CRM) ein. Der Benchmark soll Unternehmen helfen, verschiedene LLMs für verbesserte CRM-Funktionen zu bewerten.

Bestenliste schafft Transparenz

Das Werkzeug soll einen strukturierten Rahmen für die Bewertung der Leistung von LLMs in vier kritischen Bereichen bieten: Genauigkeit, Kosten, Geschwindigkeit sowie Vertrauen und Sicherheit. Es geht auf die spezifischen Anforderungen von Vertriebs- und Serviceanwendungen ein, wie z. B. Prospektion, Lead-Nurturing und Zusammenfassung von Verkaufschancen und Servicefällen. Darüber hinaus ermöglicht die Einbeziehung einer öffentlich zugänglichen Bestenliste Unternehmen, verschiedene LLMs zu vergleichen und das Modell auszuwählen, das ihren CRM-Anforderungen am besten entspricht.

Für den Kundenservice eines Unternehmens ist es entscheidend, Chatbots einzusetzen, die akkurat arbeiten und keine Informationen erfinden. Kunden verlassen sich auf die Zuverlässigkeit der Antworten, die sie erhalten, und erwarten, dass ihre Anliegen korrekt und präzise behandelt werden. Wenn ein Chatbot falsche oder erfundene Informationen liefert, kann dies nicht nur zu Unzufriedenheit bei den Kunden führen, sondern auch das Vertrauen in das Unternehmen nachhaltig schädigen. Eine akkurate und verlässliche Kommunikation ist daher das Fundament eines erfolgreichen Kundenservices.

Thomas Wanhoff

Thomas Wanhoff

Thomas Wanhoff, Jahrgang 1966, ist ein deutscher Journalist und Autor. Er arbeitete bei Zeitungen wie der “Frankfurter Neuen Presse”, war Produktentwickler bei der “Welt” und schreibt für die Nachrichtenplattform t-online. Außerdem betätigt er sich als freier Autor, mit Schwerpunkten auf CRM und Personalentwicklung. Wanhoff lebt seit 2007 in Südostasien.

Mehr zu Chat & Voicebots

Diskussion

Das könnte Sie auch interessieren