Unternehmen investieren massiv in generative KI, bleiben aber oft in endlosen Pilotphasen stecken. Der Text beleuchtet, warum diese Piloten scheitern: Es fehlen klare Geschäftsziele, definierte Leistungskennzahlen, ausreichend Kontext aus CRM, Service, Data Warehouse und Kollaborationstools sowie eine belastbare Governance. Agenten werden isoliert getestet, statt dort zu arbeiten, wo Teams tatsächlich agieren. Gleichzeitig bremsen technische Schulden und fehlendes Monitoring die Skalierung. Der Beitrag zeigt, wie agentische Ansätze im Flow of Work, mit klarem Lifecycle-Management und zentraler Steuerung, den Weg vom Experiment zum produktiven Einsatz ebnen.
Im vergangenen Jahr habe ich mit Hunderten von CIOs gesprochen – von regionalen Banken bis hin zu Fortune-100-Unternehmen. Sie alle sagen mir dasselbe: Sie haben genug von Demos. Noch eine Demo, noch ein Pilotprojekt – und trotzdem kein geschäftlicher Mehrwert.
Das Potenzial sehen sie. Investiert haben sie auch. Doch sie schaffen den Sprung zu breiter Implementierung und messbarem ROI nicht. Stattdessen stecken sie fest im «Pilot-Purgatorium». Das Problem ist weit verbreitet: Laut einer MIT-Studie liefern 95% der generativen KI-Pilotprojekte in Unternehmen keinen nachweisbaren ROI.
Was also machen die anderen 5% anders? Was braucht es, um von einem Pilotprojekt zu einer Implementierung im großen Maßstab zu gelangen?
Ich verantworte Engineering, Customer Success, Professional Services sowie unsere Vertriebsteams in Indien und der ASEAN-Region. Ich höre, was Kunden in der Vertriebsphase verlangen; meine Teams unterstützen sie dabei, Agenten erfolgreich zu implementieren und unternehmensweit auszurollen; und ich stelle sicher, dass Kundenfeedback direkt in die Weiterentwicklung unserer Produkte fließt. Diese Rolle verschafft mir einen einzigartigen Blick auf den gesamten Lebenszyklus einer Agentenimplementierung. Aus dieser Perspektive habe ich einiges darüber gelernt, warum KI-Piloten ins Stocken geraten – und wie sie tatsächlich abheben können.
«Wenn Ihr Vertriebsteam in Salesforce arbeitet, müssen auch Ihre Agenten dort arbeiten. Wenn Ihr Engineering-Team in Slack lebt, dann gehören die Agenten genau dorthin.»
Im Kern bedeutet der Wandel hin zu einem Agentic Enterprise nicht, einfach zusätzliche KI-Tools obendraufzusetzen, sondern die Arbeitsprozesse von Grund auf neu zu denken.
Warum die meisten Pilotprojekte scheitern
Der Übergang zu agentischer KI ist nicht nur technologisch – er ist ebenso kulturell, operativ und organisatorisch. Man kann nicht einfach einen Agenten bauen, ausrollen und erwarten, dass er im großen Maßstab funktioniert. Genau an diesen operativen Lücken bleiben die meisten Unternehmen hängen:
Ziele und Leistungskennzahlen sind unklar
Viele betrachten KI als ein einfaches Automatisierungswerkzeug – als ein Add-on für bestehende Prozesse. Sie entwickeln ein KI-Tool und rollen es aus, können aber nicht beurteilen, ob es tatsächlich einen Mehrwert liefert, weil sie zu Beginn keine klaren geschäftlichen Zielgrößen definiert haben. Agenten benötigen Leistungsmetriken, Testframeworks, kontinuierliches Monitoring und Lifecycle-Management. Man muss ihre Ergebnisse nachverfolgen, sie nachjustieren, wenn sich Anforderungen ändern, und Eskalationspfade definieren, wenn sie auf Sonderfälle stoßen. Wenn man etwas nicht managen und messen kann, lässt es sich auch nicht skalieren.
Agenten sind nicht dort eingebettet, wo die Arbeit stattfindet
Agenten müssen Teil der Systeme sein, in denen Menschen ihre Arbeit erledigen. Müssen Mitarbeitende ihre Tätigkeit unterbrechen, Tools wechseln und Informationen erneut eingeben, sinkt die Akzeptanz rapide.
Kontext fehlt
Ein noch grundlegenderes Problem isolierter Agenten ist der fehlende Kontext: Large Language Models (LLMs) allein reichen nicht aus. Agenten benötigen detaillierten Kontext aus Unternehmenssystemen, um hilfreiche Antworten zu liefern und Aktionen auszuführen. Wenn Agenten diesen Kontext nicht haben, geraten Menschen in das, was wir die «Prompt Doom Loop» nennen – sie formulieren Prompts immer wieder neu, um Kontext manuell nachzuliefern, den der Agent eigentlich bereits kennen sollte. Das frustriert Mitarbeitende, führt zu geringer Nutzung und lässt Pilotprojekte stagnieren. KI, die nicht tief in Unternehmenssysteme integriert ist, erreicht niemals eine nachhaltige Nutzung.
Governance wird erst im Nachhinein bedacht
Als wir Agentforce auf help.salesforce.com einführten, verfolgten wir jede einzelne Nachricht. Das war bei ein paar Tausend Gesprächen machbar. Doch sobald es Millionen werden, ist eine menschliche Überprüfung unmöglich. Dennoch fragt der Auditor weiterhin: «Wie wissen Sie, dass Ihre Agenten compliant sind? Zeigen Sie mir den Audit-Trail.»
Die meisten Pilotprojekte funktionieren in kontrollierten Umgebungen, aber im großen Maßstab werden sie von der Rechtsabteilung gestoppt, weil es keinen Rahmen für Berechtigungen, Audit-Trails oder Compliance gibt. Man braucht rollenbasierte Berechtigungen, Freigabeprozesse und Audit-Fähigkeiten – genau wie bei Mitarbeitenden. Wenn man Governance nicht nachweisen kann, kommt man nicht in den produktiven Einsatz.
Infrastrukturdefizite begrenzen die Skalierbarkeit
Um Agenten im großen Maßstab betreiben zu können, braucht es die passende Infrastruktur. Viele Unternehmen entwickeln Pilotprojekte, die isoliert funktionieren, merken dann jedoch, dass sie ohne einen kompletten Neuaufbau nicht skalieren können. Es fehlt an Möglichkeiten, das Verhalten von Agenten vor einer breiteren Einführung zu testen, an Monitoring-Systemen, die Probleme im laufenden Betrieb erkennen, sowie an Frameworks, um Agenten zu aktualisieren, wenn sich Geschäftslogik ändert. Diese «Platform Debt» summiert sich – bis das Pilotprojekt nicht mehr vorankommt.
Was wir gelernt haben
Vor einem Jahr haben wir Agentforce in allen Bereichen unseres Unternehmens eingeführt und dabei sämtliche potenziellen Stolpersteine durchlaufen, um unser eigenes „Customer Zero“ zu werden. Die Ergebnisse sprechen für sich:
- Im Support übernimmt Agentforce inzwischen den Großteil der täglichen Kundeninteraktionen (über zwei Millionen bislang). Auf help.salesforce.com kann man das in Echtzeit beobachten – wir veröffentlichen sogar öffentlich, wie viele Gespräche der Help-Agent inzwischen im Vergleich zu seinen menschlichen Kolleginnen und Kollegen führt. Diese freigewordene Kapazität ermöglicht es uns, Mitarbeitende von reaktivem Support auf proaktiven Service umzustellen – und Kunden dabei zu helfen, ihre eigenen Agentforce-Agenten in nur wenigen Wochen, manchmal sogar Tagen, live zu bekommen.
- Im Engineering erledigen KI-Agenten Routineaufgaben, Code-Wartung, proaktive Bedrohungsüberwachung und schnelle Incident-Reaktionen. Das führte zu einer 30% schnelleren Durchlaufzeit, wobei Agenten 91% der Vorfälle innerhalb von acht Minuten erkennen und 87% davon in unter 20 Minuten automatisch beheben. Ingenieur:innen können sich dadurch stärker auf strategische Entwicklung konzentrieren: neue Funktionen, höhere Zuverlässigkeit und bessere Qualität.
- Im Vertrieb generierten unsere Website und Events wöchentlich 250.000 Leads, doch wir konnten nur die obersten 25% der hoch qualifizierten Leads bearbeiten — alles andere wäre zu teuer gewesen. Jetzt übernimmt unser SDR-Agent personalisierte Ansprache und Qualifizierung und erzeugt 60 Millionen US-Dollar annualisierte Pipeline bereits während der Anfangsphase. Wir erreichen Kund:innen, die wir zuvor nicht erreichen konnten.
Aus dieser Erfahrung – und aus der Zusammenarbeit mit unseren Kund:innen an über 12.000 Agentforce-Implementierungen im vergangenen Jahr – lassen sich einige zentrale Erkenntnisse ableiten:
Agenten funktionieren nur im Flow of Work
Wenn Ihr Vertriebsteam in Salesforce arbeitet, müssen Ihre Agenten dort arbeiten. Wenn Ihr Engineering-Team in Slack arbeitet, gehören die Agenten ebenfalls dorthin. Ein wirklich integrierter Agent versteht Ihre Geschäftsprozesse: Wenn ein Kunde den Support kontaktiert, kennt der Agent dessen Kaufhistorie, offene Fälle, Vertragsbedingungen und Eskalationspfade.
Agenten benötigen Kontext aus Ihrem CRM, Ihrer Serviceplattform, Ihrem Data Warehouse und Ihren Kollaborationstools – und sie müssen die Beziehungen zwischen diesen Systemen sowie die geschäftliche Logik verstehen, die den Datenfluss steuert, inklusive spezifischer rollenbasierter Berechtigungen. Diesen Kontext kann man nicht erst beim Prompten zusammensetzen – er muss nativ in dem System vorhanden sein, in dem die Arbeit tatsächlich stattfindet.
Agenten brauchen Performance Management
Sie müssen definieren, was jeder Agent tun darf: auf welche Daten er zugreifen kann, welche Aktionen er selbstständig ausführen darf und wofür eine menschliche Freigabe erforderlich ist. Sie benötigen Audit Trails, die dokumentieren, was jeder Agent wann und warum getan hat. Sie brauchen Testframeworks, die das Verhalten eines Agenten vor der Einführung validieren, und Monitoring-Systeme, die seine Leistung nach der Einführung überwachen.
Man kann es als Lifecycle-Management für Agenten betrachten: klare Ziele und Metriken, Leistungsmanagement, kontinuierliches Training sowie Eskalationspfade, wenn Agenten auf Sonderfälle stoßen.
Ein Modell oder viele – entscheidend ist eine einheitliche Governance
Für die meisten Unternehmen ist das zugrunde liegende KI-Modell lediglich Infrastruktur. Was sie wirklich interessiert, ist: Schließt ihr SDR-Agent mehr Leads? Löst ihr Service-Agent Anfragen schneller?
Dennoch wünschen sich manche – typischerweise technisch fortgeschrittene Teams oder Unternehmen mit spezialisierten Anforderungen — Wahlmöglichkeiten: OpenAI für bestimmte Anwendungsfälle, Anthropic für andere, Google-Modelle für spezielle Aufgaben oder optimierte Spezialmodelle für Kosten- und Performancevorteile. Doch alle Agenten, unabhängig davon, welches Modell sie antreibt, müssen innerhalb des zentralen Governance-Rahmens des Unternehmens operieren.
«Man kann es vergleichen mit API Discovery vs. API Security: Nur weil man weiß, was verfügbar ist, bedeutet das nicht, dass jeder Agent uneingeschränkten Zugriff haben sollte.»
Als APIs ihren Durchbruch hatten, wurde schnell klar: Man braucht eine zentrale Instanz, um jede API unternehmensweit zu steuern und zu überwachen. Bei Agenten ist es nicht anders – man benötigt ein Command Center, das Agenten registriert, prüft und verwaltet, ganz gleich, aus welcher Quelle sie stammen.
Salesforce unterstützt inzwischen offene Standards wie MCP (Model Context Protocol), damit Agenten Tools und Funktionen über Systemgrenzen hinweg entdecken können. Doch MCP allein reicht nicht aus. Man benötigt weiterhin eine Trust Layer, die Berechtigungen, Audit-Anforderungen und Compliance unternehmensweit durchsetzt.
Es ist wie bei APIs: Discovery ist hilfreich – aber Sicherheit entscheidet.
Das Agentic Enterprise
Die Unternehmen, die in der nächsten Phase gewinnen, sind nicht diejenigen, die mit KI experimentieren – sondern diejenigen, die auf ihr laufen.
Wenn CIOs mich fragen, wo sie beginnen sollen, sage ich ihnen:
Wählen Sie einen risikoarmen Anwendungsfall. Entwickeln Sie einen Agenten. Führen Sie ihn ein. Erweitern Sie ihn dann Schritt für Schritt – durch mehr Datenanbindung, zusätzliche Fähigkeiten und die Integration in Kollaborationsplattformen.
Der Einstieg über interne, risikoarme Anwendungsfälle – Mitarbeitendentools, Wissensmanagement, Kanalzusammenfassungen – ist ein wirkungsvoller Weg, um organisatorisches Vertrauen aufzubauen und schnelle Erfolge zu erzielen. Sobald bewiesen ist, dass es funktioniert, folgt der Schritt zu kundenorientierten Implementierungen. Holen Sie Feedback ein. Iterieren Sie.
So entkommt man dem Pilot-Purgatorium. So verwandelt man KI von einem Potenzial in echte Performance – als Agentic Enterprise.
Autor: Srini Tallapragada, President and Chief Engineering & Customer Success Officer.
Salesforce
Salesforce unterstützt Unternehmen jeder Grösse bei der Neuausrichtung ihres Geschäfts in der Ära der künstlichen Intelligenz. Mit Agentforce, der vertrauenswürdigen Plattform von Salesforce, können Unternehmen ihren Mitarbeiter:innen autonome Agenten an die Seite stellen, um den Geschäftserfolg zu steigern - angetrieben durch KI, Daten und konkrete Aktionen. Weitere Informationen über Salesforce sind hier abrufbar: https://www.salesforce.com/de
