Künstliche Intelligenz wird häufig punktuell eingesetzt, entfaltet ihr volles Potenzial jedoch erst in integrierten Systemen. Ein Beispiel aus der Podcast-Content-Produktion verdeutlicht diesen Wandel: Durch die Orchestrierung spezialisierter KI-Agenten entlang eines durchgängigen Workflows wurde ein zuvor manueller Prozess von rund vier Stunden auf etwa fünfzehn Minuten reduziert. Dabei übernehmen verschiedene Komponenten klar definierte Aufgaben wie Transkription, Zusammenfassung, Audioverarbeitung, visuelle Content-Erstellung und Publishing. Die zentrale Erkenntnis liegt im Übergang von isolierten Tools hin zu Multi-Agent Orchestration, bei der mehrere Systeme strukturiert zusammenarbeiten. Ergänzt wird dieser Ansatz durch gezielte menschliche Kontrolle an entscheidenden Punkten. So entsteht ein Gleichgewicht aus Automatisierung und Qualitätssicherung. Der Effekt geht über Effizienz hinaus: Rollen verschieben sich von operativer Umsetzung hin zu redaktioneller Steuerung und strategischem Denken. Dieses Prinzip lässt sich auf zahlreiche Geschäftsprozesse übertragen.
Künstliche Intelligenz wird intensiv diskutiert, ist jedoch selten in operative End-to-End-Prozesse integriert. Den meisten Organisationen fehlen nicht die Tools, es fehlen neu gedachte Prozesse.
Das folgende Beispiel aus der Content-Produktion zeigt, wie sich ein kompletter Workflow neu denken lässt. Es basiert auf meinem Podcast Business Transformation Pitch mit der CX Goalkeeper. Durch die Orchestrierung mehrerer spezialisierter KI-Agenten innerhalb eines klar definierten Ablaufs konnte ein Prozess, der zuvor rund vier Stunden benötigte, auf etwa fünfzehn Minuten reduziert werden, bei gleichzeitig höherer Konsistenz und geringerer Fehleranfälligkeit.
Dieses Beispiel macht einen zentralen Wandel sichtbar. Der eigentliche Mehrwert von KI entsteht nicht durch einzelne Tools, sondern durch Systeme, in denen mehrere Komponenten zielgerichtet zusammenarbeiten. Dieser Ansatz, bezeichnet als Multi-Agent Orchestration, ermöglicht es Organisationen, von inkrementellen Effizienzgewinnen zu einer grundlegenden Neugestaltung von Prozessen zu gelangen.
Obwohl das Beispiel aus meinem Podcast stammt, lässt sich das Prinzip auf alle Geschäftsprozesse übertragen, in denen Informationen transformiert, angereichert und über verschiedene Kanäle verteilt werden.
Fokus auf Wertschöpfung
Einen eigenen Podcast zu hosten, ist im Kern eine wertschöpfende Tätigkeit. Gespräche schaffen Perspektiven, verbinden Menschen und bringen Ideen zusammen, die sonst nicht aufeinandertreffen würden. Genau das ist es, was meinen Podcast ausmacht.
In der Praxis beginnt der grösste Teil der Arbeit jedoch erst nach der Aufnahme. Die Produktion einer professionellen Episode umfasst Audiobearbeitung, Zusammenfassungen, Extraktion von Insights, Erstellung visueller Inhalte, Strukturierung von Kapiteln sowie die Distribution über mehrere Plattformen. Richtig umgesetzt wird diese Phase schnell zeitintensiv und operativ komplex. Vor allem aber ist sie nicht der Bereich, in dem der grösste Mehrwert entsteht.
Zwei Erkenntnisse haben die Richtung vorgegeben. Erstens hängt die Gesamtqualität einer Episode stark von diesen Schritten ab. Schwache Zusammenfassungen, inkonsistente Audioqualität oder fehlende Struktur mindern die Wirkung selbst der besten Inhalte. Zweitens folgen viele dieser Aufgaben klaren Mustern. Sie sind repetitiv, strukturiert und regelbasiert. Genau diese Art von Arbeit lässt sich besonders gut mit künstlicher Intelligenz unterstützen.
Daraus ergibt sich ein klares Ziel: den Aufwand dort minimieren, wo KI besser ist, und den Fokus dort maximieren, wo menschlicher Beitrag echten Mehrwert schafft. Das Ergebnis ist ein System, in dem mehrere KI-Agenten entlang eines durchgängigen Prozesses zusammenarbeiten.
Die verborgene Arbeit hinter jeder Podcast-Episode
Von aussen wirkt Podcasting einfach. Ein Gespräch wird aufgenommen, hochgeladen und veröffentlicht. In der Realität ist das Gespräch lediglich der Ausgangspunkt. Eine hochwertige Episode entsteht durch eine Reihe operativer Schritte, die häufig unterschätzt werden. Audio wird professionell aufbereitet. Inhalte werden in Zusammenfassungen, Insights und Keywords überführt. Relevante Zitate werden identifiziert und in nutzbare Formate gebracht. Visuelle Inhalte entstehen für unterschiedliche Kanäle. Kapitel strukturieren die Navigation. Am Ende wird alles konsistent veröffentlicht.
In Summe entsteht ein erheblicher Aufwand, der oft den Zeitaufwand für die eigentliche Aufnahme übersteigt. Damit stellt sich eine grundlegende Frage: Soll der Prozess schrittweise verbessert werden oder lohnt es sich, ihn komplett neu zu denken?
Vom Tool zum System
Viele Organisationen setzen KI punktuell ein. Hier wird eine Zusammenfassung erstellt, dort ein Bild generiert. Diese Anwendungen sind sinnvoll, verändern jedoch selten den Gesamtprozess.
Der eigentliche Fortschritt entsteht, wenn sich die Perspektive verschiebt. Statt einzelne Aufgaben zu optimieren, geht es darum, einen durchgängigen Ablauf zu gestalten, in dem verschiedene KI-Fähigkeiten zusammenspielen. Dieser Ansatz lässt sich als Multi-Agent Orchestration beschreiben. Spezialisierte Komponenten arbeiten entlang eines klar strukturierten Prozesses zusammen und liefern gemeinsam ein vollständiges Ergebnis. Zur Erprobung wurde eine einfache interne Lösung entwickelt. Im Fokus stand nicht ein Produkt, sondern die Frage, ob sich ein kompletter Workflow zuverlässig automatisieren lässt.
Die Architektur des Workflows
Die Lösung kombiniert mehrere Technologien mit klar definierten Rollen. Eine Workflow-Engine auf Basis von n8n steuert den Ablauf und koordiniert die einzelnen Schritte. WordPress dient als schlanke Eingabemaske. KI-Modelle generieren Zusammenfassungen, extrahieren Insights und strukturieren Inhalte. Auphonic stellt eine konsistente Audioqualität sicher. Weitere KI-Tools erzeugen visuelle Inhalte für unterschiedliche Kanäle. Anstelle eines zentralen Systems arbeiten spezialisierte Einheiten zusammen. Jede übernimmt eine klar definierte Aufgabe und übergibt das Ergebnis weiter. Genau so funktionieren auch Organisationen: spezialisierte Fähigkeiten, verbunden durch einen klaren Prozess.
Eine minimalistische, funktionale Benutzeroberfläche
Die Benutzeroberfläche ist bewusst minimalistisch gehalten. Sie erfasst nur die Informationen, die für den Start notwendig sind. Dazu gehören der Name und das Bild des Gastes, die Audioaufnahme, relevante Links und der Titel der Episode. Die Komplexität wird vom System im Hintergrund übernommen.

Vom Input zum Output: Die Rolle der KI-Agenten
Nach dem Start führt das System eine Reihe koordinierter Schritte aus. Zunächst entsteht die Audioebene. Eine standardisierte Einleitung wird mit einem KI-generierten Sprachsegment kombiniert, das auf einer vorgeschlagenen Zusammenfassung basiert. Diese wird überprüft und angepasst, bevor sie mit einer KI-generierten Stimme integriert wird. Danach folgen das Episoden-Briefing, das Gespräch und ein definierter Outro. Die finale Datei wird durch Auphonic verarbeitet.
Parallel dazu entsteht die Inhaltsebene. Das Transkript wird analysiert, strukturierte Zusammenfassungen werden erstellt, zentrale Erkenntnisse identifiziert und relevante Zitate extrahiert.

Gleichzeitig werden visuelle Inhalte generiert. Coverbilder, Zitatgrafiken und weitere Formate entstehen automatisch für unterschiedliche Kanäle. Kapitelmarken ermöglichen eine einfache Navigation.

Am Ende wird die Publishing-Ebene aktiviert. Die Episodenseite wird automatisch auf der Website erstellt, inklusive aller relevanten Inhalte. Innerhalb weniger Minuten ist alles bereit.

Ein zentrales Prinzip ist die Human-in-the-Loop-Kontrolle. Alle Inhalte werden vorgeschlagen, bleiben jedoch vollständig anpassbar. Qualität, Konsistenz und Verantwortung bleiben damit jederzeit sichergestellt.
Die eigentliche Herausforderung: Automatisierung und Kontrolle
Die eigentliche Herausforderung entsteht nicht durch Technologie. Sie liegt in der Entscheidung, was automatisiert wird und wo menschliche Kontrolle bewusst bestehen bleibt.
Zwei Prinzipien haben sich als besonders relevant erwiesen.
- Das erste ist das Gleichgewicht zwischen Automatisierung und Kontrolle: Automatisierung schafft Geschwindigkeit. Kontrolle sichert Qualität und Kontext. Entscheidend ist die bewusste Definition von Punkten, an denen menschliches Urteil echten Mehrwert bringt.
- Das zweite ist das 95/5-Prinzip: Rund 95 Prozent des Prozesses folgen klaren Mustern und lassen sich standardisieren. Die verbleibenden 5 Prozent bestehen aus Ausnahmen und Kontextentscheidungen. Wer versucht, alles zu automatisieren, erhöht die Komplexität massiv. Der Fokus auf die 95 Prozent bringt den grössten Effekt bei gleichzeitig beherrschbarer Komplexität.
Vom Produktionsmodus zur redaktionellen Verantwortung
Die grösste Veränderung ist organisatorisch. Vor der Einführung dieses Ansatzes erforderte die Produktion einer Episode mehrere Stunden manueller Arbeit. Jeder Schritt musste aktiv gesteuert werden. Heute sind die operativen Aufgaben weitgehend automatisiert. Der Fokus verschiebt sich auf Bewertung, Feinabstimmung und inhaltliche Steuerung. Es geht darum, die richtigen Botschaften zu setzen und eine konsistente Gesamtstory sicherzustellen. Der Übergang ist klar: weg von operativer Produktion, hin zu redaktioneller Verantwortung.
Der Produktivitätseffekt
Der Effekt auf die Produktivität ist unmittelbar sichtbar. Ein Prozess, der zuvor rund vier Stunden benötigte, kann heute in etwa fünfzehn Minuten durchgeführt werden. Gleichzeitig steigt die Konsistenz der Ergebnisse, während Fehler deutlich reduziert werden. Der entscheidende Unterschied liegt im Ansatz. Die Verbesserung entsteht nicht durch schnellere Einzelschritte, sondern durch einen neu gestalteten Gesamtprozess.
Implikationen für Organisationen
Auch wenn dieses Beispiel aus dem Podcasting stammt, sind die zugrunde liegenden Prinzipien breit anwendbar. Viele Prozesse bestehen darin, unstrukturierte Inputs in nutzbare Outputs zu überführen. Beispiele sind Kundenfeedback, Reporting, Wissensmanagement oder Content Marketing. Hier zeigt sich das Potenzial klar. Durch saubere Orchestrierung spezialisierter Komponenten lassen sich Effizienz und Qualität gleichzeitig steigern.
KI-Zusammenarbeit als strategische Fähigkeit
Die eigentliche Erkenntnis liegt jenseits der Technologie. Der Wettbewerbsvorteil entsteht nicht durch den Zugang zu Tools. Entscheidend ist die Fähigkeit, Systeme zu gestalten, in denen diese Tools sinnvoll zusammenarbeiten. Das erfordert einen Perspektivwechsel. Weg von isolierten Anwendungen, hin zu integrierten Prozessen. Organisationen, die diese Fähigkeit entwickeln, werden ihre Produktivität deutlich skalieren.
Fazit
Die beschriebene Lösung ist bewusst einfach gehalten. Sie entstand aus dem Ziel, einen realen Workflow neu zu denken. Die Ergebnisse zeigen klar, welches Potenzial entsteht, wenn Prozesse konsequent rund um KI neu gestaltet werden. Noch wichtiger ist die Veränderung in der Rolle. Wenn operative Arbeit automatisiert wird, verschiebt sich der Fokus auf das, was wirklich zählt: Urteilsvermögen, Kreativität und strategisches Denken.
Im Podcasting bedeutet das Fokus auf das Gespräch. In Organisationen gilt dasselbe Prinzip. Die entscheidende Frage lautet: Sind Prozesse so gestaltet, dass KI sie ausführen kann?
Gregorio Uglioni
Gregorio Uglioni ist darauf spezialisiert, Organisationen durch komplexe Business- und digitale Transformationen zu führen und dabei messbare Ergebnisse in Wachstum, Kundentreue und operativer Exzellenz zu erzielen. Er verfügt über mehr als 15 Jahre Erfahrung und ist Partner bei Forward in Zürich. Zuvor hatte er leitende Managementfunktionen bei Swisscard AECS (ein Joint Venture von American Express und Credit Suisse), in einem führenden Schweizer Spital sowie bei Accenture im Consulting inne. Als Keynote Speaker hat Gregorio bereits auf vier Kontinenten gesprochen und ist Host des weltweit anerkannten Podcasts „Business Transformation Pitch with the CX Goalkeeper“. Zudem ist er Co-Autor mehrerer Fachpublikationen und engagiert sich aktiv in der CX- und Transformations-Community.
