Uber baut seine Cloud- und KI-Infrastruktur auf Amazon Web Services weiter aus, um Fahrten und Lieferungen weltweit effizienter zu steuern. Kern der Erweiterung sind die AWS-Chips Graviton4 und Trainium3. Graviton4 unterstützt die sogenannten Trip Serving Zones, die Millionen Fahrten, Lieferungen und Standortdaten in Echtzeit verarbeiten. Dadurch lassen sich Fahrerzuweisungen, Routenberechnungen und Ankunftszeiten schneller und stabiler berechnen. Parallel testet Uber Trainium3-Chips für das Training erster KI-Modelle. Diese analysieren grosse Mengen an Fahr- und Lieferdaten, um Vorhersagen und Empfehlungen kontinuierlich zu verbessern. Nutzer profitieren dadurch von schnelleren Vermittlungen, präziseren Ankunftszeiten und einer zuverlässigeren App-Performance.
Wer heute eine Fahrt oder Lieferung per App bestellt, erwartet eine sofortige Reaktion. Was sich für Nutzer selbstverständlich anfühlt, ist technisch eine der anspruchsvollsten Aufgaben im globalen Cloud-Betrieb. Uber, das weltgrösste Ridesharing- und On-Demand-Lieferunternehmen, betreibt täglich Millionen von Fahrten und Lieferungen und stellt damit höchste Anforderungen an die zugrunde liegende Technologie. Jetzt baut das Unternehmen seine Infrastruktur und KI-Kapazitäten auf Amazon Web Services (AWS) aus.
Im Zentrum stehen zwei von AWS speziell entwickelte Chips: Graviton4 für den Betrieb der Trip Serving Zones, der Echtzeit-Infrastruktur hinter jeder Fahrt und Lieferung, und Trainium3 für das Training erster KI-Modelle im Rahmen eines Pilotprojekts. Ziel ist ein schnellerer, zuverlässigerer Service für Nutzer rund um den Globus. Wie das in der Praxis funktioniert und welche Rolle die beiden Chips dabei spielen, zeigt ein Blick auf die technische Umsetzung.
Millisekunden entscheiden
Jede Fahrtanfrage bei Uber löst im Hintergrund eine Kette von Entscheidungen aus. Welcher Fahrer ist am nächsten? Welche Route ist die schnellste? Wie lange dauert die Anfahrt tatsächlich? Diese Fragen müssen für Millionen Nutzer parallel und in Sekundenbruchteilen beantwortet werden, rund um die Uhr und in Städten auf der ganzen Welt. Fehler oder Verzögerungen wirken sich unmittelbar auf die Qualität des Services aus und können das Vertrauen der Nutzer nachhaltig beeinträchtigen.
Uber setzt auf AWS Graviton4-Prozessoren, die hochperformante Berechnungen bei vergleichsweise niedrigem Energieverbrauch ermöglichen. Die Prozessoren unterstützen die Echtzeitberechnungen, die das Matching zwischen Fahrgästen und Fahrern beschleunigen. Das geschieht ohne Abstriche bei Zuverlässigkeit, Verfügbarkeit oder Sicherheit des Systems. Für Uber bedeutet das kürzere Wartezeiten und einen stabileren Service, auch bei hoher Systemauslastung.
Skalierung bei Spitzenlast
Die sogenannten Trip Serving Zones sind das technische Rückgrat hinter jeder Fahrt und jeder Lieferung. Sie verarbeiten Millionen von Vorhersagen und Standortdaten in Millisekunden und müssen auch bei hoher Nachfrage stabil und performant bleiben. Das gilt besonders in Stosszeiten oder bei Grossveranstaltungen, wenn die Anfragen schlagartig ansteigen. In solchen Situationen entscheidet die Infrastruktur darüber, ob der Service nahtlos funktioniert oder Nutzer lange warten müssen.
Uber erweitert die Nutzung von AWS Compute, Storage und Networking Services für diese Workloads. Das ermöglicht eine schnelle Skalierung bei Nachfragespitzen, reduziert die Latenz und senkt die Betriebskosten. Die flexiblen Kapazitäten von AWS erlauben es Uber, auf schwankende Nachfrage zu reagieren, ohne den Service zu drosseln. Fahrer und Fahrgäste profitieren davon durch schnellere Vermittlungen und eine zuverlässigere App-Performance in Spitzenzeiten.
KI-Training auf neuer Basis
Uber trainiert KI-Modelle, die Daten aus unzähligen Fahrten und Lieferungen analysieren, um Ankunftszeiten zu berechnen, die optimale Fahrerzuweisung zu bestimmen und personalisierte Empfehlungen für Fahrgäste und Lieferkunden auszuspielen. KI-Training in diesem Massstab erfordert enorme Rechenleistung und stellt hohe Anforderungen an Effizienz und Kostenoptimierung. Für diesen Zweck testet Uber nun erstmals AWS Trainium3-Chips im Rahmen eines Pilotprojekts als leistungsfähige und kosteneffektive Lösung.
Mit jedem Trainingsdurchlauf lernen die Modelle aus zusätzlichen Daten und verbessern ihre Vorhersagegenauigkeit schrittweise. Das wirkt sich direkt auf die Nutzererfahrung aus: Fahrgäste erhalten präzisere Ankunftszeitangaben und passendere Empfehlungen, Lieferkunden profitieren von optimierten Fahrerzuweisungen. Je mehr Daten die Modelle verarbeiten, desto treffsicherer werden ihre Vorhersagen.
Fazit
Die Erweiterung auf AWS bildet für Uber das Fundament, auf dem das Unternehmen seinen globalen Betrieb zuverlässig und skalierbar halten kann. AWS Graviton4 und Trainium3 decken zwei zentrale Anforderungen ab: die Verarbeitung von Echtzeitdaten in Millisekunden und das Training leistungsfähiger KI-Modelle, die auf Daten aus Milliarden von Fahrten zurückgreifen.
Endanwender profitieren von schnelleren Matches, präziseren Ankunftszeitschätzungen und individuelleren Empfehlungen. Die Partnerschaft zeigt, wie Cloud-Infrastruktur und spezialisierte KI-Hardware zusammenwirken können, um hochskalierbare Anwendungen auf globalem Niveau zu betreiben. Uber hat damit eine technologische Grundlage geschaffen, die sowohl den heutigen Anforderungen gerecht wird als auch künftige Verbesserungen ermöglicht.
Autor: Matthias Patzak, Enterprise Strategist bei Amazon Web Services (AWS).
AWS
Seit 2006 ist Amazon Web Services, Inc. (AWS), ein Unternehmen von Amazon.com, Inc. (NASDAQ: AMZN), die umfassendste und am weitesten verbreitete Cloud der Welt. AWS hat seine Services kontinuierlich erweitert, um praktisch jede Arbeitslast zu unterstützen, und verfügt nun über mehr als 240 voll ausgestattete Services für Rechenleistung, Speicher, Datenbanken, Netzwerke, Analytik, maschinelles Lernen und künstliche Intelligenz (KI), Internet der Dinge (IoT), Mobilgeräte, Sicherheit, Hybrid, Medien sowie Anwendungsentwicklung, -bereitstellung und -verwaltung in 105 Availability Zones in 33 geografischen Regionen, mit angekündigten Plänen für 18 weitere Availability Zones und sechs weitere AWS-Regionen in Malaysia, Mexiko, Neuseeland, dem Königreich Saudi-Arabien, Thailand und die AWS European Sovereign Cloud. Millionen von Kunden - darunter die am schnellsten wachsenden Startups, die größten Unternehmen und führende Regierungsbehörden - vertrauen auf AWS, um ihre Infrastruktur zu betreiben, agiler zu werden und Kosten zu senken.