Unterbrechungsfrei vom Serverraum in die Cloud

23.06.2025

cloud collecting data

Wie ein Verkehrsunternehmen seine Enterprise-Plattform im laufenden Betrieb modernisierte.

On-Premise in die Cloud

Die Realität großer Enterprise-Anwendungen ist oft weit entfernt von Cloud-native Idealen. So auch bei einem großen österreichischen Verkehrsunternehmen, dessen geschäftskritische Systeme seit Jahren auf einer soliden, aber schwerfälligen On-Premise-Landschaft betrieben wurden. SQL Server Cluster, lokale Key Vaults, Bamboo für CI/CD – das alles funktionierte, verlangte jedoch ein hohes Maß an manuellen Eingriffen.

Gleichzeitig wuchs der Druck: Skalierbarkeit, Sicherheit, Fehleranfälligkeit und Time-to-Market wurden zu kritischen Faktoren.

Zielbild: Cloud-ready, DevOps-driven, Zero Downtime

Das Projekt war ambitioniert. Drei Leitplanken definierten das Vorgehen:

  1. Prozessdigitalisierung: Manuelle Arbeitsschritte sollten automatisiert und Fehlerquellen beseitigt werden.

  2. Cloud-Migration: Der Weg führte konsequent in die Azure-Welt – mit skalierbarer, wartbarer Architektur.

  3. Observability-Strategie: Monitoring, Logging, Tracing – alles auf Enterprise-Niveau und von Anfang an gedacht.

Der Weg durch vier Phasen

1. Architektur neu denken

Zuerst stand eine schonungslose Analyse: Was funktioniert, was blockiert? Schnell war klar, dass eine monolithische Architektur keine Zukunft hat. Wir skizzierten eine Microservices-Landschaft auf Basis von ASP.NET Core, Entity Framework und sauberer Command/Query-Trennung mit MediatR – flexibel, erweiterbar und wartungsfreundlich.

2. Infrastruktur transformieren

Die Transformation begann mit der Datenebene: Der alte SQL Server Cluster wich verteilten Azure SQL-Datenbanken. Parallel erfolgte der Umstieg von RabbitMQ auf Azure Service Bus – ein bedeutender Schritt hin zur echten Cloud-Integration.

3. DevOps modernisieren

Statt weiter auf Bamboo zu setzen, migrierten wir konsequent auf Azure DevOps Pipelines. GitOps-Prinzipien ersetzten manuelle Deployments, Feature-Branches wurden systematisch eingeführt und das neue Konfigurations-Management über Azure App Configuration machte Key Vaults endlich wartbar.

4. Observability etablieren

Wir setzten von Anfang an auf messbare Transparenz: Prometheus sammelte Metriken, Grafana visualisierte sie, Kibana analysierte Logs, OpenTelemetry brachte Distributed Tracing. ArgoCD ermöglichte GitOps-gesteuertes Continuous Deployment, Splunk ergänzte den Stack für tiefergehende Log-Analysen.

Resultate, die sich sehen lassen können

Die Modernisierung zahlte sich messbar aus:

  • 60% weniger Bearbeitungszeit durch automatisierte Prozesse

  • 45% geringerer Wartungsaufwand durch Azure-native Infrastruktur

  • >99,8% Systemverfügbarkeit durch proaktives Monitoring

  • <15 Minuten MTTR (Mean Time to Recovery) statt stundenlanger Debugging-Marathons

Ein oft unterschätzter Erfolgsfaktor: das Rechtemanagement. Mit OAuth 2.0 und einer sauberen Service-Architektur konnten wir selbst komplexe Benutzergruppen sauber abbilden.

Learnings & Empfehlungen

Der Erfolg dieser Migration basierte auf drei klaren Schlüsselfaktoren:

  1. einem iterativen Vorgehen, das komplexe Umbauten in beherrschbare Etappen unterteilte,

  2. konsequentem Monitoring von Anfang an, nicht erst als nachgelagerte Maßnahme,

  3. und der frühzeitigen Einbindung aller Stakeholder, um Akzeptanz und Klarheit über Ziele und Zeitpläne zu schaffen.

Besonders entscheidend war die gewählte Migrationsreihenfolge:
Zuerst erfolgte die Transformation der Datenebene mit Azure SQL.
Dann wurde die Messaging-Infrastruktur auf Azure Service Bus umgestellt.
Erst zum Schluss modernisierten wir die DevOps-Prozesse.
Diese Abfolge minimierte Downtime-Risiken und erlaubte eine kontinuierliche Validierung der Systemstabilität.

Ein echter Gamechanger war das neu eingeführte Monitoring-System:
Mit Prometheus für Metriken, Grafana für Visualisierung, Kibana für Log-Analyse und OpenTelemetry für Distributed Tracing erreichten wir eine bisher unerreichte Transparenz über Systemverhalten und Performance. Splunk ergänzte den Stack für tiefergehende Analysen – besonders hilfreich bei kritischen Audits und Störfalluntersuchungen.

Unsere Empfehlungen für ähnliche Projekte:

  • Investieren Sie früh in umfassendes Monitoring. Es zahlt sich bereits während der Migration aus – und nicht erst im laufenden Betrieb.

  • Planen Sie genug Zeit für die Branching-Strategy ein. Ihre Überarbeitung ist meist aufwendiger als erwartet, aber entscheidend für langfristig stabile CI/CD-Prozesse.

  • Nutzen Sie Cloud-native Services konsequent. Vermeiden Sie es, On-Premise-Lösungen lediglich in die Cloud zu verlagern.

Die Kombination aus modernen Backend-Technologien (ASP.NET, Entity Framework, MediatR), Cloud-nativen Diensten und einer robusten Observability-Strategie schuf eine belastbare, zukunftsfähige Grundlage – nicht nur für den aktuellen Betrieb, sondern auch für kommende Digitalisierungsinitiativen.