Monitoring und Incident Response: Was nach dem Software-Launch wichtig wird
Der Launch ist der Start des Betriebs, nicht die Ziellinie. Ohne Monitoring entdeckt der Kunde den Vorfall, nicht Sie — und die Entdeckungszeit ist der eigentliche Preis.

In vielen Projekten ist der Launch das Ziel. Danach ist Stille — bis ein Kunde anruft, dass etwas seit Stunden nicht geht. Genau hier zeigt sich der teuerste Irrtum: Der Launch ist nicht die Ziellinie, sondern der Start des Betriebs.
Die wichtigste Zahl nach dem Launch ist nicht die Funktionsliste, sondern die Zeit, bis Sie merken, dass etwas kaputt ist.
Wer es zuerst merkt, entscheidet die Kosten
Ein Ausfall, den das Monitoring in Minuten meldet, ist ein Vorfall. Derselbe Ausfall, den der Kunde nach Stunden meldet, ist ein Vertrauensschaden. Die Technik dahinter ist identisch — der Unterschied ist nur die Entdeckungszeit.
Der Accelerate State of DevOps Report 2024 von DORA misst genau das als Kernindikator: nicht ob etwas ausfällt, sondern wie schnell man es bemerkt und behebt.
Vier Bausteine, die nach dem Launch zählen
1. Sichtbarkeit: Logs und Metriken
Wenn niemand sieht, was das System tut, ist jeder Fehler eine Überraschung. Strukturierte Logs und wenige aussagekräftige Metriken sind keine Spielerei, sondern die Grundlage jeder Reaktion.
2. Alarme mit Augenmaß
Ein Alarm, der bei allem schreit, wird ignoriert — genau dann, wenn es zählt. Wenige, scharfe Alarme auf echte Symptome schlagen hundert nervöse. Lärm ist das Gegenteil von Sichtbarkeit.
3. Klare Verantwortlichkeit
Wer reagiert um drei Uhr nachts, wer entscheidet, wer informiert? Ein Vorfall ohne benannte Verantwortung ist kein Vorfall, sondern Chaos mit Zeitdruck.
4. Backups, die getestet sind
Ein Backup, das nie wiederhergestellt wurde, ist eine Hoffnung, kein Plan. Die Wiederherstellung muss geübt sein, bevor sie gebraucht wird — der BSI-Lagebericht nennt fehlende Wiederherstellbarkeit regelmäßig als verschärfenden Faktor.
Man steigt nicht zur Lage auf, man fällt auf sein Vorbereitungsniveau
Im Ernstfall improvisiert niemand brillant. Man tut das, was vorher geübt wurde. Ein einfacher, dokumentierter Ablauf — erkennen, eindämmen, beheben, informieren, nachbereiten — schlägt jede spontane Heldentat. ENISA beschreibt dieselbe Logik: Vorbereitung entscheidet über Schadenshöhe, nicht Talent im Moment.
Betrieb ist Teil des Produkts, nicht danach
Monitoring und Incident Response sind keine nachgelagerte IT-Aufgabe, sondern Teil dessen, was ein Produkt verlässlich macht. Sie gehören zur selben Disziplin wie Sicherheit von Anfang an (siehe Security by Design) und laufende Pflege (siehe Software-Wartung nach dem Launch).
Checkliste für Monitoring und Incident Response
- Gibt es strukturierte Logs und wenige aussagekräftige Metriken?
- Sind Alarme scharf, nicht Lärm?
- Ist Verantwortlichkeit für Vorfälle benannt (wer, wann)?
- Wurde die Wiederherstellung aus Backup geübt, nicht nur eingerichtet?
- Gibt es einen dokumentierten Ablauf: erkennen, eindämmen, beheben, informieren?
- Wird die Entdeckungszeit gemessen, nicht nur die Verfügbarkeit?
- Ist der Betrieb vor dem Launch geplant, nicht danach?
Häufige Fragen
Reicht eine Uptime-Überwachung? Sie meldet, dass etwas down ist — nicht, dass etwas falsch rechnet. Echte Sichtbarkeit braucht Logs und fachliche Metriken, nicht nur einen Ping.
Brauchen wir ein 24/7-Team? Selten sofort. Aber eine klare Reaktionskette und geübte Wiederherstellung schon. Verantwortung ist wichtiger als Schichtbetrieb.
Was ist der häufigste Fehler? Monitoring nach dem Launch nachrüsten. Dann ist die erste Erkenntnisquelle der verärgerte Kunde.
Sind Backups nicht genug? Nur wenn die Wiederherstellung getestet ist. Ein nie zurückgespieltes Backup ist im Ernstfall oft wertlos.
Fazit
Nach dem Launch entscheidet nicht die Technik über den Schaden, sondern die Entdeckungszeit und die Vorbereitung. Wer Sichtbarkeit, scharfe Alarme, klare Verantwortung und geübte Wiederherstellung hat, übersteht Vorfälle als Routine — wer nicht, erfährt sie vom Kunden.
Weiterlesen
- Software-Wartung nach dem Launch: Updates und Weiterentwicklung — Betrieb als Dauerdisziplin.
- Security by Design: sichere Software schon in der Planung — dieselbe Vorbereitungslogik, früher angesetzt.
Nächster Schritt
Ihr System läuft, aber Sie würden einen Ausfall vom Kunden erfahren? Beginnen Sie mit einer kurzen Einschätzung Ihrer Anforderungen. Wir richten Sichtbarkeit, scharfe Alarme und einen geübten Reaktionsablauf ein.
Quellen
- DORA, Accelerate State of DevOps Report 2024 — dora.dev
- BSI, Die Lage der IT-Sicherheit in Deutschland — bsi.bund.de
- ENISA, Threat Landscape — enisa.europa.eu