01
Das Unternehmen hatte kein Monitoring über einfache Health-Checks hinaus. Produktionsprobleme wurden von Kunden entdeckt, die MTTR lag bei 4 Stunden, und das On-Call-Team ertrank im Rauschen hunderter falsch konfigurierter CloudWatch-Alarme. Es gab kein Distributed Tracing über die 60+ Microservices.