Loading...
Усі кейси
кейс · Геймінг

Multi-region Disaster Recovery для мобільного геймінгу

Спроєктували та впровадили active-active multi-region архітектуру на 3 AWS-регіони з автоматизованим failover та chaos engineering.

01
виклик

Що стояло на шляху

Ігрова студія зазнала 6-годинного збою, що коштував мільйони втраченого доходу та довіри гравців. Single-region архітектура мала RTO понад 4 години, не було автоматизованого failover, а плани disaster recovery існували лише на папері без регулярного тестування.

02
наше рішення

Як ми це вирішили

Ми побудували active-active setup на 3 AWS-регіони з Route 53 health checks, Aurora Global Database та DynamoDB global tables. Впровадили Terraform модулі для ідентичної інфраструктури в усіх регіонах, автоматизований failover з Lambda-based health monitors та щотижневі chaos engineering тести з Litmus.

03
результат

Вимірні результати

R / 01
4
RTO скорочено з годин до менш ніж 5 хвилин
R / 02
3
активні AWS-регіони з автоматичним failover
R / 03
99,999%
Досягнуто availability
R / 04
Chaos engineering тести проводяться щотижня
04
технологічний стек

Що його живило

AWSAWSTerraformTerraformDR
наступний крок

Побудуймо наступний case study разом.

talk to an engineerFree 30-min discovery callBook
close