코인베이스는 5월 7일 발생한 서비스 중단 사태에 대한 사후 분석 보고서를 발표했습니다. 이 사태로 인해 거래, 입금, 출금 및 기타 핵심 서비스가 약 8시간 동안 중단되었으며, 복구에는 약 12시간이 소요되었습니다. 이번 장애는 AWS us-east-1 가용 영역에서 여러 냉각 장치가 동시에 고장 나면서 발생했으며, 이로 인해 서버 과열로 인해 서비스가 중단되었습니다. 코인베이스는 이번 장애로 인해 장애 조치 및 재해 복구 시스템의 미비점이 드러났으며, 지역별 이중화를 강화하고, Kafka 가용 영역을 두 개에서 세 개로 확장하고, 복원력 테스트를 강화할 계획이라고 밝혔습니다.
https://x.com/i/status/2061487036696293469

6
10분 전