AWS, 생성형 AI 기반 레질리언스 허브 업데이트
- •AWS는 생성형 AI를 활용한 장애 모드 평가와 표준화된 정책 관리 기능을 갖춘 레질리언스 허브를 출시했다.
- •이 플랫폼은 99.95% 가용성 SLO와 구체적인 RTO/RPO 목표를 포함한 다중 리전 재해 복구 설정을 지원한다.
- •기업은 AWS Organizations 연동을 통해 대규모 조직 단위로 레질리언스를 평가하고 계정 간 의존성을 자동 파악할 수 있다.
Amazon Web Services(AWS)가 2026년 5월 28일, 차세대 AWS Resilience Hub를 공개했다. 이번 업데이트는 SRE(Site Reliability Engineering)가 애플리케이션 가용성을 관리하는 과정을 돕기 위한 생성형 AI 도구들을 포함하며, 대규모 엔터프라이즈 환경에서 레질리언스 목표를 표준화하고 규정 준수를 증명하는 데 초점을 맞췄다. 또한 AWS Organizations와 통합되어 단일 관리자가 여러 계정의 레질리언스 상태를 중앙에서 관리할 수 있게 되었다.
새 플랫폼은 모듈형 레질리언스 정책을 통해 SLO(서비스 수준 목표), 다중 가용 영역 구성, 다중 리전 재해 복구 기준에 따라 요구 사항을 설정할 수 있다. 특히 DNS 쿼리 로그를 분석해 내부 및 타사 의존성을 자동으로 찾아내는 기능이 추가되었으며, 생성형 AI 기반 장애 모드 평가는 서비스 아키텍처를 분석해 취약점을 식별하고 해결책을 제시한다.
사용자는 레질리언스 정책을 구성하고 AWS IAM 역할을 설정해 권한을 부여한 뒤 플랫폼을 이용할 수 있다. 99.95% 가용성 SLO, 15분 이내 RTO, 5분 이내 RPO와 같은 구체적인 목표 설정이 가능하며, 애플리케이션 토폴로지와 데이터 흐름을 시각화해 복잡한 의존 관계를 파악한다. 장애 모드 평가 과정에서는 식별된 문제의 중요도와 해결 방안이 함께 제공된다.
기존 고객은 마이그레이션 API를 사용하여 레거시 애플리케이션과 정책을 새로운 모델로 전환할 수 있다. 현재 레질리언스 허브가 지원되는 모든 AWS 상용 리전에서 사용 가능하며, 월 2회의 서비스별 장애 모드 평가가 포함된 새로운 가격 모델이 적용된다. 관리자는 AWS Resilience Hub 콘솔에서 설정을 관리하고 개선 사항을 검토하며 지속적인 운영 상태를 유지할 수 있다.