1 CloudWatch 알람
- CloudWatch 알람은 AWS 리소스의 상태를 모니터링하고 특정 조건이 충족될 때 알림을 트리거하는 강력한 도구입니다.
- 이를 통해 시스템 관리자는 문제를 신속하게 감지하고 대응할 수 있습니다.
- CloudWatch 알람은 다양한 AWS 서비스와 통합되어 있어 종합적인 모니터링 솔루션을 제공합니다.
1.1 알람 상태
- CloudWatch 알람은 세 가지 상태를 가질 수 있습니다:
- OK: 메트릭이 정의된 임계값 내에 있어 정상 상태임을 나타냅니다.
- ALARM: 메트릭이 정의된 임계값을 초과하거나 미달하여 문제가 발생했음을 나타냅니다.
- INSUFFICIENT_DATA: 알람을 평가하기에 충분한 데이터가 수집되지 않았음을 나타냅니다.
1.2 알람 설정
- CloudWatch 알람을 설정할 때 다음과 같은 옵션을 지정할 수 있습니다:
- 메트릭: 모니터링할 특정 지표 (예: CPU 사용률, 메모리 사용량 등)
- 임계값: 알람을 트리거할 메트릭 값
- 기간(Period): 메트릭을 평가할 시간 간격 (예: 5분, 1시간 등)
- 평가 기간: 알람 상태를 결정하기 위해 검사할 연속적인 기간의 수
- 통계: 메트릭 데이터를 집계하는 방법 (예: 평균, 최대값, 최소값 등)
1.3 알람 작업
- CloudWatch 알람이 트리거되면 다음과 같은 작업을 수행할 수 있습니다:
- EC2 인스턴스 관리: 인스턴스를 중지, 종료, 재부팅 또는 복구할 수 있습니다.
- Auto Scaling 작업: Auto Scaling 그룹의 크기를 조정할 수 있습니다.
- SNS 알림: Amazon Simple Notification Service를 통해 이메일, SMS 등으로 알림을 보낼 수 있습니다.
- Systems Manager 자동화: AWS Systems Manager를 통해 자동화된 작업을 실행할 수 있습니다.
2 EC2 인스턴스 복구
- EC2 인스턴스 복구는 하드웨어 장애나 기타 문제로 인해 인스턴스가 비정상 상태가 되었을 때 유용한 기능입니다.
- CloudWatch 알람과 연동하여 자동으로 인스턴스를 복구할 수 있습니다.
2.1 복구 프로세스