"ALARM" 상태의 AWS 경보가 정책 작업을 트리거하지 않음

"ALARM" 상태의 AWS 경보가 정책 작업을 트리거하지 않음

오늘 저는 CloudWatch 지표와 연결된 경보가 포함된 여러 정책이 포함된 AutoScaling 그룹을 만들었습니다. AutoScaling 그룹은 두 개의 인스턴스를 시작했습니다. 이는 해당 그룹에 필요한 최소값이기 때문입니다. 새 그룹에 도달하기 위해 벤치마킹 테스트를 켰고 해당 그룹의 평균 CPUUtilization이 경보에 대해 설정한 임계값을 초과했습니다. 상태가 INSUFFICIENT_DATA에서 OK로, 그리고 마지막으로 ALARM으로 변경됨에 따라 각 경보에 대한 기록을 관찰했습니다. 예상대로. 그런 다음 정책이 실행될 때까지 기다렸습니다. 실행 전 지정된 300초가 왔다 갔다 했습니다. 그런 다음 정책이 실행되기까지 시간이 얼마나 걸리는지 알아보기로 결정했습니다. 이제 한 시간 반이 넘었지만 해당 정책은 아직 실행되지 않았습니다.

저는 좌절감을 느끼고 ASG와 모든 정책 및 경보를 삭제했습니다. 아마도 정책과 경보를 생성하는 중에 실수를 했을 수도 있다고 판단했습니다. 그래서 나는 그것들을 모두 다시 만들었습니다. 같은 문제입니다. 경보는 ALARM 상태이며 정책을 실행하지 않습니다. 문제 없이 수동으로 정책을 실행할 수 있지만 그렇게 하면 요점이 무너집니다.

차이점이 있다면 AWS 콘솔에서 이 모든 항목을 생성했습니다. 과거에는 API를 사용하여 ASG와 정책을 만들었고 해당 그룹은 정책을 제대로 실행했습니다.

내가 잘못하고 있는 것이 있나요? (또는 AWS 서비스에 문제가 있을 수도 있습니다.)

업데이트:

오늘 이것을 다시 시도했습니다. 차이점이 있는지 확인하기 위해 콘솔 대신 API를 사용하기로 결정했습니다. 제가 사용하고 있는 알람이 20분 전에 OK에서 ALARM으로 업데이트되었습니다.

CPUUtilization >= 35 for 5 minutes
Actions: In ALARM: For group TEST use policy Scale Out API (Add 1 instance)
Namespace: AWS/EC2
Metric Name: CPUUtilization
Dimensions: AutoScalingGroupName = TEST
Statistic: Average
Period: 5 minutes

2013-12-19 15:13 UTC-7 - 상태 업데이트 - 경보가 OK에서 ALARM으로 업데이트됨

현재 시간: 15:43 UTC-7 (알람 이후 30분)

작업이 실행되지 않았습니다. 왜 그런지 아시나요?

답변1

제가 이 질문을 게시판에 올렸습니다.아마존 포럼그리고 자동으로 "ActionsEnabled" 속성을 False로 설정하는 경보 생성에 최근 버그가 있는 것 같습니다.

AWS에서:

We have identified an issue in the AutoScaling console regarding the binding of
AutoScaling policies to CloudWatch alarms and are working on a fix. We will post
an update to this thread once the fix is rolled out. Thanks for bringing this to
our attention.

현재 해결 방법은 다음과 같습니다.

In the meantime, please try calling the DescribeAlarms CloudWatch API. If the
alarms associated with your policies have ActionsEnabled=false, then this could
cause your policies to not be invoked when the alarm is triggered. Please try
calling the PutMetricAlarm CloudWatch API to update ActionsEnabled=true for the
affected alarms, and that should fix the issues you are experiencing.

API를 통해 자체 알람으로 버그와 해결 방법을 확인했습니다.

관련 정보