Las alarmas de AWS en estado "ALARMA" no activan acciones de política

Las alarmas de AWS en estado "ALARMA" no activan acciones de política

Hoy creé un Grupo de AutoScaling con varias políticas, cada una con una Alarma asociada a una métrica de CloudWatch. El Grupo AutoScaling lanzó dos instancias, porque ese era el mínimo que necesitaba para ese grupo. Activé mis pruebas de evaluación comparativa para llegar al nuevo grupo y su utilización de CPU promedio combinada superó los umbrales que había establecido para las alarmas. Observé el historial de cada una de esas alarmas a medida que los estados cambiaban de INSUFFICIENT_DATA, luego a OK y finalmente a ALARM. Como se esperaba. Luego esperé a que se ejecutaran las Políticas. Los 300 segundos especificados antes de la ejecución iban y venían. Luego decidí ver cuánto tiempo pasaría antes de que se ejecutaran las Políticas. Ya ha pasado más de una hora y media y esas Políticas aún no se han ejecutado.

Me frustré y eliminé el ASG y todas las Políticas y Alarmas. Decidí que tal vez había cometido un error al crear las Políticas y Alarmas. Entonces los recreé todos. El mismo problema. Las Alarmas están en estado de ALARMA y nunca ejecutan las Políticas. Puedo ejecutar las Políticas manualmente sin problemas, pero eso anula el punto.

Si hay alguna diferencia, creé todas estas cosas en la consola de AWS. En el pasado, utilicé la API para crear ASG y políticas, y esos grupos ejecutan políticas perfectamente.

¿Hay algo que estoy haciendo mal? (O tal vez los servicios de AWS simplemente estén teniendo problemas).

ACTUALIZAR:

Intenté esto nuevamente hoy. Decidí usar la API en lugar de la consola para ver si había alguna diferencia. La alarma que estoy usando acaba de actualizarse de OK a ALARMA hace 20 minutos.

CPUUtilization >= 35 for 5 minutes
Actions: In ALARM: For group TEST use policy Scale Out API (Add 1 instance)
Namespace: AWS/EC2
Metric Name: CPUUtilization
Dimensions: AutoScalingGroupName = TEST
Statistic: Average
Period: 5 minutes

2013-12-19 15:13 UTC-7 - Actualización de estado - Alarma actualizada de OK a ALARMA

Hora actual: 15:43 UTC-7 (30 minutos desde la alarma)

La acción no se ha activado. ¿Alguna idea de por qué?

Respuesta1

Hice esta pregunta en elForos de Amazony aparentemente hay un error reciente en la creación de Alarmas que automáticamente establece la propiedad "ActionsEnabled" en False.

De AWS:

We have identified an issue in the AutoScaling console regarding the binding of
AutoScaling policies to CloudWatch alarms and are working on a fix. We will post
an update to this thread once the fix is rolled out. Thanks for bringing this to
our attention.

La solución por ahora:

In the meantime, please try calling the DescribeAlarms CloudWatch API. If the
alarms associated with your policies have ActionsEnabled=false, then this could
cause your policies to not be invoked when the alarm is triggered. Please try
calling the PutMetricAlarm CloudWatch API to update ActionsEnabled=true for the
affected alarms, and that should fix the issues you are experiencing.

Confirmé el error y la solución con mis propias alarmas a través de la API.

información relacionada