Сигналы тревоги AWS в состоянии «ТРЕВОГА» не запускают действия политики

Сигналы тревоги AWS в состоянии «ТРЕВОГА» не запускают действия политики

Сегодня я создал группу AutoScaling с несколькими политиками, каждая из которых имеет сигнал тревоги, связанный с метрикой CloudWatch. Группа AutoScaling запустила два экземпляра, потому что это минимум, который мне требовался для этой группы. Я включил свои тесты производительности, чтобы охватить новую группу, и их общее среднее значение CPUUtilization превысило пороговые значения, которые я установил для сигналов тревоги. Я просмотрел историю для каждого из этих сигналов тревоги, поскольку состояния менялись с INSUFFICIENT_DATA, затем на OK, а затем, наконец, на ALARM. Как и ожидалось. Затем я подождал, пока политики будут выполнены. Указанные 300 секунд до выполнения наступили и прошли. Затем я решил посмотреть, сколько времени пройдет, прежде чем политики выполнятся. Прошло уже больше полутора часов, а эти политики еще не выполнены.

Я расстроился и удалил ASG и все политики и сигналы тревоги. Я решил, что, возможно, я допустил ошибку при создании политик и сигналов тревоги. Поэтому я пересоздал их все. Та же проблема. Сигналы тревоги находятся в состоянии ALARM и никогда не выполняют политики. Я могу выполнять политики вручную без проблем, но это сводит на нет суть.

Если это имеет значение, я создал все эти вещи в AWS Console. В прошлом я использовал API для создания ASG и политик, и эти группы прекрасно выполняли политики.

Что-то я делаю не так? (Или, возможно, просто возникли проблемы с сервисами AWS.)

ОБНОВЛЯТЬ:

Попробовал это снова сегодня. Решил использовать API вместо консоли, чтобы посмотреть, есть ли разница. Будильник, который я использую, только что обновился с OK до ALARM 20 минут назад.

CPUUtilization >= 35 for 5 minutes
Actions: In ALARM: For group TEST use policy Scale Out API (Add 1 instance)
Namespace: AWS/EC2
Metric Name: CPUUtilization
Dimensions: AutoScalingGroupName = TEST
Statistic: Average
Period: 5 minutes

2013-12-19 15:13 UTC-7 - Обновление состояния - Сигнал тревоги обновлен с OK на ALARM

Текущее время: 15:43 UTC-7 (30 минут с момента будильника)

Действие не сработало. Есть идеи почему?

решение1

Я задал этот вопрос наФорумы Амазони, по-видимому, в недавнем создании оповещений была обнаружена ошибка, которая автоматически устанавливает свойство «ActionsEnabled» в значение False.

Из AWS:

We have identified an issue in the AutoScaling console regarding the binding of
AutoScaling policies to CloudWatch alarms and are working on a fix. We will post
an update to this thread once the fix is rolled out. Thanks for bringing this to
our attention.

Обходной путь на данный момент:

In the meantime, please try calling the DescribeAlarms CloudWatch API. If the
alarms associated with your policies have ActionsEnabled=false, then this could
cause your policies to not be invoked when the alarm is triggered. Please try
calling the PutMetricAlarm CloudWatch API to update ActionsEnabled=true for the
affected alarms, and that should fix the issues you are experiencing.

Я подтвердил наличие ошибки и нашел способ ее решения с помощью собственных оповещений через API.

Связанный контент