AWS Auto-Scaling 그룹에서 분석을 위해 죽은 인스턴스를 활성 상태로 유지

AWS Auto-Scaling 그룹에서 분석을 위해 죽은 인스턴스를 활성 상태로 유지

우리는 소규모 Auto Scaling 그룹(보통 2-4개의 인스턴스)으로 AWS에서 일부 웹 서버를 실행합니다. 해당 상태 확인은 ELB 상태 확인을 기반으로 하므로 웹 서버 중 하나가 응답을 중지하면 새 인스턴스로 교체됩니다.

이것은 현재 잘 작동하고 있습니다. 가동 중단이 발생하면 응답하지 않는 서버가 종료되고 새 서버가 가동되어 그 자리를 대신합니다.

문제는 현재 서버가 다운되는 이유를 알 수 없다는 것입니다. 우리가 가지고 있는 일부 로그에서 약간의 의심이 들지만 더 이상 서버에 로그인할 수 없고 웹 로그, 시스템 로그 또는 기타 모든 항목을 살펴볼 수 없습니다.

Auto Scaling 그룹에서 인스턴스를 수동으로 분리하는 방법이 있다는 것을 알고 있지만, 장애 발생 시 자동으로 이 작업을 수행할 수 있는 방법이 있습니까?

제가 원하는 것은 서버에 장애가 발생하면 계속 실행되지만 Auto Scaling 그룹에서 제거되어 서버를 분석하여 무엇이 잘못되었는지 확인할 수 있다는 것입니다. 분명한 보너스는 이것이 발생할 수 있는 빈도를 제한하여 어떤 이유로든 서버 순환을 유지하는 경우 수백 개의 분리된 인스턴스로 끝나지 않도록 하는 것입니다.

그러면 이것이 어떻게든 이루어질 수 있습니까? 그렇다면 어떻게 해야 합니까?

답변1

이를 수행하는 몇 가지 방법이 있습니다.

  • ASG -> 세부정보 -> 편집 -> 프로세스 일시중단 -> "종료"에서 "종료" 작업을 일시중단할 수 있습니다. 어떤 기계도 종료되지 않습니다.

  • 또한 ASG -> 인스턴스 -> 작업 -> 인스턴스 보호에서 특정 인스턴스를 보호할 수 있습니다.

  • 그런 다음 이벤트가 발생하면 ASG에서 인스턴스를 쫓아내는 것과 같은 독창적인 방법이 있습니다.

관련 정보