"무슨 일이야?" 서버 성능 모니터

Question 1

Zabbix와 달리 - 언급됨맥스웰-존경받는 사람이군요나기오스(그리고 비교적 최근의 포크입니다.아이싱가). 이 프레임워크는 10년 넘게 사용되어 왔으며 놀라울 정도로 안정적입니다. 유일한 단점은 설치 및 구성이 Zabbix와 같은 상용 회사 지원 시스템보다 훨씬 더 많은 시간이 소요된다는 것입니다(특히 처음).

물론 두 가지 모두 생태계에서 각자의 위치를 차지하므로 두 가지를 모두 시도해 보시기 바랍니다. 내 의견에서 언급했듯이, 더 심층적인 모니터링 유형을 수행할수록 실제로 자신의 플러그인/스크립트를 작성하거나 다른 사람의 작업을 검색/다운로드/수정하는 등 더 많은 노력을 기울일 것으로 예상해야 합니다. .

행운을 빌어요!

Answer

Zabbix와 달리 - 언급됨맥스웰-존경받는 사람이군요나기오스(그리고 비교적 최근의 포크입니다.아이싱가). 이 프레임워크는 10년 넘게 사용되어 왔으며 놀라울 정도로 안정적입니다. 유일한 단점은 설치 및 구성이 Zabbix와 같은 상용 회사 지원 시스템보다 훨씬 더 많은 시간이 소요된다는 것입니다(특히 처음).

물론 두 가지 모두 생태계에서 각자의 위치를 차지하므로 두 가지를 모두 시도해 보시기 바랍니다. 내 의견에서 언급했듯이, 더 심층적인 모니터링 유형을 수행할수록 실제로 자신의 플러그인/스크립트를 작성하거나 다른 사람의 작업을 검색/다운로드/수정하는 등 더 많은 노력을 기울일 것으로 예상해야 합니다. .

행운을 빌어요!

Question 2

이와 같은 소프트웨어는 많이 있습니다. 주의할 점은 다른 호스트에서 실행해야 한다는 것입니다. 그렇지 않으면 문제가 발생할 경우 알림을 받지 못할 위험이 높습니다.

예를 들어, 우리는 nagios(모든 모니터링 및 경고를 처리합니다. 즉, 운영자가 무언가를 볼 필요가 있을 때 누군가를 깨우는 역할을 담당함)와 cacti(경고도 수행할 수 있지만 우리는 단지 이를 사용하여 네트워크 트래픽부터 시스템 로드, 이메일 스팸 통계에 이르기까지 다양한 측정항목을 수집하고 집계합니다.

때가 되면 (nagios cacti zabbix 등에서) 경고를 받을 때 살펴볼 성능 데이터(선인장, zabbix 등이 수행함)가 있으면 일반적으로 문제가 있는 위치를 진단하는 데 도움이 됩니다.

가장 일반적인 두 가지 문제 상황(적어도 내 경험상)을 설명하는 일반적인 LAMP 스택에서 HTTP 또는 SQL 서버가 전혀 또는 합리적인 시간에 응답하지 않거나(nagios 프로브가 이를 확인함) 평균 로드가 발생하는 것입니다. 시스템이 엄청나게 높아집니다.

이 두 가지 검사를 통해 문제의 95%를 찾아낼 수 있지만, 찾아야 할 다른 사항도 많이 있습니다. 예:

Apache가 구성한 최대 프로세스/스레드 수로 지속적으로 작동한다는 것은 서버가 로드를 따라가지 못하고 있음을 의미합니다.
시스템은 "정상"으로 작동하지만 RAID에 드라이브 오류가 있습니다(이런 종류의 일이 몇 달 동안 눈에 띄지 않거나 적어도 다음 디스크 오류가 발생할 때까지 얼마나 자주 눈에 띄지 않는지 알 수 없습니다;)

주변에서 찾을 수 있는 거의 모든 제품은 사용할 수 있는 모든 것을 모니터링/그래프화할 수 있습니다. 일반적으로 포함된 도구 및 유비쿼터스 SNMP 외에도 간단한 쉘 스크립트, 짧은 프로그램 등을 통해 제품을 확장할 수 있습니다. .

Answer

이와 같은 소프트웨어는 많이 있습니다. 주의할 점은 다른 호스트에서 실행해야 한다는 것입니다. 그렇지 않으면 문제가 발생할 경우 알림을 받지 못할 위험이 높습니다.

예를 들어, 우리는 nagios(모든 모니터링 및 경고를 처리합니다. 즉, 운영자가 무언가를 볼 필요가 있을 때 누군가를 깨우는 역할을 담당함)와 cacti(경고도 수행할 수 있지만 우리는 단지 이를 사용하여 네트워크 트래픽부터 시스템 로드, 이메일 스팸 통계에 이르기까지 다양한 측정항목을 수집하고 집계합니다.

때가 되면 (nagios cacti zabbix 등에서) 경고를 받을 때 살펴볼 성능 데이터(선인장, zabbix 등이 수행함)가 있으면 일반적으로 문제가 있는 위치를 진단하는 데 도움이 됩니다.

가장 일반적인 두 가지 문제 상황(적어도 내 경험상)을 설명하는 일반적인 LAMP 스택에서 HTTP 또는 SQL 서버가 전혀 또는 합리적인 시간에 응답하지 않거나(nagios 프로브가 이를 확인함) 평균 로드가 발생하는 것입니다. 시스템이 엄청나게 높아집니다.

이 두 가지 검사를 통해 문제의 95%를 찾아낼 수 있지만, 찾아야 할 다른 사항도 많이 있습니다. 예:

Apache가 구성한 최대 프로세스/스레드 수로 지속적으로 작동한다는 것은 서버가 로드를 따라가지 못하고 있음을 의미합니다.
시스템은 "정상"으로 작동하지만 RAID에 드라이브 오류가 있습니다(이런 종류의 일이 몇 달 동안 눈에 띄지 않거나 적어도 다음 디스크 오류가 발생할 때까지 얼마나 자주 눈에 띄지 않는지 알 수 없습니다;)

주변에서 찾을 수 있는 거의 모든 제품은 사용할 수 있는 모든 것을 모니터링/그래프화할 수 있습니다. 일반적으로 포함된 도구 및 유비쿼터스 SNMP 외에도 간단한 쉘 스크립트, 짧은 프로그램 등을 통해 제품을 확장할 수 있습니다. .

Question 3

자빅스모니터링 솔루션은 원하는 것을 모니터링하고 적절하게 작업을 트리거할 수 있습니다. 예를 들어 로그를 처리하고 필요한 경우 결과를 다시 보내는 스크립트를 실행하는 작업이 있을 수 있습니다. 또한 하나 이상의 조건이 충족되면 작업을 트리거할 수 있습니다(예를 들어 오류 및 CPU 로드가 40% 이상인 로그 구문 분석 스크립트의 출력이 있음).

Answer

자빅스모니터링 솔루션은 원하는 것을 모니터링하고 적절하게 작업을 트리거할 수 있습니다. 예를 들어 로그를 처리하고 필요한 경우 결과를 다시 보내는 스크립트를 실행하는 작업이 있을 수 있습니다. 또한 하나 이상의 조건이 충족되면 작업을 트리거할 수 있습니다(예를 들어 오류 및 CPU 로드가 40% 이상인 로그 구문 분석 스크립트의 출력이 있음).

Question 4

Nagios 설치

Nagios는 클라이언트, 최종 사용자 또는 관리자보다 먼저 네트워크 문제를 알려주도록 설계된 호스트 및 서비스 모니터입니다. Linux 운영 체제에서 실행되도록 설계되었지만 대부분의 변형에서도 잘 작동합니다. 모니터링 데몬은 Nagios에 상태 정보를 반환하는 외부 플러그인을 사용하여 사용자가 지정한 호스트와 서비스에 대해 간헐적으로 검사를 실행합니다. 문제가 발생하면 데몬은 다양한 방법(이메일, 인스턴트 메시지, SMS 등)으로 관리자 연락처에 알림을 보낼 수 있습니다. 서버에 Nagios를 설치하면 서버 안정성을 향상시키는 데 도움이 됩니다.

Nagios에는 많은 기능이 있어 매우 강력한 모니터링 도구입니다. 주요 기능 중 일부는 다음과 같습니다. 네트워크 서비스 모니터링(SMTP, POP3, HTTP, NNTP, PING 등) 호스트 리소스 모니터링(프로세서 로드, 디스크 및 메모리 사용량, 실행 중인 프로세스, 로그 파일 등) 모니터링 온도와 같은 환경적 요인 계획된 중단 기간 동안 호스트 및 서비스 알림을 억제하기 위한 예정된 다운타임 사용자가 자신의 호스트 및 서비스 검사를 쉽게 개발할 수 있는 간단한 플러그인 디자인 네트워크 호스트 계층 구조를 정의하여 호스트 간 감지 및 구별 가능 중복 및 분산 모니터링 서버 구현 지원 웹 인터페이스를 통해 문제를 확인하는 기능 서비스 또는 호스트 문제가 발생하고 해결되면 연락 알림(이메일, 호출기 또는 기타 사용자 정의 방법을 통해) 호스트의 선택적 에스컬레이션 및 다양한 연락처 그룹에 대한 서비스 알림 사전 문제 해결을 위해 서비스 또는 호스트 이벤트 중에 실행될 이벤트 핸들러를 정의하는 기능 이벤트 핸들러를 사용하여 모니터링 및 알림 동작을 즉시 수정할 수 있는 외부 명령 인터페이스 , 웹 인터페이스 및 타사 애플리케이션 프로그램을 다시 시작해도 호스트 및 서비스 상태 유지

Answer

Nagios 설치

Nagios는 클라이언트, 최종 사용자 또는 관리자보다 먼저 네트워크 문제를 알려주도록 설계된 호스트 및 서비스 모니터입니다. Linux 운영 체제에서 실행되도록 설계되었지만 대부분의 변형에서도 잘 작동합니다. 모니터링 데몬은 Nagios에 상태 정보를 반환하는 외부 플러그인을 사용하여 사용자가 지정한 호스트와 서비스에 대해 간헐적으로 검사를 실행합니다. 문제가 발생하면 데몬은 다양한 방법(이메일, 인스턴트 메시지, SMS 등)으로 관리자 연락처에 알림을 보낼 수 있습니다. 서버에 Nagios를 설치하면 서버 안정성을 향상시키는 데 도움이 됩니다.

Nagios에는 많은 기능이 있어 매우 강력한 모니터링 도구입니다. 주요 기능 중 일부는 다음과 같습니다. 네트워크 서비스 모니터링(SMTP, POP3, HTTP, NNTP, PING 등) 호스트 리소스 모니터링(프로세서 로드, 디스크 및 메모리 사용량, 실행 중인 프로세스, 로그 파일 등) 모니터링 온도와 같은 환경적 요인 계획된 중단 기간 동안 호스트 및 서비스 알림을 억제하기 위한 예정된 다운타임 사용자가 자신의 호스트 및 서비스 검사를 쉽게 개발할 수 있는 간단한 플러그인 디자인 네트워크 호스트 계층 구조를 정의하여 호스트 간 감지 및 구별 가능 중복 및 분산 모니터링 서버 구현 지원 웹 인터페이스를 통해 문제를 확인하는 기능 서비스 또는 호스트 문제가 발생하고 해결되면 연락 알림(이메일, 호출기 또는 기타 사용자 정의 방법을 통해) 호스트의 선택적 에스컬레이션 및 다양한 연락처 그룹에 대한 서비스 알림 사전 문제 해결을 위해 서비스 또는 호스트 이벤트 중에 실행될 이벤트 핸들러를 정의하는 기능 이벤트 핸들러를 사용하여 모니터링 및 알림 동작을 즉시 수정할 수 있는 외부 명령 인터페이스 , 웹 인터페이스 및 타사 애플리케이션 프로그램을 다시 시작해도 호스트 및 서비스 상태 유지

"무슨 일이야?" 서버 성능 모니터

답변1

답변2

답변3

답변4

관련 정보