
서버 모니터링 소프트웨어에 대한 몇 가지 스레드를 검토한 후 다음과 같은 간단한 질문을 받게 되었습니다.
"비정상적인" 상황을 자동으로 감지하고 해결 방법에 대한 권장 사항을 제공하려면 어떤 서버 모니터링 도구를 사용해야 합니까?
설치 후 시스템 성능을 확인하고 평균 부하 값(메모리, CPU 등)을 계산하는 소프트웨어를 찾습니다. 그리고 어떤 일이 발생하면(CPU 부하가 20%로 증가) 이에 대한 이유를 감지하려고 시도합니다. Apache인 경우 액세스 로그를 확인해야 합니다. mysql이라면 mysql 로그를 확인하고 무슨 일이 일어나는지 알려줘야 합니다. 일부 사용자는 많은 양의 이미지를 디코딩하기 때문에 어떤 명령이 실행되는지, 언제 실행되는지, 사용자 이름을 알고 싶습니다. 디스크 사용량, 메모리, 프로세스 수, 스레드 등도 마찬가지입니다.
이상적으로 이 소프트웨어는 시스템을 주기적으로 확인하고 PHP 오류 로그의 오류, 오래된 패키지, 보안 취약점 등의 문제를 보고해야 합니다.
즉, 매일 차트를 모니터링하지 않고도 간단한 Debian/Apache/PHP/MySQL 서버를 유지할 수 있는 소프트웨어를 찾고 있습니다.
답변1
Zabbix와 달리 - 언급됨맥스웰-존경받는 사람이군요나기오스(그리고 비교적 최근의 포크입니다.아이싱가). 이 프레임워크는 10년 넘게 사용되어 왔으며 놀라울 정도로 안정적입니다. 유일한 단점은 설치 및 구성이 Zabbix와 같은 상용 회사 지원 시스템보다 훨씬 더 많은 시간이 소요된다는 것입니다(특히 처음).
물론 두 가지 모두 생태계에서 각자의 위치를 차지하므로 두 가지를 모두 시도해 보시기 바랍니다. 내 의견에서 언급했듯이, 더 심층적인 모니터링 유형을 수행할수록 실제로 자신의 플러그인/스크립트를 작성하거나 다른 사람의 작업을 검색/다운로드/수정하는 등 더 많은 노력을 기울일 것으로 예상해야 합니다. .
행운을 빌어요!
답변2
이와 같은 소프트웨어는 많이 있습니다. 주의할 점은 다른 호스트에서 실행해야 한다는 것입니다. 그렇지 않으면 문제가 발생할 경우 알림을 받지 못할 위험이 높습니다.
예를 들어, 우리는 nagios(모든 모니터링 및 경고를 처리합니다. 즉, 운영자가 무언가를 볼 필요가 있을 때 누군가를 깨우는 역할을 담당함)와 cacti(경고도 수행할 수 있지만 우리는 단지 이를 사용하여 네트워크 트래픽부터 시스템 로드, 이메일 스팸 통계에 이르기까지 다양한 측정항목을 수집하고 집계합니다.
때가 되면 (nagios cacti zabbix 등에서) 경고를 받을 때 살펴볼 성능 데이터(선인장, zabbix 등이 수행함)가 있으면 일반적으로 문제가 있는 위치를 진단하는 데 도움이 됩니다.
가장 일반적인 두 가지 문제 상황(적어도 내 경험상)을 설명하는 일반적인 LAMP 스택에서 HTTP 또는 SQL 서버가 전혀 또는 합리적인 시간에 응답하지 않거나(nagios 프로브가 이를 확인함) 평균 로드가 발생하는 것입니다. 시스템이 엄청나게 높아집니다.
이 두 가지 검사를 통해 문제의 95%를 찾아낼 수 있지만, 찾아야 할 다른 사항도 많이 있습니다. 예:
- Apache가 구성한 최대 프로세스/스레드 수로 지속적으로 작동한다는 것은 서버가 로드를 따라가지 못하고 있음을 의미합니다.
- 시스템은 "정상"으로 작동하지만 RAID에 드라이브 오류가 있습니다(이런 종류의 일이 몇 달 동안 눈에 띄지 않거나 적어도 다음 디스크 오류가 발생할 때까지 얼마나 자주 눈에 띄지 않는지 알 수 없습니다;)
주변에서 찾을 수 있는 거의 모든 제품은 사용할 수 있는 모든 것을 모니터링/그래프화할 수 있습니다. 일반적으로 포함된 도구 및 유비쿼터스 SNMP 외에도 간단한 쉘 스크립트, 짧은 프로그램 등을 통해 제품을 확장할 수 있습니다. .
답변3
자빅스모니터링 솔루션은 원하는 것을 모니터링하고 적절하게 작업을 트리거할 수 있습니다. 예를 들어 로그를 처리하고 필요한 경우 결과를 다시 보내는 스크립트를 실행하는 작업이 있을 수 있습니다. 또한 하나 이상의 조건이 충족되면 작업을 트리거할 수 있습니다(예를 들어 오류 및 CPU 로드가 40% 이상인 로그 구문 분석 스크립트의 출력이 있음).
답변4
Nagios 설치
Nagios는 클라이언트, 최종 사용자 또는 관리자보다 먼저 네트워크 문제를 알려주도록 설계된 호스트 및 서비스 모니터입니다. Linux 운영 체제에서 실행되도록 설계되었지만 대부분의 변형에서도 잘 작동합니다. 모니터링 데몬은 Nagios에 상태 정보를 반환하는 외부 플러그인을 사용하여 사용자가 지정한 호스트와 서비스에 대해 간헐적으로 검사를 실행합니다. 문제가 발생하면 데몬은 다양한 방법(이메일, 인스턴트 메시지, SMS 등)으로 관리자 연락처에 알림을 보낼 수 있습니다. 서버에 Nagios를 설치하면 서버 안정성을 향상시키는 데 도움이 됩니다.
Nagios에는 많은 기능이 있어 매우 강력한 모니터링 도구입니다. 주요 기능 중 일부는 다음과 같습니다. 네트워크 서비스 모니터링(SMTP, POP3, HTTP, NNTP, PING 등) 호스트 리소스 모니터링(프로세서 로드, 디스크 및 메모리 사용량, 실행 중인 프로세스, 로그 파일 등) 모니터링 온도와 같은 환경적 요인 계획된 중단 기간 동안 호스트 및 서비스 알림을 억제하기 위한 예정된 다운타임 사용자가 자신의 호스트 및 서비스 검사를 쉽게 개발할 수 있는 간단한 플러그인 디자인 네트워크 호스트 계층 구조를 정의하여 호스트 간 감지 및 구별 가능 중복 및 분산 모니터링 서버 구현 지원 웹 인터페이스를 통해 문제를 확인하는 기능 서비스 또는 호스트 문제가 발생하고 해결되면 연락 알림(이메일, 호출기 또는 기타 사용자 정의 방법을 통해) 호스트의 선택적 에스컬레이션 및 다양한 연락처 그룹에 대한 서비스 알림 사전 문제 해결을 위해 서비스 또는 호스트 이벤트 중에 실행될 이벤트 핸들러를 정의하는 기능 이벤트 핸들러를 사용하여 모니터링 및 알림 동작을 즉시 수정할 수 있는 외부 명령 인터페이스 , 웹 인터페이스 및 타사 애플리케이션 프로그램을 다시 시작해도 호스트 및 서비스 상태 유지