
우리는 다양한 시스템 지표를 보고하기 위해 작성한 특수 스크립트를 각각 실행하는 여러 개의 LAMP 서버를 보유하고 있습니다. 보고서는 매일 실행되며 빠른 통과를 통해 시스템의 잠재적인 문제를 찾아낼 수 있다는 아이디어입니다.
각 LAMP 서버는 RedHat Enterprise를 실행하고 각각 40-50개(그리고 계속 증가하고 있음)의 공개 웹사이트(HTML, 사용자 정의 PHP 및 Drupal 사이트의 혼합)를 호스팅합니다.
현재 스크립트에 포함된 내용은 다음과 같습니다.
- 서버 로드 및 로그인된 사용자
- 최근 10번의 로그인 및 횟수
- 디스크 사용량
- 다양한 로그의 마지막 10줄(qmail, mysql, secure, apache error, package)
- 모든 계정의 사용자 이름, 포트 및 마지막 로그인 시간
- 탑 덤프
보고서가 이미 길어서 가능한 한 간결하게 작성하는 데 관심이 있습니다.
그러한 스크립트에 포함해야 할 중요한 다른 측정항목을 찾았습니까? 이 목록에서 무엇이든 삭제하시겠습니까?
고마워요, 팀.
제이
답변1
귀하의 환경이 정상적인지 확인하기 위해 테스트하겠습니다. PHP가 올바르게 실행되고 있는지 테스트하십시오(뭔가를 에코하는 간단한 PHP 스크립트 작성, wget, 예상한 결과를 받았는지 확인), 데이터베이스(연결하고 데이터베이스를 볼 수 있는지 확인) 등.
또한 SSL을 수행하는 경우 인증서 만료, 예상치 못한 변경 사항 등을 확인하세요.
답변2
답변3
제가 조언하는 바는 그러한 일을 일상적으로 보고하지 않는 것입니다. 당신은 정보로 가득 차게 될 것이며 인간의 본성은 문제가 발생하면 실제로 그것을 간과할 수 있음을 지시합니다.
대신 해당 변수 중 하나가 비정상적인 경우에만 보고하십시오. 아마도 낮에는 더 자주 그럴 수도 있습니다. 이러한 변경 사항을 경고하고 향후 참조를 위해 기록 데이터를 유지하는 Cacti와 같은 모니터링 및 그래프 시스템을 사용할 수 있습니다.
답변4
당신은 정말로 지속적인 모니터링을 원합니다. 우리는 Nagios를 사용하여 각 웹 서버가 1분에 여러 번씩 계속 작동하는지 확인합니다. 우리는 또한 데이터베이스와 우리가 생각할 수 있는 모든 것을 모니터링합니다. 시간이 지남에 따라 가동 중단이 발생하고 모니터링해야 할 사항을 발견하게 됩니다.
모니터링의 다른 측면은 일종의 그래프입니다. 우리는 Munin을 사용하지만 선인장이나 신경절이 일반적인 솔루션입니다. 그래프는 시스템의 추세를 파악하는 데 매우 중요합니다.