F5 LTM은 SIGKILL을 사용하여 프로세스를 자주 종료합니다.

F5 LTM은 SIGKILL을 사용하여 프로세스를 자주 종료합니다.

우리는 놀라운 빈도로 프로세스를 종료하는 BIP-IP 6400 LTM 장치를 보유하고 있습니다. CPU 사용률은 지속적으로 약 23%이므로 문제가 되지 않습니다.

다음은 샘플입니다 /var/log/ltm.

Oct  7 08:21:55 local/pri-4600 info bigd[3471]: reap_child: child process PID = 25338 exited with signal = 9
Oct  7 08:22:15 local/pri-4600 info bigd[3471]: reap_child: child process PID = 25587 exited with signal = 9
Oct  7 08:22:34 local/pri-4600 info bigd[3471]: reap_child: child process PID = 25793 exited with signal = 9
Oct  7 08:23:10 local/pri-4600 info bigd[3471]: reap_child: child process PID = 26260 exited with signal = 9
Oct  7 08:23:36 local/pri-4600 info bigd[3471]: reap_child: child process PID = 26584 exited with signal = 9
Oct  7 08:23:40 local/pri-4600 info bigd[3471]: reap_child: child process PID = 26647 exited with signal = 9
Oct  7 08:23:45 local/pri-4600 info bigd[3471]: reap_child: child process PID = 26699 exited with signal = 9
Oct  7 08:23:55 local/pri-4600 info bigd[3471]: reap_child: child process PID = 26805 exited with signal = 9
Oct  7 08:25:36 local/pri-4600 info bigd[3471]: reap_child: child process PID = 28079 exited with signal = 9
Oct  7 08:27:15 local/pri-4600 info bigd[3471]: reap_child: child process PID = 29286 exited with signal = 9
Oct  7 08:27:16 local/pri-4600 info bigd[3471]: reap_child: child process PID = 29307 exited with signal = 9
Oct  7 08:27:56 local/pri-4600 info bigd[3471]: reap_child: child process PID = 29793 exited with signal = 9
Oct  7 08:29:20 local/pri-4600 info bigd[3471]: reap_child: child process PID = 30851 exited with signal = 9
Oct  7 08:33:00 local/pri-4600 info bigd[3471]: reap_child: child process PID = 1122 exited with signal = 9
Oct  7 08:33:16 local/pri-4600 info bigd[3471]: reap_child: child process PID = 1299 exited with signal = 9
Oct  7 08:34:15 local/pri-4600 info bigd[3471]: reap_child: child process PID = 2054 exited with signal = 9
Oct  7 08:35:16 local/pri-4600 info bigd[3471]: reap_child: child process PID = 2784 exited with signal = 9
Oct  7 08:35:16 local/pri-4600 info bigd[3471]: reap_child: child process PID = 2807 exited with signal = 9
Oct  7 08:35:35 local/pri-4600 info bigd[3471]: reap_child: child process PID = 3015 exited with signal = 9
Oct  7 08:36:15 local/pri-4600 info bigd[3471]: reap_child: child process PID = 3601 exited with signal = 9

이게 정상인가요? 그렇지 않다면, 이런 일이 발생하는 원인은 무엇입니까?

답변1

bigd는 BIG-IP의 모니터링 데몬이므로 사용 중인 모니터가 충돌하는 것으로 보입니다. 지원을 통해 케이스를 열고 qkview를 ihealth.f5.com에 업로드해야 합니다. 해당 오류 메시지와 관련된 해결 방법은 다음과 같습니다.

https://support.f5.com/kb/en-us/solutions/public/17000/000/sol17092.html

답변2

이는 우리가 실행 중인 10.2.4 BIG-IP 소프트웨어의 알려진 버그였습니다.

F5 지원에서:

...내부적으로 다음과 같이 추적되는 알려진 문제가 발생했습니다. 버그 ID539130 "bigd는 SIGCHLD를 처리하는 동안 교착 상태에 빠져 bigd 하트비트 오류 및 SIGABRT를 유발합니다." -=Condition=- 오랫동안 실행되고 다음 반복에 의해 종료되는 외부 모니터 모니터로 인해 bigd가 충돌하고 코어될 수 있으며 이로 인해 상태 모니터링이 일시적으로 중단됩니다.

해결 방법은 소프트웨어를 Hotfix-BIGIP-10.2.4-HF12-866.11-ENG.

관련 정보