의견에 대한 추가 정보

Question 1

이 경우 "차단됨"은 hung_task_timeout_secs작업이 오랫동안 중단할 수 없는 상태에 있었다는 의미입니다. 120초는 I/O를 수행하는 데 상당히 긴 시간입니다.

이 호스트에서 측정항목을 가져올 수 있는 모니터링을 진행하세요.순데이터이것은 좋습니다. 메모리에서 매초마다 많은 양의 항목을 수집하므로 디스크 I/O가 많지 않습니다. 그리고 좋은 그래프가 있습니다.

와 같은 디스크 대기 시간을 검토합니다 iostat -xz 1. 한 자리 ms 이상의 대기는 좋지 않습니다. 스핀들, 솔리드 스테이트, SAN LUN 등 스토리지가 무엇인지 공유하십시오.

회전 및 고정과 관련하여 스케줄러를 굶기게 만드는 것 같습니다. 문제의 특정 CPU 모델과 어떤 코어를 고정하여 무엇을 하는지 공유하세요. 어떻게 LockSupport.parkNanos()구현되나요?

검토 vmstat 1. 지속적으로 많은 작업을 실행 중이 r 거나 중단할 수 없는 b상태로 유지하는 것은 좋지 않습니다.

BPF를 설치하고 스크립트를 사용하여 작업 진단을 수집하는 것을 고려하세요.runqslower특정 임계값을 초과하는 대기 작업을 표시합니다. 매우 빠른 것이 이상적입니다. 임계값 단위는 마이크로초입니다.

잠시 뒤로 물러나서 이 제품의 디자인을 생각해 보세요.

지연 시간 목표는 정확히 무엇이며, 무엇을 얼마나 빠르게 수행합니까?

postgres가 동일한 호스트에서 실행되는 이유가 있습니까? 원격이고 TCP를 통해 액세스되는 경우 해당 I/O는 JVM 애플리케이션에 문제가 되지 않습니다.

Answer

이 경우 "차단됨"은 hung_task_timeout_secs작업이 오랫동안 중단할 수 없는 상태에 있었다는 의미입니다. 120초는 I/O를 수행하는 데 상당히 긴 시간입니다.

이 호스트에서 측정항목을 가져올 수 있는 모니터링을 진행하세요.순데이터이것은 좋습니다. 메모리에서 매초마다 많은 양의 항목을 수집하므로 디스크 I/O가 많지 않습니다. 그리고 좋은 그래프가 있습니다.

와 같은 디스크 대기 시간을 검토합니다 iostat -xz 1. 한 자리 ms 이상의 대기는 좋지 않습니다. 스핀들, 솔리드 스테이트, SAN LUN 등 스토리지가 무엇인지 공유하십시오.

회전 및 고정과 관련하여 스케줄러를 굶기게 만드는 것 같습니다. 문제의 특정 CPU 모델과 어떤 코어를 고정하여 무엇을 하는지 공유하세요. 어떻게 LockSupport.parkNanos()구현되나요?

검토 vmstat 1. 지속적으로 많은 작업을 실행 중이 r 거나 중단할 수 없는 b상태로 유지하는 것은 좋지 않습니다.

BPF를 설치하고 스크립트를 사용하여 작업 진단을 수집하는 것을 고려하세요.runqslower특정 임계값을 초과하는 대기 작업을 표시합니다. 매우 빠른 것이 이상적입니다. 임계값 단위는 마이크로초입니다.

잠시 뒤로 물러나서 이 제품의 디자인을 생각해 보세요.

지연 시간 목표는 정확히 무엇이며, 무엇을 얼마나 빠르게 수행합니까?

postgres가 동일한 호스트에서 실행되는 이유가 있습니까? 원격이고 TCP를 통해 액세스되는 경우 해당 I/O는 JVM 애플리케이션에 문제가 되지 않습니다.

Question 2

좋아, 결국 문제는 아주 간단했습니다. 내 테스트 코드에서 이 요소 하나가 누락되었기 때문에 격리된 테스트에서는 컴퓨터가 충돌할 수 없었습니다. 문제는 공유 메모리나 코어 고정 자체와는 관련이 없습니다. 코어를 분리하면 스케줄러가 고갈될 수 있는 지점까지 사용 가능한 공유 리소스가 약간 줄어들었습니다. 왜냐하면...

두 JVM 모두 다음을 사용하여 실시간 우선순위로 설정되었습니다.

sudo renice -n -20 $!
sudo chrt -r -a -p 99 $!

전체 JVM이 최대 우선순위로 총 300개에 가까운 스레드로 범프되었습니다. 상대적으로 낮은 CPU 사용률에서도 150,000/s 이상의 컨텍스트 전환이 가능합니다.

우리는 niceness를 남겨두고 실시간 변경을 제거했습니다. 이것으로 해결된 것 같습니다. 레거시 RT 설정의 원래 목표는 바쁜 회전/고정/c-상태/p-상태 등의 방식을 변경하여 달성할 수 있습니다.

Answer

좋아, 결국 문제는 아주 간단했습니다. 내 테스트 코드에서 이 요소 하나가 누락되었기 때문에 격리된 테스트에서는 컴퓨터가 충돌할 수 없었습니다. 문제는 공유 메모리나 코어 고정 자체와는 관련이 없습니다. 코어를 분리하면 스케줄러가 고갈될 수 있는 지점까지 사용 가능한 공유 리소스가 약간 줄어들었습니다. 왜냐하면...

두 JVM 모두 다음을 사용하여 실시간 우선순위로 설정되었습니다.

sudo renice -n -20 $!
sudo chrt -r -a -p 99 $!

전체 JVM이 최대 우선순위로 총 300개에 가까운 스레드로 범프되었습니다. 상대적으로 낮은 CPU 사용률에서도 150,000/s 이상의 컨텍스트 전환이 가능합니다.

우리는 niceness를 남겨두고 실시간 변경을 제거했습니다. 이것으로 해결된 것 같습니다. 레거시 RT 설정의 원래 목표는 바쁜 회전/고정/c-상태/p-상태 등의 방식을 변경하여 달성할 수 있습니다.

의견에 대한 추가 정보

의견에 대한 추가 정보

답변1

답변2

관련 정보