
여러 IP 카메라 스트림(rtsp)을 읽고 이에 대해 실시간으로 다양한 기계 학습 알고리즘을 실행하는 애플리케이션을 구축 중입니다. 각 카메라 스트림에 대해
- rtsp 스트림을 지속적으로 프레임으로 나누고 이미지(JPEG)로 저장하는 ffmpeg 프로세스를 생성합니다. 스트림은 H.264 인코딩을 사용합니다. 매초마다 1프레임을 출력으로 사용하고 있습니다.
- 모델에 해당하는 메시지 큐에는 파일 위치가 포함된 메시지가 제공됩니다.
- 모델들은 계속해서 파일을 집어 들고 추론을 합니다.
내가 직면하고 있는 문제는 ffmpeg 디코딩 프로세스에 의한 CPU 사용량입니다. 프레임 손실 없이 실시간 추론을 위해서는 카메라 스트림 2개마다 코어로 서버를 강화해야 합니다. ffmpeg에 누락된 최적화가 있나요?
Ubuntu 18.04 OS에서 Intel Xeon Gold 프로세서를 사용하고 있습니다.