¿Cómo encontrar la posición de los objetos detectados en un vídeo en YOLO?

¿Cómo encontrar la posición de los objetos detectados en un vídeo en YOLO?

Hola. Primero que nada, soy un verdadero novato en codificación y todo eso. Encontré este YOLO y quería hacer algo con él.

Después de descargar YOLO y ejecutarlo escribiendo

./demostración del detector darknet cfg/coco.data cfg/yolov3.cfg yolov3.weights

Puedo detectar objetos con éxito en un video, pero necesito obtener la posición de cada objeto detectado como en este ejemplo.

Transmisión de vídeo: 1920 x 1080 Número de fotograma: 1 Objetos:

Número de cuadro: 2 Objetos:

autobús: 89%, Posición: (0.032253, 0.110209), Alto y Ancho: 0.063911, 0.072384

autobús: 86%, Posición: (0.237973, 0.090691), Alto y Ancho: 0.074506, 0.068445

coche: 99%, Posición: (0.304282, 0.219430), Alto y Ancho: 0.100312, 0.104738

coche: 96%, Posición: (0.452458, 0.125739), Alto y Ancho: 0.044005, 0.061994

coche: 96%, Posición: (0.758392, 0.163063), Alto y Ancho: 0.082789, 0.070389

Entonces, ¿cómo puedo saber las coordenadas de los objetos detectados? Una respuesta detallada sería realmente útil.

información relacionada