¿Cómo encontrar la posición de los objetos detectados en un vídeo en YOLO?

2024-8-8 • tag-icon

Hola. Primero que nada, soy un verdadero novato en codificación y todo eso. Encontré este YOLO y quería hacer algo con él.

Después de descargar YOLO y ejecutarlo escribiendo

./demostración del detector darknet cfg/coco.data cfg/yolov3.cfg yolov3.weights

Puedo detectar objetos con éxito en un video, pero necesito obtener la posición de cada objeto detectado como en este ejemplo.

Transmisión de vídeo: 1920 x 1080 Número de fotograma: 1 Objetos:

Número de cuadro: 2 Objetos:

autobús: 89%, Posición: (0.032253, 0.110209), Alto y Ancho: 0.063911, 0.072384

autobús: 86%, Posición: (0.237973, 0.090691), Alto y Ancho: 0.074506, 0.068445

coche: 99%, Posición: (0.304282, 0.219430), Alto y Ancho: 0.100312, 0.104738

coche: 96%, Posición: (0.452458, 0.125739), Alto y Ancho: 0.044005, 0.061994

coche: 96%, Posición: (0.758392, 0.163063), Alto y Ancho: 0.082789, 0.070389

Entonces, ¿cómo puedo saber las coordenadas de los objetos detectados? Una respuesta detallada sería realmente útil.

información relacionada