Hola. Primero que nada, soy un verdadero novato en codificación y todo eso. Encontré este YOLO y quería hacer algo con él.
Después de descargar YOLO y ejecutarlo escribiendo
./demostración del detector darknet cfg/coco.data cfg/yolov3.cfg yolov3.weights
Puedo detectar objetos con éxito en un video, pero necesito obtener la posición de cada objeto detectado como en este ejemplo.
Transmisión de vídeo: 1920 x 1080 Número de fotograma: 1 Objetos:
Número de cuadro: 2 Objetos:
autobús: 89%, Posición: (0.032253, 0.110209), Alto y Ancho: 0.063911, 0.072384
autobús: 86%, Posición: (0.237973, 0.090691), Alto y Ancho: 0.074506, 0.068445
coche: 99%, Posición: (0.304282, 0.219430), Alto y Ancho: 0.100312, 0.104738
coche: 96%, Posición: (0.452458, 0.125739), Alto y Ancho: 0.044005, 0.061994
coche: 96%, Posición: (0.758392, 0.163063), Alto y Ancho: 0.082789, 0.070389
Entonces, ¿cómo puedo saber las coordenadas de los objetos detectados? Una respuesta detallada sería realmente útil.