Haga coincidir imágenes duplicadas por contenido y cámbieles el nombre (al nombre del duplicado)

Haga coincidir imágenes duplicadas por contenido y cámbieles el nombre (al nombre del duplicado)

Tengo 2 carpetas con más de 5.000 fotos cada una:

  • Carpeta 1:los archivos originales en buena calidad pero con nombres legibles por humanos (p. ej. saigon_motorcycle_traffic.jpg)
  • Carpeta 2:los mismos archivos en muy mala calidad (450 px de ancho) pero con identificadores limpios que coinciden con una base de datos (por ejemplo 562634.jpg).

El objetivo es hacer coincidir las imágenes de alta resolución con los ID de la base de datos.

Mi pregunta:¿Cuál sería la forma más rápida de cambiar el nombre de la versión de alta resolución saigon_motorcycle_traffic.jpga su contraparte de baja resolución 562634.jpg?


He probado varios programas (p. ej.Limpiador de fotos duplicadas,Visitas, XnView, DupliFinder, ...), todos encontraron los duplicados pero ninguno ofrecía una forma adecuada para este tipo de cambio de nombre o una función de exportación adecuada.

Editar: No he probado ningún script (como se indica en los comentarios), ya que no conozco ninguno y no encontré ninguno. Si sabes algo por favor házmelo saber.

Algunas cosas no funcionarán: hacer coincidir las dimensiones de la imagen no funcionará (la mayoría de las imágenes tienen las mismas dimensiones), hacer coincidir la fecha de creación no funcionará (todo eso es un desastre) y hacerlo a mano no funcionará porque quiero mantener mi salud mental ;-)

Respuesta1

Terminé escribiendo una rutina PHP (no publicaré el código completo porque es una solución realmente sucia) que funcionó.

UsandofaserPude iterar sobre todos los archivos de imagen y encontrar los duplicados sospechosos (!): cada imagen se transforma en un hash pequeño (basado en una versión de 8x8 de la imagen). Luego, estos hashes se pueden comparar.

2 cosas a tener en cuenta:

  • Dado que es un bucle anidado, es importante obtener primero todos los hashes y almacenarlos en caché antes de realizar la comparación real. De lo contrario, tardará una eternidad.
  • el enfoque NO da resultados perfectos. Tuve una pequeña tasa de error en la primera ejecución. Así que todavía quedaban algunas comprobaciones de errores por hacer.

Respuesta2

Parece que ha tenido algunas experiencias frustrantes con el software de limpieza de fotografías duplicadas. ¿Ha considerado utilizar unreparador de fotos duplicadasque no sólo encuentra duplicados, sino que también ofrece funciones para cambiar el nombre y exportar tus fotos? Este tipo de herramientas pueden ser más completas y brindar una mejor experiencia general. Es posible que desees investigar y probar algunas opciones diferentes para encontrar la que mejor se adapte a tus necesidades.

información relacionada