Línea de comando OSX Buscar nombres de archivos duplicados con diferentes extensiones

Question 1

Sugeriría una modificación de su segundo comando:

find . -type f -name "*.jpg" | \
    while read -r f; do [ -e "${f%.jpg}.png" ] && echo "${f%.jpg}"; done

Esto busca todos .jpglos archivos, comprueba si el .pngarchivo correspondiente existe y muestra la ruta completa sin las extensiones.

Tenga en cuenta que si hay muchos menos .pngarchivos, será más eficiente buscarlos y comprobar los .jpgarchivos correspondientes.

[Probado con bashUbuntu 18.04.1.]

Answer

Sugeriría una modificación de su segundo comando:

find . -type f -name "*.jpg" | \
    while read -r f; do [ -e "${f%.jpg}.png" ] && echo "${f%.jpg}"; done

Esto busca todos .jpglos archivos, comprueba si el .pngarchivo correspondiente existe y muestra la ruta completa sin las extensiones.

Tenga en cuenta que si hay muchos menos .pngarchivos, será más eficiente buscarlos y comprobar los .jpgarchivos correspondientes.

[Probado con bashUbuntu 18.04.1.]

Question 2

Acepto y agradezco la respuesta. Mientras tanto, obtuve este script de Python que funcionó un poco cerca de lo que estaba buscando. Intenté encontrar la fuente pero no pude encontrarla en cientos de pestañas que busqué.

#!/usr/bin/env python
# Syntax: duplicates.py DIRECTORY
import os, sys
top = sys.argv[1]
d = {}

for root, dirs, files in os.walk(top, topdown=False):
  for name in files:
    fn = os.path.join(root, name)
    basename, extension = os.path.splitext(name)

    basename = basename.lower() # ignore case

    if basename in d:
        print(d[basename])
        print(fn)
    else:
        d[basename] = fn

Guarde este archivo como duplicados.py, asígnele derechos y luego ejecútelo en la carpeta.

./duplicates.py Images

Answer

Acepto y agradezco la respuesta. Mientras tanto, obtuve este script de Python que funcionó un poco cerca de lo que estaba buscando. Intenté encontrar la fuente pero no pude encontrarla en cientos de pestañas que busqué.

#!/usr/bin/env python
# Syntax: duplicates.py DIRECTORY
import os, sys
top = sys.argv[1]
d = {}

for root, dirs, files in os.walk(top, topdown=False):
  for name in files:
    fn = os.path.join(root, name)
    basename, extension = os.path.splitext(name)

    basename = basename.lower() # ignore case

    if basename in d:
        print(d[basename])
        print(fn)
    else:
        d[basename] = fn

Guarde este archivo como duplicados.py, asígnele derechos y luego ejecútelo en la carpeta.

./duplicates.py Images

Question 3

Debe usar uniq -cpara obtener los recuentos y luego realizar una ordenación inversa al final para enumerar primero los duplicados. Al final awkse utiliza para filtrar líneas que comienzan con 2 o más.

$ find . -type f -exec sh -c 'basename ${0%.*}' {} \; | sort | uniq -c | sort -r | awk 'int($1)>=2'
   2 foo

Aquí, %.*quita la extensión, así foo.x.yse convierte foo.x.

En lugar de un simple find . -type f, que encontraría todos los archivos, también puede filtrar archivos *.jpgo *.pngcomo en su segundo comando.

Answer

Debe usar uniq -cpara obtener los recuentos y luego realizar una ordenación inversa al final para enumerar primero los duplicados. Al final awkse utiliza para filtrar líneas que comienzan con 2 o más.

$ find . -type f -exec sh -c 'basename ${0%.*}' {} \; | sort | uniq -c | sort -r | awk 'int($1)>=2'
   2 foo

Aquí, %.*quita la extensión, así foo.x.yse convierte foo.x.

En lugar de un simple find . -type f, que encontraría todos los archivos, también puede filtrar archivos *.jpgo *.pngcomo en su segundo comando.

Línea de comando OSX Buscar nombres de archivos duplicados con diferentes extensiones

Respuesta1

Respuesta2

Respuesta3

información relacionada