Escanee HTML en busca de activos no utilizados en carpetas

Escanee HTML en busca de activos no utilizados en carpetas

Administro un sitio web antiguo y me gustaría eliminar todos los archivos externos no utilizados (.css, .jpg, .js, etc.) que se encuentran actualmente en varias carpetas de todo el sitio.

¿Existe alguna herramienta que pueda ayudarme a identificarlos y/o eliminarlos?

Respuesta1

Existen varias utilidades para descargar sitios web completos. Ejecute uno, siga todos los enlaces a su sitio, pero no a ningún otro sitio. Todo lo que no esté en el archivo resultante podría eliminarse.

Respuesta2

Mi primer pensamiento es escribir un script que reduzca algunos meses de archivos de registro sin procesar a solo la parte URI de ellos, luego recopile una lista de directorios y finalmente recorra la lista de directorios y enumere todo lo que no tiene una lista correspondiente. aparición en el archivo de registro condensado.

Respuesta3

Varios editores como Dramweaver y Expression Web tienen utilidades integradas para detectar archivos no vinculados en el sitio. No conozco ninguna herramienta gratuita, pero me sorprendería que no la hubiera.

información relacionada