Сканировать HTML на наличие неиспользуемых ресурсов в папках

Сканировать HTML на наличие неиспользуемых ресурсов в папках

Я администрирую устаревший сайт и хотел бы удалить все неиспользуемые внешние файлы (.css, .jpg, .js и т. д.), которые в настоящее время находятся в различных папках по всему сайту.

Есть ли инструмент, который поможет мне их обнаружить и/или удалить?

решение1

Есть несколько утилит для скачивания целых сайтов. Запустите одну, перейдите по всем ссылкам на ваш сайт, но не на другие сайты. Все, что не попало в полученный архив, может быть удалено.

решение2

Моя первая мысль — написать скрипт, который сокращает необработанные файлы журналов за несколько месяцев, оставляя только часть URI, затем собирает список каталогов и, наконец, проходит по списку каталогов и выводит список всего, что не имеет соответствующего вида в сжатом файле журнала.

решение3

Несколько редакторов, таких как Dramweaver и Expression Web, имеют встроенные утилиты для обнаружения несвязанных файлов на сайте. Я не знаю никаких бесплатных инструментов, но я был бы удивлен, если бы их не было.

Связанный контент