
Buscamos generar una lista de archivos que no han sido accedidos a nuestro servidor web durante los últimos 3 meses, 6 meses y año.
IIS puede darnos una lista de archivos que han sido afectados, pero me pregunto si existe una herramienta que genere una lista de archivos en el directorio de nuestro servidor web que no aparecen en los archivos de registro.
Respuesta1
Me temo que no existe una solución sencilla. Supongo que tendrás que comparar tus registros con tu lista de archivos (estáticos, supongo). La mejor manera que se me ocurre es utilizar elLogParserherramienta.
Puede importar sus registros a una base de datos SQL y crear una tabla que contenga todas las URL (seleccione distintas...). Luego tendrás que crear la lista de nombres de archivos en tus directorios usando un script e importando el archivo resultante a otra tabla de base de datos. El paso 3 sería seleccionar todos los nombres de archivos de la Tabla 2 que no tengan contrapartida en la primera tabla.
Respuesta2
Splattne tiene la respuesta que iba a publicar. Simplemente agregaría que la OTRA forma de hacer las cosas es hacer lo siguiente:
Cambie el nombre de cualquier archivo que sospeche que no está en uso con un prefijo "X_". Por ejemplo, cambie el nombre de sospechoso.htm a "x_suspect.htm".
Cuide sus registros 404 COMO UN HALCÓN. Usamos grep para analizar todos los 404 y buscar archivos "muertos" que en realidad no estaban muertos. Vuelva a colocarlos (o arregle el enlace) si es necesario.
Este no es mi método FAVORITO para hacer cosas (es decir, mostrarle a un cliente un 404), pero ayuda a confirmar si el archivo está en uso o no.
Espero que esto ayude.
Respuesta3
El detective de enlaces de Xenuhará una verificación de archivos huérfanos si le da acceso FTP a su sitio web.
Respuesta4
Esta sería una tarea difícil de realizar de manera genérica, por lo que creo que es poco probable que encuentre una solución estándar. Si bien puede obtener una lista de archivos a los que se accede desde los registros y compararla con la lista de archivos en los directorios relevantes, luego debe tener en cuenta los archivos a los que accede:
server.transfer
server.execute
#include
<script>
etiquetas del lado del servidor- probablemente una serie de otras cosas: la lista anterior son solo las obvias que me vienen a la mente para el ASP "clásico".
Etcétera. Para algunas aplicaciones puede habermuchosarchivo que utilizan los scripts pero que no se ven en los registros del servidor web debido a la forma en que se hace referencia a ellos.