
Wir möchten eine Liste der Dateien erstellen, die in den letzten 3 Monaten, 6 Monaten und im letzten Jahr auf unserem Webserver nicht aufgerufen wurden.
IIS kann uns eine Liste der betroffenen Dateien geben, aber ich frage mich, ob es ein Tool gibt, das eine Liste der Dateien in unserem Webserver-Verzeichnis generiert, die nicht in den Protokolldateien erscheinen.
Antwort1
Ich fürchte, es gibt keine einfache Lösung. Ich schätze, Sie müssen Ihre Protokolle mit Ihrer Liste (ich nehme an, statischer) Dateien vergleichen. Der beste Weg, der mir einfällt, ist die Verwendung vonLogParserWerkzeug.
Sie könnten Ihre Protokolle in eine SQL-Datenbank importieren und eine Tabelle mit allen URLs erstellen (unterschiedliche auswählen ...). Anschließend müssen Sie mithilfe eines Skripts die Liste der Dateinamen in Ihren Verzeichnissen erstellen und die resultierende Datei in eine andere Datenbanktabelle importieren. Schritt 3 wäre, alle Dateinamen aus Tabelle 2 auszuwählen, die kein Gegenstück in der ersten Tabelle haben.
Antwort2
Splattne hat die Antwort, die ich posten wollte. Ich möchte nur hinzufügen, dass die ANDERE Möglichkeit, die Dinge anzugehen, darin besteht, Folgendes zu tun:
Benennen Sie alle Dateien, von denen Sie vermuten, dass sie nicht verwendet werden, mit dem Präfix „X_“. Benennen Sie beispielsweise suspect.htm in „x_suspect.htm“ um.
Beobachten Sie Ihre 404-Protokolle GENAU. Wir haben grep verwendet, um alle 404-Meldungen auszuwerten und nach „toten“ Dateien zu suchen, die nicht wirklich tot waren. Setzen Sie sie bei Bedarf zurück (oder reparieren Sie den Link).
Das ist nicht meine LIEBLINGSMETHODE (z. B. einem Kunden eine 404-Fehlermeldung anzuzeigen), aber sie hilft bei der Bestätigung, ob die Datei verwendet wird oder nicht.
Hoffe das hilft.
Antwort3
Xenus Link-Detektivführt eine Prüfung auf verwaiste Dateien durch, wenn Sie ihm FTP-Zugriff auf Ihre Website gewähren.
Antwort4
Dies wäre eine schwierige Aufgabe, die man allgemein lösen könnte, daher glaube ich nicht, dass Sie eine Standardlösung finden werden. Sie können zwar eine Liste der aus den Protokollen aufgerufenen Dateien abrufen und diese mit der Liste der Dateien in den entsprechenden Verzeichnissen vergleichen, müssen dann aber alle Dateien berücksichtigen, auf die zugegriffen wird von:
server.transfer
server.execute
#include
- Serverseitige
<script>
Tags - wahrscheinlich noch eine Reihe anderer Dinge – die obige Liste enthält nur die offensichtlichen Dinge, die mir zum Thema „klassisches“ ASP in den Sinn kommen.
und so weiter. Für einige Apps kann esvieleDateien, die von den Skripten verwendet werden, aufgrund der Art und Weise, wie auf sie verwiesen wird, jedoch nicht in den Webserver-Protokollen angezeigt werden.