Ich bin gerade erst registriert und habe eine dumme Frage.
Warum zeigt Google keine Informationen von „Verlauf anzeigen“-Seiten auf Wikipedia an?
Zum Beispiel aufdiese Verlaufsseitewenn ich einen Text google,werde nicht bekommenErgebnis.
Danke.
Antwort1
Die Website-Engine fordert ausdrücklich, dass diese Seiten nicht indexiert werden. Die Verlaufsseite hat einen Header-Tag, der von Suchmaschinen erkannt wird:
<meta name="robots" content="noindex,nofollow"/>
( noindex
schließt den direkten Inhalt der Seite aus und nofollow
weist den Suchcrawler an, alle weiteren Links zu ignorierenausdiese Seite. Letzteres Attribut kann auch an einzelne <a>-Links angehängt werden.)
Ein möglicher Grund hierfür ist, dass Suchmaschinen möglicherweise nicht problemlos zwischen „aktuellen“ und „historischen“ Seiten unterscheiden können und die Ergebnisse daher möglicherweise mit veralteten Daten überflutet werden, die Sie nicht entfernen können.
Ein weiterer Grund ist, dass MediaWiki den Verlauf in einem deltakomprimierten Format speichert. Je älter ein Verlaufselement ist, desto mehr CPU-Leistung wird zum Dekomprimieren benötigt. (Soweit ich weiß, gibt es regelmäßige „vollständige“ Prüfpunkte, damit es nicht ins Unendliche geht, aber es handelt sich trotzdem um einen Ressourcenverbrauch ungleich Null.) Multipliziert man dies mit möglicherweise Hunderten oder Tausenden von Revisionen für jede einzelne Wiki-Seite, könnte der Crawler den Server schnell überlasten.
Abgesehen vom Abschnitt „Geschichte“ verwendet Wikipedia die /robots.txt
Datei auch, um bestimmte URLs von der Indexierung auszuschließen. Zum Beispiel:seine robots.txt-Dateischließt alle Threads zum Thema „Für Löschung stimmen“, Seiten mit Anfragen zur Änderung des Benutzernamens und dergleichen aus.