nginx – Ist das ein schlechter Bot?

Question 1

Soweit ich das beurteilen kann, gibt es in diesen Zeilen keinen Grund zur Sorge. Es ist nicht ungewöhnlich, dass Bots Ihre Website besuchen und jede Minute nach Verzeichnissen crawlen. Sehen Sie sich "/etc/fail2ban/filter.d/botsearch-common.conf" und "/etc/fail2ban/filter.d/nginx-botsearch.conf" an, um zu sehen, wie fail2ban versucht, das crawlen Ihrer Website durch Badbots zu verhindern. Sie können auch versuchen, Bots per User-Agent zu blockieren. Dies könnte ein Ansatz sein, der verwendet werden könnte:https://gist.github.com/hans2103/733b8eef30e89c759335017863bd721d

Aber ich rate Ihnen, Bots einfach zu ignorieren. Wenn Ihre Konfigurationen sauber sind, müssen Sie sich darüber keine großen Gedanken machen.

Answer

Soweit ich das beurteilen kann, gibt es in diesen Zeilen keinen Grund zur Sorge. Es ist nicht ungewöhnlich, dass Bots Ihre Website besuchen und jede Minute nach Verzeichnissen crawlen. Sehen Sie sich "/etc/fail2ban/filter.d/botsearch-common.conf" und "/etc/fail2ban/filter.d/nginx-botsearch.conf" an, um zu sehen, wie fail2ban versucht, das crawlen Ihrer Website durch Badbots zu verhindern. Sie können auch versuchen, Bots per User-Agent zu blockieren. Dies könnte ein Ansatz sein, der verwendet werden könnte:https://gist.github.com/hans2103/733b8eef30e89c759335017863bd721d

Aber ich rate Ihnen, Bots einfach zu ignorieren. Wenn Ihre Konfigurationen sauber sind, müssen Sie sich darüber keine großen Gedanken machen.

Question 2

Ein einfaches GET„of“ /wird den ganzen Tag über jeden Tag passieren – zusammen mit viel anderem von Bots generiertem Datenverkehr. Es macht fast keinen Sinn, Ressourcen zu verschwenden, um etwas dagegen zu unternehmen, wenn Sie einen Webserver betreiben, auf den öffentlich zugegriffen werden kann. Dafür ist er buchstäblich da. Die Tatsache, dass auf einige mit geantwortet wird, 301deutet darauf hin, dass Sie virtuelle Hosts verwenden und dass die Anforderung ohne gültigen Header eingegangen ist Hostund dass Ihr Nginx-Setup sie auf Ihren standardmäßigen virtuellen Host umleitet.

Der Grund fail2bandafür, dass nichts unternommen wird, ist, dass der Datenverkehr, den es sieht, nicht als bösartig erkannt wurde. Standardmäßig wird nach Skriptscannern, Brute-Forces-Angriffen auf HTTP-Authentifizierung und anderen bösartigen Mustern Ausschau gehalten.

Answer

Ein einfaches GET„of“ /wird den ganzen Tag über jeden Tag passieren – zusammen mit viel anderem von Bots generiertem Datenverkehr. Es macht fast keinen Sinn, Ressourcen zu verschwenden, um etwas dagegen zu unternehmen, wenn Sie einen Webserver betreiben, auf den öffentlich zugegriffen werden kann. Dafür ist er buchstäblich da. Die Tatsache, dass auf einige mit geantwortet wird, 301deutet darauf hin, dass Sie virtuelle Hosts verwenden und dass die Anforderung ohne gültigen Header eingegangen ist Hostund dass Ihr Nginx-Setup sie auf Ihren standardmäßigen virtuellen Host umleitet.

Der Grund fail2bandafür, dass nichts unternommen wird, ist, dass der Datenverkehr, den es sieht, nicht als bösartig erkannt wurde. Standardmäßig wird nach Skriptscannern, Brute-Forces-Angriffen auf HTTP-Authentifizierung und anderen bösartigen Mustern Ausschau gehalten.

Question 3

Sie können diesen Code einfach am Anfang Ihres Nginx-Codes vor dem Server-Tag hinzufügen, um die gängigsten Bots für Ihre Website zu ignorieren.

map $http_user_agent $limit_bots {
     default 0;
     ~*(google|bing|yandex|msnbot) 1;
     ~*(AltaVista|Googlebot|Slurp|BlackWidow|Bot|ChinaClaw|Custo|DISCo|Download|Demon|eCatch|EirGrabber|EmailSiphon|EmailWolf|SuperHTTP|Surfbot|WebWhacker) 1;
     ~*(Express|WebPictures|ExtractorPro|EyeNetIE|FlashGet|GetRight|GetWeb!|Go!Zilla|Go-Ahead-Got-It|GrabNet|Grafula|HMView|Go!Zilla|Go-Ahead-Got-It) 1;
     ~*(rafula|HMView|HTTrack|Stripper|Sucker|Indy|InterGET|Ninja|JetCar|Spider|larbin|LeechFTP|Downloader|tool|Navroad|NearSite|NetAnts|tAkeOut|WWWOFFLE) 1;
     ~*(GrabNet|NetSpider|Vampire|NetZIP|Octopus|Offline|PageGrabber|Foto|pavuk|pcBrowser|RealDownload|ReGet|SiteSnagger|SmartDownload|SuperBot|WebSpider) 1;
     ~*(Teleport|VoidEYE|Collector|WebAuto|WebCopier|WebFetch|WebGo|WebLeacher|WebReaper|WebSauger|eXtractor|Quester|WebStripper|WebZIP|Wget|Widow|Zeus) 1;
     ~*(Twengabot|htmlparser|libwww|Python|perl|urllib|scan|Curl|email|PycURL|Pyth|PyQ|WebCollector|WebCopy|webcraw) 1;
 }

Und dies zu Ihrem / Standort

    location / {
            ...........
            if ($limit_bots = 1) {
                    return 403;
            }
    }

Answer

Sie können diesen Code einfach am Anfang Ihres Nginx-Codes vor dem Server-Tag hinzufügen, um die gängigsten Bots für Ihre Website zu ignorieren.

map $http_user_agent $limit_bots {
     default 0;
     ~*(google|bing|yandex|msnbot) 1;
     ~*(AltaVista|Googlebot|Slurp|BlackWidow|Bot|ChinaClaw|Custo|DISCo|Download|Demon|eCatch|EirGrabber|EmailSiphon|EmailWolf|SuperHTTP|Surfbot|WebWhacker) 1;
     ~*(Express|WebPictures|ExtractorPro|EyeNetIE|FlashGet|GetRight|GetWeb!|Go!Zilla|Go-Ahead-Got-It|GrabNet|Grafula|HMView|Go!Zilla|Go-Ahead-Got-It) 1;
     ~*(rafula|HMView|HTTrack|Stripper|Sucker|Indy|InterGET|Ninja|JetCar|Spider|larbin|LeechFTP|Downloader|tool|Navroad|NearSite|NetAnts|tAkeOut|WWWOFFLE) 1;
     ~*(GrabNet|NetSpider|Vampire|NetZIP|Octopus|Offline|PageGrabber|Foto|pavuk|pcBrowser|RealDownload|ReGet|SiteSnagger|SmartDownload|SuperBot|WebSpider) 1;
     ~*(Teleport|VoidEYE|Collector|WebAuto|WebCopier|WebFetch|WebGo|WebLeacher|WebReaper|WebSauger|eXtractor|Quester|WebStripper|WebZIP|Wget|Widow|Zeus) 1;
     ~*(Twengabot|htmlparser|libwww|Python|perl|urllib|scan|Curl|email|PycURL|Pyth|PyQ|WebCollector|WebCopy|webcraw) 1;
 }

Und dies zu Ihrem / Standort

    location / {
            ...........
            if ($limit_bots = 1) {
                    return 403;
            }
    }

nginx – Ist das ein schlechter Bot?

Antwort1

Antwort2

Antwort3

verwandte Informationen