
Ich habe mehrere tausend Datensätze in einer Textdatei gespeichert, die ich in eine (JavaScript-basierte) Webseite eingeben muss, einen Datensatz nach dem anderen. Nachdem ich jeden Datensatz eingegeben habe, muss ich die zurückgegebenen Daten analysieren und dann zur Startseite zurückkehren. Das Problem besteht darin, dass die Webseite als Teil ihrer Anmeldesequenz ein Captcha verwendet (nur ein Captcha, dann bleibe ich angemeldet, bis es aufgrund von Inaktivität abläuft). Ich würde dies natürlich gerne per Skript ausführen können, aber aufgrund des Captchas kommt die Verwendung von Lynx wohl nicht in Frage. Das ist etwas, was ich mehrmals im Jahr machen werde, daher würde sich der anfängliche Aufwand meiner Meinung nach lohnen.
Kann ich das irgendwie machen? Ich bin sehr vertraut mit Perl und Shell-Skripting, wäre aber bereit, bei Bedarf eine andere Skriptsprache zu lernen. Die bevorzugte Plattform ist Windows, aber ich kann es natürlich auch unter Cygwin oder Linux für Windows ausführen (und wenn es unbedingt nötig ist, kann ich stattdessen einen Mac auftreiben).
Antwort1
Es gibt keine zuverlässige Möglichkeit, CAPTCHA ohne menschliche Hilfe und ohne OCR-Technik konsequent zu überwinden. Es scheint, als würden Sie versuchen, dies durch reines Glück zu erreichen. Betrachten Sie dies aus der Perspektive der Wahrscheinlichkeitsrechnung und Sie werden schnell erkennen, dass die Wahrscheinlichkeit nahezu unmöglich ist und noch geringer ist, sie konsequent zu reproduzieren.
Wenn Sie dies nur einmal tun möchten, dann angemeldet bleiben und menschliche Aktivitäten simulieren, ist dies realistisch. Schauen Sie in die BibliothekSelendas mit einer Reihe von Programmiersprachen verwendet werden kann. Ich denke, Sie können es in Perl tun, aber es wäre wahrscheinlich einfacher, es stattdessen in Python zu tun.