Como posso criar um script de entrada de dados em um site com captcha?

Como posso criar um script de entrada de dados em um site com captcha?

Tenho vários milhares de registros armazenados em um arquivo de texto que preciso inserir em uma página da Web (baseada em JavaScript), um registro por vez. Depois de inserir cada registro preciso analisar os dados retornados e depois voltar para a página inicial. O problema é que a página da web usa um Captcha como parte de sua sequência de login (apenas um Captcha, então permanecerei logado até expirar devido à inatividade). Obviamente, eu gostaria de poder criar um script para isso, mas devido ao Captcha, parece que usar o Lynx está fora de questão. É algo que farei várias vezes por ano, então, na IMO, o esforço inicial valeria a pena.

De alguma forma eu posso fazer isso? Estou muito confortável com Perl e scripts de shell, mas estaria disposto a aprender outra linguagem de script, se necessário. A plataforma preferida é o Windows, mas é claro que posso executá-lo no Cygwin ou Linux para Windows (e, se for absolutamente necessário, posso encontrar um Mac para usar).

Responder1

Não há maneira confiável de vencer o CAPTCHA sem humanos de forma consistente e sem a presença de um OCR. Parece que você está tentando fazer isso por puro acaso. Pense nisso de um ponto de vista probabilístico e você logo perceberá que essas probabilidades são quase impossíveis e ainda piores de serem replicadas de forma consistente.

Se você está tentando fazer isso apenas uma vez, mantenha-se registrado e simule a atividade humana, então isso é realista. Olhe para a bibliotecaSelênioque pode ser usado com várias linguagens de programação. Acho que você pode fazer isso em Perl, mas provavelmente seria mais fácil fazer em Python.

informação relacionada