
数千件のレコードがテキスト ファイルに保存されており、これを (JavaScript ベースの) Web ページに 1 件ずつ入力する必要があります。各レコードを入力した後、返されたデータを解析して、最初のページに戻る必要があります。問題は、Web ページがログイン シーケンスの一部として Captcha を使用していることです (Captcha は 1 つだけ、その後は非アクティブでタイムアウトするまでログインしたままになります)。もちろん、これをスクリプト化できればよいのですが、Captcha があるため、Lynx を使用するのは無理のようです。これは年に数回行うことになるので、最初の努力は価値があると思います。
これを実行する方法はありますか? Perl とシェル スクリプトには慣れていますが、必要なら別のスクリプト言語を学習するつもりです。推奨プラットフォームは Windows ですが、もちろん Cygwin または Windows 用の Linux でも実行できます (どうしても必要な場合は、代わりに Mac を探し出して使用することもできます)。
答え1
OCR が存在しない状態で、人間なしで CAPTCHA を一貫して破る確実な方法はありません。まったくの偶然でこれを実行しようとしているようです。確率の観点から考えれば、これはほぼ不可能な確率であり、一貫して再現するのはさらに困難であることにすぐに気づくでしょう。
これを一度だけ実行し、ログに記録したまま人間の活動をシミュレートするのであれば、これは現実的です。ライブラリを調べてください。セレンこれは、多くのプログラミング言語で使用できます。Perl でも実行できると思いますが、Python で実行する方がおそらく簡単でしょう。