ターミナルでウェブを閲覧する

ターミナルでウェブを閲覧する

端末の使い方を勉強して、AmazonやGoogleなどの一般的なWebサイトからデータを送受信してみたいと思います。

端末で Web サイトの検索バーに文字列を入力し、「クリック」して検索できるようにしたいです。Web ページを開く必要はなく、Web サイトに移動して自分でクエリを入力して Enter キーを押したかのように、Web サイトにデータを送信するだけです。

また、検索する前にチェックボックスを効果的に「チェック」し、ドロップダウン検索パラメータを切り替えることもしたいと考えています。

最終的には、いつでも実行して一部のアカウントにログインし、設定を自動的に切り替えることができるスクリプトのセットを用意する予定です。これは安全でしょうか? いずれにしても、Web サイトをナビゲートして検索結果を返す実験をしてみたいと思います。

これには、ページのソースを調べて、どのボックスをチェックしたか、またはどのオプションを切り替えたかを伝える方法、そして返された結果をどのように処理するかを決定することが含まれる可能性があります。

どのようなターミナルコマンドを知っておく必要がありますか? どのような方法を勉強する必要がありますか?

答え1

試すオオヤマネコがっかりすることはありませんよ :)

答え2

質問には 2 つの複雑な側面があります: 1. ページ ソースを取得する方法、2. 解析された HTML ページでカスタム データを編集する方法。

最初の質問は、wgetやなどのツールを使用すると比較的簡単に解決できますcurl(詳細については、それぞれのマニュアルを参照してください)。

2 番目の質問は少々些細なことで、データをどの程度広範囲に変更したいかによって異なります。オプションはフォームのソースを解析し、curl --dataオプションを通じて POST クエリを構築します。

一方、現在のウェブ技術では、JavaScriptの遅延読み込みなどを通じて、ブラウザウィンドウ上にオブジェクトを形成するための多くの簡単なテクニックが提供されている可能性があります。これには、セレンこれは、開発された Web ページのテストを自動化する人たちの間で非常に人気があります。

関連情報