HTMLファイルから選択したタグを取得する

Question 1

grepとそれにのみ一致するパラメータ ( )を使用できます-o。例:

$ grep -o "<[^>]*>" <(curl -s http://example.com/)

これにより、注文を含むすべての HTML タグが印刷されます。

タグのみを含めるには<script>、次を試してください (index.htmlファイルに合わせて変更してください):

$ grep -Eo "<script.*(</script>|>)" index.html

ファイル名だけを取得するには (src属性から)、別のを追加して拡張できますgrep。例:

$ grep -Eo "<script.*(</script>|>)" index.html | grep -o '"[^"]*"' | tr -d '"'

上記の構文は、HTMLコードのさまざまなバリエーションには役立ちません。そのため、より複雑なソリューションについては、正規表現を使用してHTMLを解析する一般的には推奨されていないため、適切なツール（好みの言語またはこれらをチェックしてください）を使用する必要があります。シェルツール）。

Answer

grepとそれにのみ一致するパラメータ ( )を使用できます-o。例:

$ grep -o "<[^>]*>" <(curl -s http://example.com/)

これにより、注文を含むすべての HTML タグが印刷されます。

タグのみを含めるには<script>、次を試してください (index.htmlファイルに合わせて変更してください):

$ grep -Eo "<script.*(</script>|>)" index.html

ファイル名だけを取得するには (src属性から)、別のを追加して拡張できますgrep。例:

$ grep -Eo "<script.*(</script>|>)" index.html | grep -o '"[^"]*"' | tr -d '"'

上記の構文は、HTMLコードのさまざまなバリエーションには役立ちません。そのため、より複雑なソリューションについては、正規表現を使用してHTMLを解析する一般的には推奨されていないため、適切なツール（好みの言語またはこれらをチェックしてください）を使用する必要があります。シェルツール）。

Question 2

すでに回答をいただいていると思いますが、xpath。

これは特に XML スタイルのデータを対象としています。

あなたの場合、このXPathは次のようになります

//script

こここれは、XPathを使用してHTMLを解析する別の例でもある。

Answer

すでに回答をいただいていると思いますが、xpath。

これは特に XML スタイルのデータを対象としています。

あなたの場合、このXPathは次のようになります

//script

こここれは、XPathを使用してHTMLを解析する別の例でもある。

関連情報