XMLから値を抽出する

Question 1

XML を解析するために正規表現を使用しないでください。XML 対応ツールを使用します。例xmllint:

xmllint --xpath 'string(/results/testsuites/testcase/@time)' file.xml

Answer

XML を解析するために正規表現を使用しないでください。XML 対応ツールを使用します。例xmllint:

xmllint --xpath 'string(/results/testsuites/testcase/@time)' file.xml

Question 2

とXMLスターレット:

$ xmlstarlet sel -t -v '//testcase/@time' -nl data.xml
20.3817

Answer

とXMLスターレット:

$ xmlstarlet sel -t -v '//testcase/@time' -nl data.xml
20.3817

Question 3

lxprintf を使用します:

lxprintf -e "%s\n" total_time/@value test.xml

Answer

lxprintf を使用します:

lxprintf -e "%s\n" total_time/@value test.xml

Question 4

XML対応ツールを使うほうがはるかに良いでしょう

本当に属性の値を抽出するだけの単純なケースであれば、timeを使うことができますsed。ここでのほとんどの回答からわかるように、より良いアプローチはXMLを理解するツールを使うことですが、本当に単純なケースでは逃げ切れるかもしれないを使用しますsed。

xml='<results><testsuites><testcase name="XXXX (XXXXX)" time="20.3817"><result>success</result></testcase><total_time value="20.3830" /></testsuites></results>'
echo "$xml" | sed -nr 's/.* time="([0-9.]+).*/\1/p'    # GNU
28.3817
echo "$xml" | sed -n 's/.* time="\([0-9.]*\).*/\1/p'   # Non-GNU
28.3817

またはgrep

echo "$xml" | grep -Po '(?<=time=")([0-9.]+)'          # GNU
20.3817

しかし私はXML対応のものを好む。xmlstarletは、timeの属性として認識できます<testcase>。

Answer

XML対応ツールを使うほうがはるかに良いでしょう

本当に属性の値を抽出するだけの単純なケースであれば、timeを使うことができますsed。ここでのほとんどの回答からわかるように、より良いアプローチはXMLを理解するツールを使うことですが、本当に単純なケースでは逃げ切れるかもしれないを使用しますsed。

xml='<results><testsuites><testcase name="XXXX (XXXXX)" time="20.3817"><result>success</result></testcase><total_time value="20.3830" /></testsuites></results>'
echo "$xml" | sed -nr 's/.* time="([0-9.]+).*/\1/p'    # GNU
28.3817
echo "$xml" | sed -n 's/.* time="\([0-9.]*\).*/\1/p'   # Non-GNU
28.3817

またはgrep

echo "$xml" | grep -Po '(?<=time=")([0-9.]+)'          # GNU
20.3817

しかし私はXML対応のものを好む。xmlstarletは、timeの属性として認識できます<testcase>。

XMLから値を抽出する

答え1

答え2

答え3

答え4

関連情報