Скрипт оболочки для извлечения значения тега

Question 1

Питон3.x решение (сxml.etree.ElementTreeмодуль):

import xml.etree.ElementTree as ET

tree = ET.parse("test.xml")
root = tree.getroot()
for app in root.findall('application'):
    for m,s in zip(app.iter('machine'), app.iter('status')):
        print("%s,%s,%s" % (app.get('name'), m.text, s.text))

Выход:

Adapter/Code1,123,Running
Adapter/Code1,456,Running
Adapter/Code2,123,Running
Adapter/Code2,456,Running

https://docs.python.org/3.6/library/xml.etree.elementtree.html?highlight=etree#module-xml.etree.ElementTree

xmlstarlet+awk(используется для группировки дочерних узлов для каждого applicationэлемента) решение:

xmlstarlet sel -t -v "//application/@name| .//machine/text()| .//status/text()" -n input.xml 
 | awk '/Adapter/{app=$0; r=app; c=0; next}
   { if(++c==2){ c=0; print r","$0; r=app } else { r=r","$0 }}'

Выход:

Adapter/Code1,123,Running
Adapter/Code1,456,Running
Adapter/Code2,123,Running
Adapter/Code2,456,Running

"//application/@name| .//machine/text()| .//status/text()"- Выражение XPath для получения необходимых узлов
/Adapter/{app=$0; r=app; c=0; next}- захват каждого applicationимени для дальнейшей конкатенации

http://xmlstar.sourceforge.net/doc/UG/xmlstarlet-ug.html

Answer

Питон3.x решение (сxml.etree.ElementTreeмодуль):

import xml.etree.ElementTree as ET

tree = ET.parse("test.xml")
root = tree.getroot()
for app in root.findall('application'):
    for m,s in zip(app.iter('machine'), app.iter('status')):
        print("%s,%s,%s" % (app.get('name'), m.text, s.text))

Выход:

Adapter/Code1,123,Running
Adapter/Code1,456,Running
Adapter/Code2,123,Running
Adapter/Code2,456,Running

https://docs.python.org/3.6/library/xml.etree.elementtree.html?highlight=etree#module-xml.etree.ElementTree

xmlstarlet+awk(используется для группировки дочерних узлов для каждого applicationэлемента) решение:

xmlstarlet sel -t -v "//application/@name| .//machine/text()| .//status/text()" -n input.xml 
 | awk '/Adapter/{app=$0; r=app; c=0; next}
   { if(++c==2){ c=0; print r","$0; r=app } else { r=r","$0 }}'

Выход:

Adapter/Code1,123,Running
Adapter/Code1,456,Running
Adapter/Code2,123,Running
Adapter/Code2,456,Running

"//application/@name| .//machine/text()| .//status/text()"- Выражение XPath для получения необходимых узлов
/Adapter/{app=$0; r=app; c=0; next}- захват каждого applicationимени для дальнейшей конкатенации

http://xmlstar.sourceforge.net/doc/UG/xmlstarlet-ug.html

Question 2

Установитьксидельи используйте xpath.

По моему мнению, лучшая точка зрения такова serviceInstance:

xidel f.xml -e '//serviceInstance/string-join((../../@name, machine, status),",")'

Adapter/Code1,123,Running
Adapter/Code1,456,Running
Adapter/Code2,123,Running
Adapter/Code2,456,Running

Answer

Установитьксидельи используйте xpath.

По моему мнению, лучшая точка зрения такова serviceInstance:

xidel f.xml -e '//serviceInstance/string-join((../../@name, machine, status),",")'

Adapter/Code1,123,Running
Adapter/Code1,456,Running
Adapter/Code2,123,Running
Adapter/Code2,456,Running

Question 3

xmlstarletДля обхода каждого узла используется serviceInstance:

xmlstarlet sel -t \
    -m '//application/service/serviceInstance' \
    -v '../../@name' -o , \
    -v 'machine' -o , \
    -v 'status' -nl \
    file.xml

Это сопоставляет serviceInstanceузлы, и для каждого такого узла он извлекает nameатрибут его прародительского узла, machineзначение узла и statusзначение узла. Они выводятся с запятыми между ними ( -o ,) и новой строкой в конце ( -nl).

Вы также можете получить цитируемый CSV-вывод из xq(изhttps://kislyuk.github.io/yq/):

xq -r '
    .applications.application[] | ."@name" as $name |
    .service.serviceInstance[]  | [ $name, .machine, .status ] | @csv' file.xml

Answer

xmlstarletДля обхода каждого узла используется serviceInstance:

xmlstarlet sel -t \
    -m '//application/service/serviceInstance' \
    -v '../../@name' -o , \
    -v 'machine' -o , \
    -v 'status' -nl \
    file.xml

Это сопоставляет serviceInstanceузлы, и для каждого такого узла он извлекает nameатрибут его прародительского узла, machineзначение узла и statusзначение узла. Они выводятся с запятыми между ними ( -o ,) и новой строкой в конце ( -nl).

Вы также можете получить цитируемый CSV-вывод из xq(изhttps://kislyuk.github.io/yq/):

xq -r '
    .applications.application[] | ."@name" as $name |
    .service.serviceInstance[]  | [ $name, .machine, .status ] | @csv' file.xml

Question 4

Если у вас есть веские причины не использовать инструменты XML, вы можете использовать низкоуровневый синтаксический анализ, при условии, что ваше приложение останется таким же тривиальным, как ваш пример:

sed 's/<application name="\([^"]*\)">/\1/
Ta
h
d
:a
/<machine>/!d
G
N
s_.*<machine>\(.*\)</machine>\n\(.*\)\n.*<status>\(.*\)</status>.*_\2,\1,\3_' yourfile.xml

Answer

Если у вас есть веские причины не использовать инструменты XML, вы можете использовать низкоуровневый синтаксический анализ, при условии, что ваше приложение останется таким же тривиальным, как ваш пример:

sed 's/<application name="\([^"]*\)">/\1/
Ta
h
d
:a
/<machine>/!d
G
N
s_.*<machine>\(.*\)</machine>\n\(.*\)\n.*<status>\(.*\)</status>.*_\2,\1,\3_' yourfile.xml

Скрипт оболочки для извлечения значения тега

решение1

решение2

решение3

решение4

Связанный контент