Shell Script para extraer el valor de la etiqueta

Shell Script para extraer el valor de la etiqueta

Supongamos que tengo un archivo xml como se menciona a continuación y quiero extraer el nombre de la aplicación, la máquina y el valor de la etiqueta de estado usando comandos Unix y presentarlo en formato separado por comas.

Archivo XML: -

 <?xml version="1.0" encoding="UTF-8"?>
<applications>
<application name="Adapter/Code1">
<service name="Code1.par">
<deploymentStatus>Success</deploymentStatus>
<serviceInstance name="Code1-One">
    <machine>123</machine>
    <status>Running</status>
</serviceInstance>
<serviceInstance name="Code1-Two">
    <machine>456</machine>
    <status>Running</status>
</serviceInstance>
</service>
</application>
<application name="Adapter/Code2">
<service name="Code2.par">
<deploymentStatus>Success</deploymentStatus>
<serviceInstance name="Code2-One">
    <machine>123</machine>
    <status>Running</status>
</serviceInstance>
<serviceInstance name="Code2-Two">
    <machine>456</machine>
    <status>Running</status>
</serviceInstance>
</service>
</application>
</applications>

Producción:-

Adapter/Code1,123,Running

Adapter/Code1,456,Running

Adapter/Code2,123,Running

Adapter/Code2,456,Running

¿Pueden ayudarme a proporcionar un script Unixcommand/Shell para realizar esta actividad?

¡¡¡Gracias de antemano!!!

Respuesta1

PitónSolución 3.x (conxml.etree.ElementTreemódulo):

import xml.etree.ElementTree as ET

tree = ET.parse("test.xml")
root = tree.getroot()
for app in root.findall('application'):
    for m,s in zip(app.iter('machine'), app.iter('status')):
        print("%s,%s,%s" % (app.get('name'), m.text, s.text))

La salida:

Adapter/Code1,123,Running
Adapter/Code1,456,Running
Adapter/Code2,123,Running
Adapter/Code2,456,Running

https://docs.python.org/3.6/library/xml.etree.elementtree.html?highlight=etree#module-xml.etree.ElementTree


xmlestrella+awk(usado para agrupar nodos secundarios para cada applicationelemento) solución:

xmlstarlet sel -t -v "//application/@name| .//machine/text()| .//status/text()" -n input.xml 
 | awk '/Adapter/{app=$0; r=app; c=0; next}
   { if(++c==2){ c=0; print r","$0; r=app } else { r=r","$0 }}'

La salida:

Adapter/Code1,123,Running
Adapter/Code1,456,Running
Adapter/Code2,123,Running
Adapter/Code2,456,Running

  • "//application/@name| .//machine/text()| .//status/text()"- Expresión XPath para obtener los nodos necesarios.

  • /Adapter/{app=$0; r=app; c=0; next}- capturar cada applicationnombre para una mayor concatenación

http://xmlstar.sourceforge.net/doc/UG/xmlstarlet-ug.html

Respuesta2

InstalarXidely use xpath.

En mi opinión el mejor punto de vista es desde serviceInstance:

xidel f.xml -e '//serviceInstance/string-join((../../@name, machine, status),",")'
Adapter/Code1,123,Running
Adapter/Code1,456,Running
Adapter/Code2,123,Running
Adapter/Code2,456,Running

Respuesta3

Usando xmlstarletpara recorrer cada serviceInstancenodo:

xmlstarlet sel -t \
    -m '//application/service/serviceInstance' \
    -v '../../@name' -o , \
    -v 'machine' -o , \
    -v 'status' -nl \
    file.xml

Esto hace coincidir los serviceInstancenodos y, para cada uno de esos nodos, extrae el nameatributo de su nodo abuelo, el machinevalor del nodo y el statusvalor del nodo. Estos se generan con comas entre ellos ( -o ,) y una nueva línea al final ( -nl).

También puede obtener una salida CSV cotizada dexq (dehttps://kislyuk.github.io/yq/):

xq -r '
    .applications.application[] | ."@name" as $name |
    .service.serviceInstance[]  | [ $name, .machine, .status ] | @csv' file.xml

Respuesta4

Si tiene una buena razón para no usar herramientas xml, puede usar el análisis de bajo nivel, siempre y cuando su aplicación siga siendo trivial como su ejemplo:

sed 's/<application name="\([^"]*\)">/\1/
Ta
h
d
:a
/<machine>/!d
G
N
s_.*<machine>\(.*\)</machine>\n\(.*\)\n.*<status>\(.*\)</status>.*_\2,\1,\3_' yourfile.xml

información relacionada