Tengo esta cadena almacenada en una variable.
<li class="rainbow-list-item southern disrupted " data-line-id="lul-southern" data-severity-codes="4,6,9" data-mode="national-rail">
y me gustaría tomar solo los valores numéricos para los códigos de gravedad de los datos. Tenga en cuenta que:
- Los valores numéricos son de 1,2 o 3 caracteres.
- El cambio de longitud de ID de línea de datos
Respuesta1
Puedes hacerlo así:
$ MYVAR='<li class="rainbow-list-item southern disrupted " data-line-id="lul-southern" data-severity-codes="4,6,9" data-mode="national-rail">'
$ echo $MYVAR | tr ' ' '\n' | awk -F= '/data-severity-codes/ {print $2}'
"4,6,9"
También puedes usar sed para eliminar " y reemplazarlo por un espacio en blanco si lo necesitas:
$ echo $MYVAR | tr ' ' '\n' | awk -F= '/data-severity-codes/ {print $2}' | sed -e 's/"//g' -e 's/,/ /g'
4 6 9
Respuesta2
Puedes utilizar el operador coincidente =~
:
#! /bin/bash
var='<li class="rainbow-list-item southern disrupted " data-line-id="lul-southern" data-severity-codes="4,6,9" data-mode="national-rail">'
if [[ $var =~ data-severity-codes=\"([^\"]+)\" ]] ; then
echo ${BASH_REMATCH[1]}
fi
Producción:
4,6,9
O utilice una herramienta compatible con XML:
xmllint --xpath li/@data-severity-codes - <<< "$var</li>" \
| cut -f2 -d\"