BASH obtém valor da string

BASH obtém valor da string

Eu tenho essa string armazenada em uma variável

<li class="rainbow-list-item southern disrupted " data-line-id="lul-southern" data-severity-codes="4,6,9" data-mode="national-rail">

e gostaria de considerar apenas os valores numéricos dos códigos de gravidade dos dados. Lembre-se de que:

  1. Os valores numéricos são 1,2 ou 3 caracteres
  2. A alteração do comprimento do ID da linha de dados

Responder1

Você pode fazer assim:

$ MYVAR='<li class="rainbow-list-item southern disrupted " data-line-id="lul-southern" data-severity-codes="4,6,9" data-mode="national-rail">'
$ echo $MYVAR | tr ' ' '\n' | awk -F= '/data-severity-codes/ {print $2}'
"4,6,9"

Você também pode usar sed para remover " e substituir por um espaço em branco, se precisar:

$ echo $MYVAR | tr ' ' '\n' | awk -F= '/data-severity-codes/ {print $2}' | sed -e 's/"//g' -e 's/,/ /g'
4 6 9

Responder2

Você pode usar o operador correspondente =~:

#! /bin/bash
var='<li class="rainbow-list-item southern disrupted " data-line-id="lul-southern" data-severity-codes="4,6,9" data-mode="national-rail">'

if [[ $var =~ data-severity-codes=\"([^\"]+)\" ]] ; then
    echo ${BASH_REMATCH[1]}
fi

Saída:

4,6,9

Ou use uma ferramenta compatível com XML:

xmllint --xpath li/@data-severity-codes - <<< "$var</li>" \
| cut -f2 -d\"

informação relacionada