Eu tenho essa string armazenada em uma variável
<li class="rainbow-list-item southern disrupted " data-line-id="lul-southern" data-severity-codes="4,6,9" data-mode="national-rail">
e gostaria de considerar apenas os valores numéricos dos códigos de gravidade dos dados. Lembre-se de que:
- Os valores numéricos são 1,2 ou 3 caracteres
- A alteração do comprimento do ID da linha de dados
Responder1
Você pode fazer assim:
$ MYVAR='<li class="rainbow-list-item southern disrupted " data-line-id="lul-southern" data-severity-codes="4,6,9" data-mode="national-rail">'
$ echo $MYVAR | tr ' ' '\n' | awk -F= '/data-severity-codes/ {print $2}'
"4,6,9"
Você também pode usar sed para remover " e substituir por um espaço em branco, se precisar:
$ echo $MYVAR | tr ' ' '\n' | awk -F= '/data-severity-codes/ {print $2}' | sed -e 's/"//g' -e 's/,/ /g'
4 6 9
Responder2
Você pode usar o operador correspondente =~
:
#! /bin/bash
var='<li class="rainbow-list-item southern disrupted " data-line-id="lul-southern" data-severity-codes="4,6,9" data-mode="national-rail">'
if [[ $var =~ data-severity-codes=\"([^\"]+)\" ]] ; then
echo ${BASH_REMATCH[1]}
fi
Saída:
4,6,9
Ou use uma ferramenta compatível com XML:
xmllint --xpath li/@data-severity-codes - <<< "$var</li>" \
| cut -f2 -d\"