Como removo caracteres não alfabéticos finais de cada linha?

Como removo caracteres não alfabéticos finais de cada linha?

Estou tentando remover os últimos caracteres, exceto alfabetos:

support.help1.com,,
support.help1.com.
support.help1.com9
support.help1.com*
support.help1.com@@
support.help1.com##
support.help1.com%%
support.help1.com^
support.help1.com
support.help1.com,
support.help1.com-

Quero minha saída assim:

support.help1.com
support.help1.com
support.help1.com
support.help1.com
support.help1.com
support.help1.com
support.help1.com
support.help1.com
support.help1.com
support.help1.com
support.help1.com

Responder1

sed também pode ajudar:

command | sed 's/[^a-Z]*$//g'

# create the example output
$ echo "support.help1.com,,
support.help1.com.
support.help1.com9
support.help1.com*
support.help1.com@@
support.help1.com##
support.help1.com%%
support.help1.com^
support.help1.com
support.help1.com,
support.help1.com-" > trailexample.txt

# now edit this stream
# something like $ command_output | sed

$ cat trailexample.txt | sed 's/[^a-Z]*$//g'
support.help1.com
support.help1.com
support.help1.com
support.help1.com
support.help1.com
support.help1.com
support.help1.com
support.help1.com
support.help1.com
support.help1.com
support.help1.com

# explanation
# sed (replace) 's/this/by-this/g' :: sed 's/[^a-Z]*$//g'
# s : substitution command, we want to substitute strings
# The 'this' [^a-Z]*$ : regexp pattern
#   ^ mean not
#   a-Z means all aLphBetiCaL chars
#   []* any number of what is in brackets
#   $ means end of line
# So the 'this' is 'any number of consecutive non-alphabetical chars before end of line'
# And the 'by-this' is empty, nothing, nada, void :: //
# g : global substitution command, means do the replacement for all occurrences

Responder2

Se você pode usar regex, basta carregar cada comando e usar o regex abaixo (obtido emaqui):

^(http:\/\/www\.|https:\/\/www\.|http:\/\/|https:\/\/)?[a-z0-9]+([\-\.]{1}[a-z0-9]+)*\.[a-z]{2,5}(:[0-9]{1,5})?(\/.*)?$

Este regex aceita URL com http/ https. Basta usá-lo para confirmar se sua URL é válida, caso contrário, basta carregar a string removendo o último caractere. Você pode usar issoGambiarrapor isso:

string="string.help1.com&&"
foo=string

while [ !regex(foo) ]; do
foo=${foo%?}
done
print foo

Obs: regex(foo)é só a função que pegou a string, retorna Truese a regex estiver boa, Falsenos demais casos

NB2: minha sintaxe provavelmente não está correta, mas é só para dar uma dica

Responder3

Você pode usar um perl one-liner para isso:

perl -pne 's/[^a-zA-Z]*$/\n/g' input.txt

Isso lê o conteúdo de input.txtlinha e substitui todos os caracteres não alfabéticos ( [^a-zA-Z]*$) no final de uma linha por uma nova linha ( \n)

Responder4

É uma pesquisa e substituição clássica de regexhttps://regex101.com/r/gRiUTc/2

Via shell você poderia usar

<input sed -r 's/(\W+|[0-9]+)$//g'

informação relacionada