Wie entferne ich nachstehende nichtalphabetische Zeichen aus jeder Zeile?

Wie entferne ich nachstehende nichtalphabetische Zeichen aus jeder Zeile?

Ich versuche, die letzten Zeichen außer den Alphabeten zu entfernen:

support.help1.com,,
support.help1.com.
support.help1.com9
support.help1.com*
support.help1.com@@
support.help1.com##
support.help1.com%%
support.help1.com^
support.help1.com
support.help1.com,
support.help1.com-

Ich möchte eine Ausgabe wie diese:

support.help1.com
support.help1.com
support.help1.com
support.help1.com
support.help1.com
support.help1.com
support.help1.com
support.help1.com
support.help1.com
support.help1.com
support.help1.com

Antwort1

sed kann auch helfen:

command | sed 's/[^a-Z]*$//g'

# create the example output
$ echo "support.help1.com,,
support.help1.com.
support.help1.com9
support.help1.com*
support.help1.com@@
support.help1.com##
support.help1.com%%
support.help1.com^
support.help1.com
support.help1.com,
support.help1.com-" > trailexample.txt

# now edit this stream
# something like $ command_output | sed

$ cat trailexample.txt | sed 's/[^a-Z]*$//g'
support.help1.com
support.help1.com
support.help1.com
support.help1.com
support.help1.com
support.help1.com
support.help1.com
support.help1.com
support.help1.com
support.help1.com
support.help1.com

# explanation
# sed (replace) 's/this/by-this/g' :: sed 's/[^a-Z]*$//g'
# s : substitution command, we want to substitute strings
# The 'this' [^a-Z]*$ : regexp pattern
#   ^ mean not
#   a-Z means all aLphBetiCaL chars
#   []* any number of what is in brackets
#   $ means end of line
# So the 'this' is 'any number of consecutive non-alphabetical chars before end of line'
# And the 'by-this' is empty, nothing, nada, void :: //
# g : global substitution command, means do the replacement for all occurrences

Antwort2

Wenn Sie Regex verwenden können, laden Sie einfach jeden Befehl und verwenden Sie den Regex unten (habe ihn vonHier):

^(http:\/\/www\.|https:\/\/www\.|http:\/\/|https:\/\/)?[a-z0-9]+([\-\.]{1}[a-z0-9]+)*\.[a-z]{2,5}(:[0-9]{1,5})?(\/.*)?$

Dieser reguläre Ausdruck akzeptiert URLs mit http/ https. Verwenden Sie ihn einfach, um zu bestätigen, ob Ihre URL gültig ist. Wenn nicht, laden Sie einfach die Zeichenfolge, indem Sie das letzte Zeichen entfernen. Sie können dies verwendenProblemumgehungdafür:

string="string.help1.com&&"
foo=string

while [ !regex(foo) ]; do
foo=${foo%?}
done
print foo

NB: regex(foo)ist nur die Funktion, die den String erhalten hat, kehrt zurück, Truewenn der reguläre Ausdruck in Ordnung ist, Falsein anderen Fällen

NB2: meine Syntax ist wahrscheinlich nicht korrekt, aber ich möchte Ihnen nur einen Tipp geben

Antwort3

Sie können hierfür einen Perl-Einzeiler verwenden:

perl -pne 's/[^a-zA-Z]*$/\n/g' input.txt

Dieser liest den Inhalt input.txtzeilenweise ein und ersetzt alle nicht alphabetischen Zeichen ( [^a-zA-Z]*$) am Ende einer Zeile durch ein Newline-Zeichen ( \n)

Antwort4

Es handelt sich um eine klassische Regex-Suche und Ersetzunghttps://regex101.com/r/gRiUTc/2

Über die Shell können Sie

<input sed -r 's/(\W+|[0-9]+)$//g'

verwandte Informationen