Wie schreibe ich einen regulären Ausdruck, der einem bestimmten Wort entspricht?

Question 1

Ich empfehle, ein Lesezeichen fürKurzreferenz für reguläre Ausdrücke von MSDN

Sie möchten eine Groß-/Kleinschreibungsunabhängige Übereinstimmung für das Wort „Rocket“ erreichen, das von nicht-alphanumerischen Zeichen umgeben ist. Ein regulärer Ausdruck, der funktionieren würde, wäre:

\W*((?i)rocket(?-i))\W*

Es wird nach null oder mehr (*) nicht alphanumerischen (\W) Zeichen gesucht, gefolgt von einer Groß-/Kleinschreibungsunabhängigen Version von Rakete ( (?i)rocket(?-i) ), gefolgt wiederum von null oder mehr (*) nicht alphanumerischen Zeichen (\W). Die zusätzlichen Klammern um den mit Rakete übereinstimmenden Begriff ordnen die Übereinstimmung einer separaten Gruppe zu. Das Wort Rakete befindet sich somit in Übereinstimmungsgruppe 1.

UPDATE 1: Matt sagte in dem Kommentar, dass dieser reguläre Ausdruck in Python verwendet werden soll. Python hat eine etwas andere Syntax. Um in Python dasselbe Ergebnis zu erzielen, verwenden Sie diesen regulären Ausdruck und übergeben Sie die re.IGNORECASEOption an die Funktion compile„oder“ match.

\W*(rocket)\W*

AnRegex101Dies kann simuliert werden, indem Sie „i“ in das Textfeld neben der Regex-Eingabe eingeben.

AKTUALISIERUNG 2Ismael hat erwähnt, dass der reguläre Ausdruck nicht ganz korrekt ist, da er möglicherweise auf "1rocket1" zutrifft. Er hat eine viel bessere Lösung gepostet, nämlich

(?:^|\W)rocket(?:$|\W)

Answer

Ich empfehle, ein Lesezeichen fürKurzreferenz für reguläre Ausdrücke von MSDN

Sie möchten eine Groß-/Kleinschreibungsunabhängige Übereinstimmung für das Wort „Rocket“ erreichen, das von nicht-alphanumerischen Zeichen umgeben ist. Ein regulärer Ausdruck, der funktionieren würde, wäre:

\W*((?i)rocket(?-i))\W*

Es wird nach null oder mehr (*) nicht alphanumerischen (\W) Zeichen gesucht, gefolgt von einer Groß-/Kleinschreibungsunabhängigen Version von Rakete ( (?i)rocket(?-i) ), gefolgt wiederum von null oder mehr (*) nicht alphanumerischen Zeichen (\W). Die zusätzlichen Klammern um den mit Rakete übereinstimmenden Begriff ordnen die Übereinstimmung einer separaten Gruppe zu. Das Wort Rakete befindet sich somit in Übereinstimmungsgruppe 1.

UPDATE 1: Matt sagte in dem Kommentar, dass dieser reguläre Ausdruck in Python verwendet werden soll. Python hat eine etwas andere Syntax. Um in Python dasselbe Ergebnis zu erzielen, verwenden Sie diesen regulären Ausdruck und übergeben Sie die re.IGNORECASEOption an die Funktion compile„oder“ match.

\W*(rocket)\W*

AnRegex101Dies kann simuliert werden, indem Sie „i“ in das Textfeld neben der Regex-Eingabe eingeben.

AKTUALISIERUNG 2Ismael hat erwähnt, dass der reguläre Ausdruck nicht ganz korrekt ist, da er möglicherweise auf "1rocket1" zutrifft. Er hat eine viel bessere Lösung gepostet, nämlich

(?:^|\W)rocket(?:$|\W)

Question 2

Ich denke, die Vorausschau ist in diesem Fall übertrieben, und Sie wären besser dran, wenn Sie Wortgrenzen mit der ignorecaseOption verwenden würden,

\brocket\b

Mit anderen Worten, in Python:

>>> x="rocket's"
>>> y="rocket1."
>>> c=re.compile(r"\brocket\b",re.I)  # with the ignorecase option
>>> c.findall(y)
[]
>>> c.findall(x)
['rocket']

Answer

Ich denke, die Vorausschau ist in diesem Fall übertrieben, und Sie wären besser dran, wenn Sie Wortgrenzen mit der ignorecaseOption verwenden würden,

\brocket\b

Mit anderen Worten, in Python:

>>> x="rocket's"
>>> y="rocket1."
>>> c=re.compile(r"\brocket\b",re.I)  # with the ignorecase option
>>> c.findall(y)
[]
>>> c.findall(x)
['rocket']

Question 3

Mit grepund sedkönnen Sie verwenden \<rocket\>. Mit wird grepdie Groß-/Kleinschreibung nicht beachtet (-iichGroß-/Kleinschreibung ignorieren):

grep -i '\<rocket\>'

Ich kenne keine Möglichkeit, bei allen sedregulären Ausdrücken die Groß-/Kleinschreibung außer Acht zu lassen, aber es gibt immer noch die Höhlenmenschenmethode:

sed -n '/\<[Rr][Oo][Cc][Kk][Ee][Tt]\>/p'

Answer

Mit grepund sedkönnen Sie verwenden \<rocket\>. Mit wird grepdie Groß-/Kleinschreibung nicht beachtet (-iichGroß-/Kleinschreibung ignorieren):

grep -i '\<rocket\>'

Ich kenne keine Möglichkeit, bei allen sedregulären Ausdrücken die Groß-/Kleinschreibung außer Acht zu lassen, aber es gibt immer noch die Höhlenmenschenmethode:

sed -n '/\<[Rr][Oo][Cc][Kk][Ee][Tt]\>/p'

Question 4

Ich denke, Sie können so etwas verwenden, um das gewünschte Wort anzugeben: /^(rocket|RoCKEt)$/g

Answer

Ich denke, Sie können so etwas verwenden, um das gewünschte Wort anzugeben: /^(rocket|RoCKEt)$/g

Wie schreibe ich einen regulären Ausdruck, der einem bestimmten Wort entspricht?

Antwort1

Antwort2

Antwort3

Antwort4

verwandte Informationen