Das ursprüngliche Problem
Ich habe einen Ordner mitjsxDateien mitreagieren-intlSyntax darin, die wie folgt aussieht:
...
<div>
<ul>
<li><FormattedMessage id='some.language.key_1' defaultMessage='Some message 1' /></li>
<li><FormattedMessage id='some.language.key_2' defaultMessage='Some message 2' /></li>
<li><FormattedMessage id='some.language.key_3' defaultMessage='Some message 3' /></li>
</ul>
</div>
<div>
<p>Some other contents</p>
</div>
...
Ich möchte eine Datei mit allen <FormattedMessage>
Tags im Ordner erstellen. Die Ausgabe sollte folgendermaßen aussehen:
...
<FormattedMessage id='some.language.key_1' defaultMessage='Some message 1' />
<FormattedMessage id='some.language.key_2' defaultMessage='Some message 2' />
<FormattedMessage id='some.language.key_3' defaultMessage='Some message 3' />
...
Ich weiß, dass ich mit diesem Befehl ein vernünftiges Ergebnis erzielen kann:
grep -REho '<FormattedMessage .*\/>' my/target/folder/.
Mein aktuelles Problem
Die Dinge werden kompliziert, wenn einige der tatsächlichen Ergebnisse so aussehen:
<FormattedMessage id='some.lang.key_1' defaultMessage="Hello {myvar}" values={{ myvar: <FormattedMessage id='some.lang.key_2' defaultMessage='World' /> }} />} />
Und ich möchte für diese Art von Mustern zwei separate Zeilen erstellen:
<FormattedMessage id='some.lang.key_1' defaultMessage="Hello {myvar}" values={{ myvar: <FormattedMessage id='some.lang.key_2' defaultMessage='World' /> }} />} />
<FormattedMessage id='some.lang.key_2' defaultMessage='World' />
Gibt es eine Möglichkeit, dies mithilfe der Unix-Befehlsmagie zu erreichen?
Aktualisieren: Eine sinnvollere Beispieldatei:
<ul>
<li><FormattedMessage id='lang.key_1' defaultMessage='Message 1' /></li>
<li><FormattedMessage id='lang.key_2' defaultMessage='Message 2' /></li>
<li><FormattedMessage id='lang.key_3' defaultMessage='Message 3' /></li>
<li><FormattedMessage id='lang.key_4' defaultMessage='Message 4' /></li>
<li><FormattedMessage id='lang.key_5' defaultMessage="Message 5 with {inner}" values={{ inner: <Link><FormattedMessage id='lang.key_6' defaultMessage='Message 6' /></Link> }} /></li>
<li><FormattedMessage id='lang.key_7' defaultMessage='Message 7' /></li>
</ul>
Gewünschte Ausgabe:
<FormattedMessage id='lang.key_1' defaultMessage='Message 1' />
<FormattedMessage id='lang.key_2' defaultMessage='Message 2' />
<FormattedMessage id='lang.key_3' defaultMessage='Message 3' />
<FormattedMessage id='lang.key_4' defaultMessage='Message 4' />
<FormattedMessage id='lang.key_5' defaultMessage="Message 5 with {inner}" values={{ inner: <Link><FormattedMessage id='lang.key_6' defaultMessage='Message 6' /></Link> }} />} /></li>
<FormattedMessage id='lang.key_6' defaultMessage='Message 6' />
<FormattedMessage id='lang.key_7' defaultMessage='Message 7' />
Antwort1
Ihr Problem ergibt sich daraus recursive regexes
, dass ein Muster mehrmals im selben Muster enthalten ist.
perl -lane '
$. == 1 and $re = qr{
( # capturing group start
<FormattedMessage\s # match tag opening
(?:
(?>[^<>])+ # consume as many non-angle brackets as is possible
|
(?1) # otherwise, recurse
|
(?>.*?>) # skip a noninteresting tag
)*
/> # match tag closing
) # capturing group end
}x;
next unless /<FormattedMessage\s/;
while ( my @tags = /$re/g ) {
print for @tags;
$_ = join $,, map { s/^<(.*)>$/$1/r } @tags;
}
' file1
Ergebnis
<FormattedMessage id='lang.key_1' defaultMessage='Message 1' />
<FormattedMessage id='lang.key_2' defaultMessage='Message 2' />
<FormattedMessage id='lang.key_3' defaultMessage='Message 3' />
<FormattedMessage id='lang.key_4' defaultMessage='Message 4' />
<FormattedMessage id='lang.key_5' defaultMessage="Message 5 with {inner}" values={{ inner: <Link><FormattedMessage id='lang.key_6' defaultMessage='Message 6' /></Link> }} />
<FormattedMessage id='lang.key_6' defaultMessage='Message 6' />
<FormattedMessage id='lang.key_7' defaultMessage='Message 7' />
Antwort2
Übergeben Sie die Ausgabe Ihres ersten grep
an sed
:
sed -n 'p;s,..*\(<FormattedMessage[^>]*>\).*,\1,p'
Ausgabe:
$ grep -REho '<FormattedMessage .*\/>' file | sed -n 'p;s,..*\(<FormattedMessage[^>]*>\).*,\1,p'
<FormattedMessage id='lang.key_1' defaultMessage='Message 1' />
<FormattedMessage id='lang.key_2' defaultMessage='Message 2' />
<FormattedMessage id='lang.key_3' defaultMessage='Message 3' />
<FormattedMessage id='lang.key_4' defaultMessage='Message 4' />
<FormattedMessage id='lang.key_5' defaultMessage="Message 5 with {inner}" values={{ inner: <Link><FormattedMessage id='lang.key_6' defaultMessage='Message 6' /></Link> }} />
<FormattedMessage id='lang.key_6' defaultMessage='Message 6' />
<FormattedMessage id='lang.key_7' defaultMessage='Message 7' />