Einfaches Skript analysiert Text. Was ist hier falsch?

Question 1

AlsmousioWie bereits gesagt, liegt das Problem in der HTML-Kodierung einiger Sonderzeichen.

Perl kann diese zuverlässig und einfach konvertieren:

curl 'https://www.grc.com/passwords.htm' | \
    grep 'ASCII characters:' \
    perl -MHTML::Entities -ne 's/.*2>|<.*//g; print decode_entities($_)'

Answer

AlsmousioWie bereits gesagt, liegt das Problem in der HTML-Kodierung einiger Sonderzeichen.

Perl kann diese zuverlässig und einfach konvertieren:

curl 'https://www.grc.com/passwords.htm' | \
    grep 'ASCII characters:' \
    perl -MHTML::Entities -ne 's/.*2>|<.*//g; print decode_entities($_)'

Question 2

Es könnte mit der HTML-Kodierung zu tun haben, wo beispielsweise ein „a“ <in den 63 Zeichen tatsächlich als Entität <in der Quelle dargestellt wird, wodurch Ihre Zeichenfolge etwas länger wird.

Answer

Es könnte mit der HTML-Kodierung zu tun haben, wo beispielsweise ein „a“ <in den 63 Zeichen tatsächlich als Entität <in der Quelle dargestellt wird, wodurch Ihre Zeichenfolge etwas länger wird.

Question 3

Folgendes sollten Sie bedenken: Die resultierende Zeichenfolge Ihres Skripts enthält möglicherweise oft bestimmte Zeichen, die bei den Sed-Vorgängen nicht richtig maskiert werden.

Folgende Zeichen können beispielsweise verdächtig sein: Klammern, einfache und doppelte Anführungszeichen, geschweifte Klammern, Ausrufezeichen, Schrägstriche und umgekehrte Schrägstriche sowie Sternchen.

Ich würde in einer Reihe von Tests versuchen, eines dieser Zeichen aus der zurückgegebenen Zeichenfolge zu entfernen und die Ergebnisse vergleichen, um zu sehen, ob das Entfernen eines oder mehrerer dieser Zeichen die Anzahl auf 63 bringt.

Answer

Folgendes sollten Sie bedenken: Die resultierende Zeichenfolge Ihres Skripts enthält möglicherweise oft bestimmte Zeichen, die bei den Sed-Vorgängen nicht richtig maskiert werden.

Folgende Zeichen können beispielsweise verdächtig sein: Klammern, einfache und doppelte Anführungszeichen, geschweifte Klammern, Ausrufezeichen, Schrägstriche und umgekehrte Schrägstriche sowie Sternchen.

Ich würde in einer Reihe von Tests versuchen, eines dieser Zeichen aus der zurückgegebenen Zeichenfolge zu entfernen und die Ergebnisse vergleichen, um zu sehen, ob das Entfernen eines oder mehrerer dieser Zeichen die Anzahl auf 63 bringt.

Question 4

Basierend auf Ihrem Kommentar an mousio kann Ihre grep/sed-Kette ... auf einen Befehl reduziert werden:

Perl ist normalerweise standardmäßig installiert

perl -ne 'next unless /63 random printable ASCII characters:/; s/^.*size=2>//; s/<\/font>.*$//; s/&quot;/"/g; s/&apos;/'\''/g; s/&amp;/&/g; s/&lt;/</g; s/&gt;/>/g; print; exit'

Nicht alle Seds verstehen diese Syntax

sed -n '/63 random printable ASCII characters:/{s/^.*size=2>//; s/<\/font>.*$//; s/&quot;/"/g; s/&apos;/'\''/g; s/&amp;/\&/g; s/&lt;/</g; s/&gt;/>/g; p;q}'

Answer

Basierend auf Ihrem Kommentar an mousio kann Ihre grep/sed-Kette ... auf einen Befehl reduziert werden:

Perl ist normalerweise standardmäßig installiert

perl -ne 'next unless /63 random printable ASCII characters:/; s/^.*size=2>//; s/<\/font>.*$//; s/&quot;/"/g; s/&apos;/'\''/g; s/&amp;/&/g; s/&lt;/</g; s/&gt;/>/g; print; exit'

Nicht alle Seds verstehen diese Syntax

sed -n '/63 random printable ASCII characters:/{s/^.*size=2>//; s/<\/font>.*$//; s/&quot;/"/g; s/&apos;/'\''/g; s/&amp;/\&/g; s/&lt;/</g; s/&gt;/>/g; p;q}'

Einfaches Skript analysiert Text. Was ist hier falsch?

Antwort1

Antwort2

Antwort3

Antwort4

verwandte Informationen