簡單的腳本解析文本，這裡有什麼問題嗎？

Question 1

作為穆西奧已經說過，問題是一些特殊字元的HTML編碼。

Perl 可以可靠且輕鬆地轉換它們：

curl 'https://www.grc.com/passwords.htm' | \
    grep 'ASCII characters:' \
    perl -MHTML::Entities -ne 's/.*2>|<.*//g; print decode_entities($_)'

Answer

作為穆西奧已經說過，問題是一些特殊字元的HTML編碼。

Perl 可以可靠且輕鬆地轉換它們：

curl 'https://www.grc.com/passwords.htm' | \
    grep 'ASCII characters:' \
    perl -MHTML::Entities -ne 's/.*2>|<.*//g; print decode_entities($_)'

Question 2

這可能與 HTML 編碼有關，例如<63 個字元中的 a 實際上表示為<來源中的實體，使您的字串更長一些。

Answer

這可能與 HTML 編碼有關，例如<63 個字元中的 a 實際上表示為<來源中的實體，使您的字串更長一些。

Question 3

您需要考慮以下事項 - 腳本的結果字串可能通常包含某些在 sed 操作中未正確轉義的字元。

例如，這些字元可能是可疑的：方括號、單引號和雙引號、大括號、感嘆號、正斜線和反斜線以及星號。

我會嘗試在一系列測試中從返回的字串中刪除其中一個字符，比較結果以查看刪除任意數量的這些字符中的一個是否會使計數達到 63。

Answer

您需要考慮以下事項 - 腳本的結果字串可能通常包含某些在 sed 操作中未正確轉義的字元。

例如，這些字元可能是可疑的：方括號、單引號和雙引號、大括號、感嘆號、正斜線和反斜線以及星號。

我會嘗試在一系列測試中從返回的字串中刪除其中一個字符，比較結果以查看刪除任意數量的這些字符中的一個是否會使計數達到 63。

Question 4

根據您對 mousio 的評論，您的 grep/sed... 鏈可以簡化為一個命令：

Perl 通常是預設安裝的

perl -ne 'next unless /63 random printable ASCII characters:/; s/^.*size=2>//; s/<\/font>.*$//; s/&quot;/"/g; s/&apos;/'\''/g; s/&amp;/&/g; s/&lt;/</g; s/&gt;/>/g; print; exit'

並非所有 sed 都理解這個語法

sed -n '/63 random printable ASCII characters:/{s/^.*size=2>//; s/<\/font>.*$//; s/&quot;/"/g; s/&apos;/'\''/g; s/&amp;/\&/g; s/&lt;/</g; s/&gt;/>/g; p;q}'

Answer

根據您對 mousio 的評論，您的 grep/sed... 鏈可以簡化為一個命令：

Perl 通常是預設安裝的

perl -ne 'next unless /63 random printable ASCII characters:/; s/^.*size=2>//; s/<\/font>.*$//; s/&quot;/"/g; s/&apos;/'\''/g; s/&amp;/&/g; s/&lt;/</g; s/&gt;/>/g; print; exit'

並非所有 sed 都理解這個語法

sed -n '/63 random printable ASCII characters:/{s/^.*size=2>//; s/<\/font>.*$//; s/&quot;/"/g; s/&apos;/'\''/g; s/&amp;/\&/g; s/&lt;/</g; s/&gt;/>/g; p;q}'

簡單的腳本解析文本，這裡有什麼問題嗎？

答案1

答案2

答案3

答案4

相關內容