如何將不以「

Question 1

我想我以前已經說過這一點 - 但有聽起來像卡住的記錄的風險 - 不要使用正規表示式來解析 XML。它很脆並且容易破裂。但我首先會問——你為什麼要做你正在做的事情？因為在使用 XML 時它應該是無關緊要的。

相反，使用解析器：

#!/usr/bin/env perl
use strict;
use warnings;

use XML::Twig;

my $twig = XML::Twig->parsefile('your_file.xml');

foreach my $elt ( $twig->get_xpath('//#PCDATA') ) {
    $elt->set_text( $elt->trimmed_text );
}

$twig->set_pretty_print('indented_a');
$twig->print;

這可以滿足您的要求...但是如果您實際上正常使用 XML，那麼該trimmed_text方法可能無論如何都不需要進行此處理。

Answer

我想我以前已經說過這一點 - 但有聽起來像卡住的記錄的風險 - 不要使用正規表示式來解析 XML。它很脆並且容易破裂。但我首先會問——你為什麼要做你正在做的事情？因為在使用 XML 時它應該是無關緊要的。

相反，使用解析器：

#!/usr/bin/env perl
use strict;
use warnings;

use XML::Twig;

my $twig = XML::Twig->parsefile('your_file.xml');

foreach my $elt ( $twig->get_xpath('//#PCDATA') ) {
    $elt->set_text( $elt->trimmed_text );
}

$twig->set_pretty_print('indented_a');
$twig->print;

這可以滿足您的要求...但是如果您實際上正常使用 XML，那麼該trimmed_text方法可能無論如何都不需要進行此處理。

Question 2

Perl 來救援！

perl -pe 'print "\n" if /^\s*+</; chomp;' input > output

即從每一行中刪除換行符，並在下一行以空格開頭後跟<.時打印它。

若要保留最後的換行符，請變更chomp為chomp unless eof或新增END { print "\n" }

Answer

Perl 來救援！

perl -pe 'print "\n" if /^\s*+</; chomp;' input > output

即從每一行中刪除換行符，並在下一行以空格開頭後跟<.時打印它。

若要保留最後的換行符，請變更chomp為chomp unless eof或新增END { print "\n" }

Question 3

幾乎標準的 sed 程序

sed '$!N;s/\n\(\s*[^<[:blank:]]\)/\1/;P;D' log.xml

Answer

幾乎標準的 sed 程序

sed '$!N;s/\n\(\s*[^<[:blank:]]\)/\1/;P;D' log.xml

Question 4

使用 XPath 函數normalize-space刪除/head/body/line節點的初始換行符：

xmlstarlet edit --update '/head/body/line' --expr 'normalize-space(text())' file.xml

或者，使用縮寫名稱：

xmlstarlet ed -u '/head/body/line' -x 'normalize-space(text())' file.xml

給定問題中的輸入，輸出將是

<?xml version="1.0"?>
<head>
  <body>
    <line>asdasd</line>
  </body>
</head>

如果您想影響輸入文件中的所有節點，請使用//line代替根節點的完整路徑。line

在產生的文檔的開頭新增-O或--omit-decl之後edit或ed丟棄聲明。<?xml ...>

Answer