資料處理

資料處理

我有一個數據如下所述。

host_name   Server1.domain.com
contacts    DL - Desktop
contact_groups ravi, raj, rahim
host_name  Server2.domain.com
contact_groups DL-Server
host_name Server3.domain.com
host_name Server4.domain.com
contacts   Services,helpdesk,manager

所需的輸出如下。

host_name Server1.domain.com, contacts ravi,raj,rahim, Contact_group DL-Desktop
host_name Server2.domain.com  contact_groups DL - Server
host_name Server3.domain.com
host_name Server4.domain.com contacts services,helpdesk,manager

答案1

我確信你可以在 awk 中輕鬆完成此操作,但 awk 不太喜歡我,所以這裡是我使用廚房水槽之外的所有東西的看法。假設資料位於名為 file1 的檔案中

export output=; while read line; do if [[ "$line" =~ "host_name" ]]; then export output="${output}\n"; fi; export output="${output}, $line"; done < file1 && echo -e $output | sed 's/^, \?//' | sed '/^$/d'

文件1的內容

host_name   Server1.domain.com
contacts    ravi, raj, rahim
contact_groups DL - Desktop
host_name  Server2.domain.com
contact_groups DL-Server
host_name Server3.domain.com
host_name Server4.domain.com
contacts   Services,helpdesk,manager

上述命令的輸出

host_name Server1.domain.com, contacts ravi, raj, rahim, contact_groups DL - Desktop
host_name Server2.domain.com, contact_groups DL-Server
host_name Server3.domain.com
host_name Server4.domain.com, contacts Services,helpdesk,manager

答案2

$ sed -e '2,$ s/^host_name/\n&/' ravi.txt | 
    perl -n -e 'if (! m/^$/) {
                    chomp;
                    $line .= $_ . ", "
                };

                if (m/^$/ || eof) {
                    $line =~ s/  +/ /g; # merge multiple spaces into one space
                    $line =~ s/, $//;   # strip the trailing comma
                    print $line,"\n" ;
                    $line=""
                }'
host_name Server1.domain.com, contacts DL - Desktop, contact_groups ravi, raj, rahim
host_name Server2.domain.com, contact_groups DL-Server
host_name Server3.domain.com
host_name Server4.domain.com, contacts Services,helpdesk,manager

首先用於sed將輸入轉換為段落(以換行符號分隔)。然後perl將每個段落中的行連接在一起並列印出來。

這可以完全用 Perl 完成,但我很懶,認為在管道傳輸到簡單的 Perl scipt 之前轉換為段落會更容易。

相關內容