從大文本文件中提取行

Question 1

從評論中，我了解到您正在尋找提取第七列為+or的行-。輸入檔案以製表符分隔。為此，在將+行儲存到名為的檔案中plus並將減號行儲存到名為的檔案時minus，最自然的工具可能是awk：

awk -F'\t' '$7=="+"{print >"plus"} $7=="-"{print>"minus"}' file

怎麼運作的：

Answer

從評論中，我了解到您正在尋找提取第七列為+or的行-。輸入檔案以製表符分隔。為此，在將+行儲存到名為的檔案中plus並將減號行儲存到名為的檔案時minus，最自然的工具可能是awk：

awk -F'\t' '$7=="+"{print >"plus"} $7=="-"{print>"minus"}' file

怎麼運作的：

Question 2

sed -ne '/^[^+-]*+/w plus.file' -e //d -e '/^[^+-]-/w minus.file' <infile

對於第七個製表符分隔部分，執行下列操作：

sed -ne 'h;s/\([^\t]*\t\)\{6\}[^\t+-]*//
            /^-/{g;w minus.file' -e 'b
         }; /^+/{g;w plus.file'  -e \}

但您可能必須使用文字<tab>字元來取代\t上面的轉義字元。

Answer

sed -ne '/^[^+-]*+/w plus.file' -e //d -e '/^[^+-]-/w minus.file' <infile

對於第七個製表符分隔部分，執行下列操作：

sed -ne 'h;s/\([^\t]*\t\)\{6\}[^\t+-]*//
            /^-/{g;w minus.file' -e 'b
         }; /^+/{g;w plus.file'  -e \}

但您可能必須使用文字<tab>字元來取代\t上面的轉義字元。

相關內容