Как скомпилировать строки с определенным словом в последнем столбце в отдельный файл?

Как скомпилировать строки с определенным словом в последнем столбце в отдельный файл?

У меня есть файл csv, и мне нужно отфильтровать его на два файла в зависимости от того, содержит ли последний столбец слово "ecDNA". У меня уже есть еще две копии файла для редактирования без изменения исходного файла. Есть ли способ удалить все строки, которые не содержат "ecDNA" из одного файла и оставить только строки, которые содержат "ecDNA" из другой копии файла?

решение1

awk -F, '$NF ~ /ecDNA/' oldfile > newfile

NF — это количество полей (столбцов) в текущей строке ввода, поэтому $NF — это значение (содержимое) последнего поля. Если $NF содержит "ecDNA", то вывести строку. В противном случае проигнорировать ее.

Если вам нужно, чтобы совпадение было нечувствительным к регистру (и вы используете GNU awk), используйте:

awk -F, -v IGNORECASE=1 '$NF ~ /ecDNA/' oldfile > newfile

Для инвертированного соответствия (строки без ecDNAпоследнего поля) измените оператор условия на отрицательный:

awk -F, '$NF !~ /ecDNA/' oldfile > newfile2

Связанный контент