
У меня есть файл csv, и мне нужно отфильтровать его на два файла в зависимости от того, содержит ли последний столбец слово "ecDNA". У меня уже есть еще две копии файла для редактирования без изменения исходного файла. Есть ли способ удалить все строки, которые не содержат "ecDNA" из одного файла и оставить только строки, которые содержат "ecDNA" из другой копии файла?
решение1
awk -F, '$NF ~ /ecDNA/' oldfile > newfile
NF — это количество полей (столбцов) в текущей строке ввода, поэтому $NF — это значение (содержимое) последнего поля. Если $NF содержит "ecDNA", то вывести строку. В противном случае проигнорировать ее.
Если вам нужно, чтобы совпадение было нечувствительным к регистру (и вы используете GNU awk), используйте:
awk -F, -v IGNORECASE=1 '$NF ~ /ecDNA/' oldfile > newfile
Для инвертированного соответствия (строки без ecDNA
последнего поля) измените оператор условия на отрицательный:
awk -F, '$NF !~ /ecDNA/' oldfile > newfile2