![Как скомпилировать строки с определенным словом в последнем столбце в отдельный файл?](https://rvso.com/image/192216/%D0%9A%D0%B0%D0%BA%20%D1%81%D0%BA%D0%BE%D0%BC%D0%BF%D0%B8%D0%BB%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D1%82%D1%8C%20%D1%81%D1%82%D1%80%D0%BE%D0%BA%D0%B8%20%D1%81%20%D0%BE%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%BD%D1%8B%D0%BC%20%D1%81%D0%BB%D0%BE%D0%B2%D0%BE%D0%BC%20%D0%B2%20%D0%BF%D0%BE%D1%81%D0%BB%D0%B5%D0%B4%D0%BD%D0%B5%D0%BC%20%D1%81%D1%82%D0%BE%D0%BB%D0%B1%D1%86%D0%B5%20%D0%B2%20%D0%BE%D1%82%D0%B4%D0%B5%D0%BB%D1%8C%D0%BD%D1%8B%D0%B9%20%D1%84%D0%B0%D0%B9%D0%BB%3F.png)
У меня есть файл csv, и мне нужно отфильтровать его на два файла в зависимости от того, содержит ли последний столбец слово "ecDNA". У меня уже есть еще две копии файла для редактирования без изменения исходного файла. Есть ли способ удалить все строки, которые не содержат "ecDNA" из одного файла и оставить только строки, которые содержат "ecDNA" из другой копии файла?
решение1
awk -F, '$NF ~ /ecDNA/' oldfile > newfile
NF — это количество полей (столбцов) в текущей строке ввода, поэтому $NF — это значение (содержимое) последнего поля. Если $NF содержит "ecDNA", то вывести строку. В противном случае проигнорировать ее.
Если вам нужно, чтобы совпадение было нечувствительным к регистру (и вы используете GNU awk), используйте:
awk -F, -v IGNORECASE=1 '$NF ~ /ecDNA/' oldfile > newfile
Для инвертированного соответствия (строки без ecDNA
последнего поля) измените оператор условия на отрицательный:
awk -F, '$NF !~ /ecDNA/' oldfile > newfile2