Как пропустить файл в sed, если он содержит регулярное выражение?

Question 1

Если вы доверяете gitточке зрения на то, что является двоичным файлом, а что нет, вы можете использовать git grepдля получения списка недвоичных файлов. Предполагая, t.cppчто это текстовый файл, а lsэто двоичный файл, оба проверены в:

$ ls
t.cpp ls
$ git grep -I --name-only -e ''
t.cpp

Опция -Iозначает:

-I
Не сопоставляйте шаблон в двоичных файлах.

Чтобы объединить это с вашим sedвыражением:

$ git grep -I --name-only -z -e '' | \
       xargs -0 sed -i.bk -e 's/[ \t]\+\(\r\?\)$/\1/;$a\'

( -z/ xargs -0для помощи со странными именами файлов.)

Ознакомьтесь со git grepстраницей руководства для получения информации о других полезных опциях ( --no-indexили --cachedвозможной помощи в зависимости от того, с каким именно набором файлов вы хотите работать).

Answer

Если вы доверяете gitточке зрения на то, что является двоичным файлом, а что нет, вы можете использовать git grepдля получения списка недвоичных файлов. Предполагая, t.cppчто это текстовый файл, а lsэто двоичный файл, оба проверены в:

$ ls
t.cpp ls
$ git grep -I --name-only -e ''
t.cpp

Опция -Iозначает:

-I
Не сопоставляйте шаблон в двоичных файлах.

Чтобы объединить это с вашим sedвыражением:

$ git grep -I --name-only -z -e '' | \
       xargs -0 sed -i.bk -e 's/[ \t]\+\(\r\?\)$/\1/;$a\'

( -z/ xargs -0для помощи со странными именами файлов.)

Ознакомьтесь со git grepстраницей руководства для получения информации о других полезных опциях ( --no-indexили --cachedвозможной помощи в зависимости от того, с каким именно набором файлов вы хотите работать).

Question 2

Есть ли способ пропустить весь файл, если какая-либо строка соответствует регулярному выражению в sed?

Да, есть.

# test case for skipping file if a sed regex match succeeds

echo 'Hello, world!' > hello_world.txt
cat hello_world.txt
ls -li hello_world.txt

sed -i -e '/.*Hello.*/{q;}; s/world/WORLD/g' hello_world.txt # skips file
sed -i -e '/.*HeLLo.*/{q;}; s/world/WORLD/g' hello_world.txt

Answer

Есть ли способ пропустить весь файл, если какая-либо строка соответствует регулярному выражению в sed?

Да, есть.

# test case for skipping file if a sed regex match succeeds

echo 'Hello, world!' > hello_world.txt
cat hello_world.txt
ls -li hello_world.txt

sed -i -e '/.*Hello.*/{q;}; s/world/WORLD/g' hello_world.txt # skips file
sed -i -e '/.*HeLLo.*/{q;}; s/world/WORLD/g' hello_world.txt

Question 3

Вот скрипт Perl, который перебирает свои аргументы (которые должны быть именами файлов) и добавляет новую строку к каждому файлу, который не заканчивается новой строкой. Файлы, содержащие нулевой байт, пропускаются. Файлы, которые уже заканчиваются новой строкой, не изменяются. Файлы, содержащие CR, получают CRLF, другие получают только LF. Не проверено.

#!/usr/bin/env perl
foreach my $f (@ARGV) {
    open F, "<", $f or die;
    my $last = undef;
    my $cr = 0;
    while (<>) {if (/\0/) {undef $last; break} $last = $_; ++$cr if /\r$/}
    close F;
    if (defined $last && $last !~ /\n\Z/) {
        open F, ">>", $f or die;
        print($cr ? "\r\n" : "\n");
        close F or die;
    }
}

Answer

Вот скрипт Perl, который перебирает свои аргументы (которые должны быть именами файлов) и добавляет новую строку к каждому файлу, который не заканчивается новой строкой. Файлы, содержащие нулевой байт, пропускаются. Файлы, которые уже заканчиваются новой строкой, не изменяются. Файлы, содержащие CR, получают CRLF, другие получают только LF. Не проверено.

#!/usr/bin/env perl
foreach my $f (@ARGV) {
    open F, "<", $f or die;
    my $last = undef;
    my $cr = 0;
    while (<>) {if (/\0/) {undef $last; break} $last = $_; ++$cr if /\r$/}
    close F;
    if (defined $last && $last !~ /\n\Z/) {
        open F, ">>", $f or die;
        print($cr ? "\r\n" : "\n");
        close F or die;
    }
}

Как пропустить файл в sed, если он содержит регулярное выражение?

решение1

решение2

решение3

Связанный контент