Используйте команду sed для поиска в текстовом файле записей 10000 и ниже.

Question 1

Вы также можете сделать это следующим способом:

$ sed -n "/^[0-9]\{0,4\}$\|10000/p" logfile

Пример

Допустим, у меня есть файл-образец, logfileнапример такой:

$ seq 9900 10050  | sed 's/$/ /' > logfile

В результате файл logfileбудет выглядеть следующим образом:

$ head -5 logfile 
9900
9901
9902
9903
9904

$ tail -5 logfile 
10046
10047
10048
10049
10050

После каждой из этих строк есть завершающий пробел, поскольку это произошло, sed 's/$/ /'когда мы создавали файл-образец в строке выше.

Теперь, когда мы выполним указанную выше sedкоманду:

$ sed -n "/^[0-9]\{1,4\}[^0-9]\|10000/p" logfile  | tail -5
9996 
9997 
9998 
9999 
10000

Мы получаем все до 10000, и ничего больше.

Как это работает

Вышеуказанное sedработает путем поиска строк, начинающихся с диапазона цифр 0-9, длиной от 1 до 4. Нотация to sedвыполняет "/^[0-9]\{1,4\}[^0-9]эту часть. Нотация [^0-9]в конце там говорит о символах, которые не являются 0-9. Это останавливает sedсопоставление подстрок в числах, которые длиннее.

Соответствует \|1000010000, так как это немного уникальный шаблон по сравнению с остальными строками до него. Завершающий pговорит о sedнеобходимости вывести результаты.

Использование grep в качестве альтернативы

Использование sedне совсем правильный инструмент для поиска. Вам, вероятно, лучше использовать grepдля этого.

$ grep "\b\([0-9]\{1,4\}\|10000\)\b" logfile | head -5
9900 
9901 
9902 
9903 
9904 

$ grep "\b\([0-9]\{1,4\}\|10000\)\b" logfile | tail -5
9996 
9997 
9998 
9999 
10000

Вышеприведенный код найдет все строки, содержащие строку цифр, равную или меньшую 10000. Обозначает \bграницу либо до, либо после строки.

Answer

Вы также можете сделать это следующим способом:

$ sed -n "/^[0-9]\{0,4\}$\|10000/p" logfile

Пример

Допустим, у меня есть файл-образец, logfileнапример такой:

$ seq 9900 10050  | sed 's/$/ /' > logfile

В результате файл logfileбудет выглядеть следующим образом:

$ head -5 logfile 
9900
9901
9902
9903
9904

$ tail -5 logfile 
10046
10047
10048
10049
10050

После каждой из этих строк есть завершающий пробел, поскольку это произошло, sed 's/$/ /'когда мы создавали файл-образец в строке выше.

Теперь, когда мы выполним указанную выше sedкоманду:

$ sed -n "/^[0-9]\{1,4\}[^0-9]\|10000/p" logfile  | tail -5
9996 
9997 
9998 
9999 
10000

Мы получаем все до 10000, и ничего больше.

Как это работает

Вышеуказанное sedработает путем поиска строк, начинающихся с диапазона цифр 0-9, длиной от 1 до 4. Нотация to sedвыполняет "/^[0-9]\{1,4\}[^0-9]эту часть. Нотация [^0-9]в конце там говорит о символах, которые не являются 0-9. Это останавливает sedсопоставление подстрок в числах, которые длиннее.

Соответствует \|1000010000, так как это немного уникальный шаблон по сравнению с остальными строками до него. Завершающий pговорит о sedнеобходимости вывести результаты.

Использование grep в качестве альтернативы

Использование sedне совсем правильный инструмент для поиска. Вам, вероятно, лучше использовать grepдля этого.

$ grep "\b\([0-9]\{1,4\}\|10000\)\b" logfile | head -5
9900 
9901 
9902 
9903 
9904 

$ grep "\b\([0-9]\{1,4\}\|10000\)\b" logfile | tail -5
9996 
9997 
9998 
9999 
10000

Вышеприведенный код найдет все строки, содержащие строку цифр, равную или меньшую 10000. Обозначает \bграницу либо до, либо после строки.

Question 2

Perl может сделать это проще и более читабельным:

perl -nE 'say for grep { $_ <= 10_000 } /([0-9]+)/g' your_file

Answer

Perl может сделать это проще и более читабельным:

perl -nE 'say for grep { $_ <= 10_000 } /([0-9]+)/g' your_file

Question 3

sed '/[0-9]/!d;/10000/q' <log.file

Пока записи идут в последовательном порядке, вам нужно только указать, что строка содержит число, !иначе dудалите его. И когда вы дойдете до строки, 10000вы qудалите. Но 10000 все равно будет напечатано — это будет последняя напечатанная строка.

Было бы намного лучше, если бы вы могли прикрепить его, например, к началу строки, например:

sed '/^[0-9]/!d;/^10000/q' <log.file

Что было бы надежнее и быстрее.

Но, как отмечает slm, grepэто было бы быстрее.

Answer

sed '/[0-9]/!d;/10000/q' <log.file

Пока записи идут в последовательном порядке, вам нужно только указать, что строка содержит число, !иначе dудалите его. И когда вы дойдете до строки, 10000вы qудалите. Но 10000 все равно будет напечатано — это будет последняя напечатанная строка.

Было бы намного лучше, если бы вы могли прикрепить его, например, к началу строки, например:

sed '/^[0-9]/!d;/^10000/q' <log.file

Что было бы надежнее и быстрее.

Но, как отмечает slm, grepэто было бы быстрее.

Question 4

sed -nr "/0|[1-9][0-9]?[0-9]?[0-9]?[0-9]?/p" logfile

Answer

sed -nr "/0|[1-9][0-9]?[0-9]?[0-9]?[0-9]?/p" logfile

Используйте команду sed для поиска в текстовом файле записей 10000 и ниже.

решение1

Пример

Как это работает

Использование grep в качестве альтернативы

решение2

решение3

решение4

Связанный контент