использование awk с параллельным

Question 1

Посмотрите, есть ли у вас эта parallelпрограмма в системе. (Она может быть из GNU.) Если есть, выясните, как ее использовать. В противном случае,
Запустите ваш findwith output в файл. Используя текстовый редактор или, возможно, скрипт с использованием таких инструментов, как head, разделите этот файл на 16 файлов фрагментов с (примерно) равным количеством строк (т.е. ссылающихся на равное количество найденных файлов). Затем запустите 16 awk … | paste … | bcконвейеров; по одному для каждого файла фрагмента. (И сложите 16 результатов.)

Мне интересно, почему вы используете awkдля подсчета вхождений строки функцию , когда grep -cона специально для этого предназначена.

Answer

Посмотрите, есть ли у вас эта parallelпрограмма в системе. (Она может быть из GNU.) Если есть, выясните, как ее использовать. В противном случае,
Запустите ваш findwith output в файл. Используя текстовый редактор или, возможно, скрипт с использованием таких инструментов, как head, разделите этот файл на 16 файлов фрагментов с (примерно) равным количеством строк (т.е. ссылающихся на равное количество найденных файлов). Затем запустите 16 awk … | paste … | bcконвейеров; по одному для каждого файла фрагмента. (И сложите 16 результатов.)

Мне интересно, почему вы используете awkдля подсчета вхождений строки функцию , когда grep -cона специально для этого предназначена.

Question 2

GNU parallel довольно совместим с xargs, в вашем случае он может заменить его. Если вы считаете только случаи substringиспользования grep -cкакСкоттпредполагает:

sudo find /mnt2/preprocessed/preprocessed/mo* | 
  sudo parallel grep -c source | paste -sd+ | bc

Обратите внимание, что некоторые версии GNU/Linux устанавливают GNU parallel в совместимом режиме "Tollef's parallel". Вы можете изменить это, добавив --gnuв командную строку аргументы parallel. Чтобы сделать изменение постоянным, добавьте --gnuв ~/.parallel/config.

Answer

GNU parallel довольно совместим с xargs, в вашем случае он может заменить его. Если вы считаете только случаи substringиспользования grep -cкакСкоттпредполагает:

sudo find /mnt2/preprocessed/preprocessed/mo* | 
  sudo parallel grep -c source | paste -sd+ | bc

Обратите внимание, что некоторые версии GNU/Linux устанавливают GNU parallel в совместимом режиме "Tollef's parallel". Вы можете изменить это, добавив --gnuв командную строку аргументы parallel. Чтобы сделать изменение постоянным, добавьте --gnuв ~/.parallel/config.

использование awk с параллельным

решение1

решение2

Связанный контент