Extraia o intervalo de elementos do i-ésimo elemento ao j-ésimo elemento, até o enésimo elemento de uma lista

Extraia o intervalo de elementos do i-ésimo elemento ao j-ésimo elemento, até o enésimo elemento de uma lista

Em um diretório, tenho um certo número de arquivos. Podem ser 53 arquivos txt, mas também posso ter 123 arquivos. Os arquivos têm vários nomes aleatórios, mas todos têm o identificador de arquivo.txt

Posso obter uma lista de todos os arquivos com ls e colocar isso em uma variável.

list_of_txt_files=$(ls *.txt)

Mas eu gostaria de particionar a lista em várias listas individuais, cada lista com apenas 10 elementos - ou seja, uma pasta com 53 arquivos txt, deveria me dar 6 listas. São 5 listas com 10 nomes de arquivos e uma 6ª lista com 3 nomes de arquivos, e meu exemplo com 123 arquivos txt em um diretório deve me dar 12 listas com 10 nomes de arquivos e uma 13ª lista com apenas 3 nomes de arquivos .

Com meu exemplo com 53 arquivos txt: list no. 1 manteria o primeiro arquivo até o décimo arquivo e listaria o nº. 2 manteria o décimo primeiro arquivo até o vigésimo arquivo e assim por diante. Intitulei minha pergunta do i-ésimo ao j-ésimo elemento de uma lista, pois suponho que outras pessoas possam querer dividir a lista de maneira diferente. Talvez do primeiro ao centésimo arquivo em um diretório.

O objetivo final é ser capaz de usar essas listas em um loop for do e usar o comando cat para escrever o conteúdo de dez arquivos por lista em um arquivo por conjunto de dez arquivos - ou seja, no meu exemplo com 53 arquivos em um diretório, isso me daria 6 arquivos. Onde os primeiros 5 arquivos contêm o conteúdo dos 50 arquivos txt originais e o 6º arquivo contém o conteúdo dos últimos 3 arquivos txt restantes.

Pensei em usar o comando head ou tail, mas não consigo descobrir como especificar intervalos para esses dois comandos.

Responder1

Em uma concha commatrizes, usa-os. Diga com Bash:

$ touch {01..53}
$ files=(*)
$ echo "${files[@]:0:10}"       
01 02 03 04 05 06 07 08 09 10

$ for ((i = 0 ; i < ${#files[@]} ; i += 10 )) ; do
     echo "${files[@]:i:10}" ; 
     # or
     # cat "${files[@]:i:10}" > set-$(( i / 10 ))
  done
01 02 03 04 05 06 07 08 09 10
11 12 13 14 15 16 17 18 19 20
21 22 23 24 25 26 27 28 29 30
31 32 33 34 35 36 37 38 39 40
41 42 43 44 45 46 47 48 49 50
51 52 53

Oexpansão de substring(array slice) "${files[@]:i:10}"se expande para uma lista de palavras, não para uma única string, para que você possa fazer um loop sobre ela:

for f in "${files[@]:i:10}" ; do
    somecmd "$f"
done

Nãodo files=$(ls *.txt), lsé completamente redundante aí, é o shell que avalia o curinga de qualquer maneira. Normalmente você apenas salva o padrão curinga em uma variável ( pat=*.txt) e usa-o (sem aspas) quando necessário, ou se quiser expandi-lo para os nomes de arquivo reais, use echo *.txtem vez de ls. Para lidar com listas de nomes de arquivos, os arrays são melhores, se você não estiver restrito a um shell POSIX simples.


Quanto a dividir uma lista com headand tail, você precisaria fazer algo como | head -20 | tail -10obter as linhas 11 a 20. Ou usar sed: | sed -n 11,20p.

Responder2

Com qualquer shell do tipo Bourne (mas o shell Bourne que não conseguiu acessar os elementos posicionais $9), você pode fazer:

set -- *.txt
while [ "$#" -gt 0 ]; do
  something with "$1" ${2+"$2"} ${3+"$3"}... ${10+"${10}"}
  [ "$#" -gt 10 ] || break
  shift 10
done

Com GNU xargse shells com suporte para substituição de processos:

xargs -n10 -r0a <(printf '%s\0' *.txt) something with

Com zsh:

files=(*.txt(N))
while (($#files)) {
  something with $files[1,10]
  files[1,10]=()
}

Ou:

autoload -U zargs
xargs -l10 -- *.txt -- something with

Observe também que você pode usar um intervalo nos zshglobs de:

something with *.txt([1,10])

informação relacionada