Проблема фильтрации массива последовательностей для удаления дубликатов со смещенными последовательностями

Question

Вот цикл bash, который считывает входные данные из файла с именем 'input' в массив с именем input, затем проходит по этому массиву и проверяет, была ли эта конкретная последовательность замечена ранее; если она не замечена, он выводит значение. Затем он вращает эту последовательность по всем 13 позициям, добавляя эти значения в ассоциативный массив с известным вращением. Я упростил данные, чтобы показать метод; вы можете взять цикл оболочки и настроить входные или выходные данные по мере необходимости.

#!/usr/bin/env bash
readarray -t input < input
declare -A rotations
for((i=0; i < ${#input[*]}; i++))
do
  x=${input[i]}
  [[ ${rotations[$x]:-0} -eq 0 ]] && printf "%s\n" "$x"
  for((r=0; r < 13; r++))
  do
    new=${x:r}${x:0:r}
    rotations[$new]=1
  done
done

Пример входных данных (скопирован из вопроса, затем упрощен):

0010111220121
0020222110212
0101112201210
0111220121001
0121001011122
0202221102120
0212002022211
0222110212002
1001011122012
1011122012100
1021200202221
1102120020222
1112201210010
1122012100101
1200202221102
1210010111220
1220121001011
2002022211021

Пример вывода:

0010111220121
0020222110212

Answer 1

Вот цикл bash, который считывает входные данные из файла с именем 'input' в массив с именем input, затем проходит по этому массиву и проверяет, была ли эта конкретная последовательность замечена ранее; если она не замечена, он выводит значение. Затем он вращает эту последовательность по всем 13 позициям, добавляя эти значения в ассоциативный массив с известным вращением. Я упростил данные, чтобы показать метод; вы можете взять цикл оболочки и настроить входные или выходные данные по мере необходимости.

#!/usr/bin/env bash
readarray -t input < input
declare -A rotations
for((i=0; i < ${#input[*]}; i++))
do
  x=${input[i]}
  [[ ${rotations[$x]:-0} -eq 0 ]] && printf "%s\n" "$x"
  for((r=0; r < 13; r++))
  do
    new=${x:r}${x:0:r}
    rotations[$new]=1
  done
done

Пример входных данных (скопирован из вопроса, затем упрощен):

0010111220121
0020222110212
0101112201210
0111220121001
0121001011122
0202221102120
0212002022211
0222110212002
1001011122012
1011122012100
1021200202221
1102120020222
1112201210010
1122012100101
1200202221102
1210010111220
1220121001011
2002022211021

Пример вывода:

0010111220121
0020222110212

Проблема фильтрации массива последовательностей для удаления дубликатов со смещенными последовательностями

решение1

Связанный контент