다음과 같은 이름 목록이 있습니다.
dog_bone
dog_collar
dragon
cool_dragon
lion
lion_trainer
dog
다음과 같이 다른 이름에 나타나는 이름을 추출해야 합니다.
dragon
lion
dog
매뉴얼 페이지를 샅샅이 살펴봤지만 uniq
문자열이 아닌 전체 줄을 비교하는 것 같습니다. bash 기능으로 이를 수행할 수 있는 방법이 있습니까?
답변1
file=/the/file.txt
while IFS= read -r string; do
grep -Fe "$string" < "$file" | grep -qvxFe "$string" &&
printf '%s\n' "$string"
done < "$file"
이는 파일 한 줄당 하나 read
, 두 개 grep
, 때로는 하나의 printf
명령을 실행하므로 그다지 효율적이지 않습니다.
한 번의 호출로 모든 작업을 수행할 수 있습니다 awk
.
awk '{l[NR]=$0}
END {
for (i=1; i<=NR; i++)
for (j=1; j<=NR; j++)
if (j!=i && index(l[j], l[i])) {
print l[i]
break
}
}' < "$file"
이는 전체 파일이 메모리에 저장된다는 의미입니다.
답변2
세게 때리다
names=(
dog_bone
dog_collar
dragon
cool_dragon
lion
lion_trainer
dog
)
declare -A contained # an associative array
for (( i=0; i < ${#names[@]}; i++ )); do
for (( j=0; j < ${#names[@]}; j++ )); do
if (( i != j )) && [[ ${names[i]} == *"${names[j]}"* ]]; then
contained["${names[j]}"]=1
fi
done
done
printf "%s\n" "${!contained[@]}" # print the array keys
dog
dragon
lion
답변3
다음은 Perl 접근 방식입니다. 또한 파일을 메모리에 로드해야 합니다.
perl -le '@f=<>; foreach $l1 (@f){
chomp($l1);
foreach $l2 (@f){
chomp($l2);
next if $l1 eq $l2;
$k{$l1}++ if $l2=~/$l1/;
}
} print join "\n", keys %k' file
답변4
bash
버전 솔루션 은 다음과 같습니다 4.x
.
#!/bin/bash
declare -A output
readarray input < '/path/to/file'
for i in "${input[@]}"; do
for j in "${input[@]}"; do
[[ $j = "$i" ]] && continue
if [ -z "${i##*"$j"*}" ]; then
if [[ ! ${output[$j]} ]]; then
printf "%s\n" "$j"
output[$j]=1
fi
fi
done
done