
100,000개 행의 데이터세트가 있습니다. A 열에 그룹 이름이 포함된 다음 해당 그룹의 고유 구성원 수만큼 그룹 이름이 반복되는 방식으로 설정됩니다. 값이 두 번 나타나는 횟수와 두 번만 나타나는 횟수를 계산하려고 합니다.
- 값은 한 번만 표시되지 않습니다. 개별 행에는 해당 그룹에 얼마나 많은 구성원이 있는지에 따라 바로 뒤에 항상 "그룹 이름"이 표시됩니다. 따라서 고유한 엔터티에는 항상 최소 2개의 행이 있습니다.
- 대개 값은 3번 이상 나타납니다.
- 해당 값이 3번 이상 나타나면 포함하고 싶지 않습니다.어느카운트에 있는 해당 행의 수입니다. 저는 실제로 별개의 쌍이 나타나는 횟수를 찾고 있습니다.
답변1
b열에 다음 수식을 복사합니다.
=COUNTIF($A$1:$A$100000,A1)=2
그러면 모든 쌍이 식별됩니다. 그러나 쌍의 두 항목이 모두 표시됩니다. 이러한 경우에 제가 일반적으로 하는 일은(데이터 섭리를 깨뜨리더라도) 이 필터링된 목록을 다른 시트에 복사하고 중복 항목을 제거하는 것입니다.
섭리를 유지하면서 반복 가능한 방식으로 이 작업을 수행하려면 카운트를 수행한 후 고유한 목록 유형 배열 수식을 사용하는 것이 좋습니다.
옵션 B는 피벗 테이블을 사용하여 행의 A열에 값을 배치하고 값에 count(A)를 배치하고 count=2인 값에서 행을 필터링하는 것입니다.
답변2
데이터가 A1:A100000에 있다고 가정합니다.
1) 모든 고유 값을 별도의 열에 복사합니다(데이터 -> 고급 필터 사용). 예에서는 C열을 사용하겠습니다.
2) 다음 수식을 입력합니다. =Countif(A$1:A$100000, C1)
D1에 C의 모든 고유 값에 대해 D의 각 셀을 채웁니다.
3) 다른 셀에서 다음 수식을 사용합니다. =Countif(D1:D??, 2)
(여기서 ??는 C열과 D열의 마지막 행입니다.)