
열의 값을 기준으로 각 데이터 포인트가 다른(다른 아이콘, 다른 색상 등) 분산형 차트를 만들고 싶습니다.
저는 분류 모델을 배우고 있는데 (1) x축과 y축에 두 개의 독립 변수를 매핑하고 (2) 세 번째 독립 변수를 기반으로 데이터 포인트를 변경하는 분산형 차트를 Excel에서 만들고 싶습니다.
예: 오류(이메일의 철자 오류), 수신자(이메일의 받는 사람 섹션에 있는 수신자 수), 스팸(스팸 메시지의 경우 1, 스팸이 아닌 메시지의 경우 2)이라는 세 개의 열이 있는 테이블이 있습니다. 메시지). 다음과 같습니다:
Errors, Recipients, Spam
20,200,1
18,175,1
32,100,1
15,123,1
2,10,0
5,8,0
9,27,0
15,20,1
15,20,0
8,300,0
9,357,1
오류가 많은 메시지를 한눈에그리고수신자가 높을수록 스팸일 가능성이 더 높습니다. 오류가 적고 수신자가 적은 메시지는 스팸이 아닐 가능성이 높습니다. 높은 혼합과 낮은 혼합이 포함된 메시지는 예측하기 어렵습니다. 나는 그것을 산점도로 보여주고 싶습니다.
Y축에 오류가 있고 X축에 수신자가 있는 분산형 차트를 만들 수 있습니다. 또한 스팸 셀이 1인지 0인지에 따라 각 데이터 포인트를 "+" 또는 "-"로 변경해야 합니다.
모든 데이터 포인트의 모양을 변경하고 개별 데이터 포인트를 수동으로 변경하는 것이 가능하다는 것을 알고 있습니다. 하지만 열 값을 기준으로 데이터 요소의 모양을 조건에 따라 자동으로 변경할 수 있습니까?
답변1
Excel에는 차트에 대한 조건부 서식이 없습니다(실제로는 있어야 하지만). 이를 달성하는 가장 좋은 방법은 다음과 같습니다.
1) 데이터를 Excel 표로 변환합니다(매번 수행해야 함).
2) 두 개의 도우미 열인 +와 -를 추가합니다.
3) 이 수식을 도우미 열에 추가합니다.
+=IF([@[ Spam]]=1,[@[ Recipients]],NA())
-=IF([@[ Spam]]=0,[@[ Recipients]],NA())
4) Y 데이터의 + 및 - 열을 사용하여 차트를 만듭니다.
또한 겹치는 점(예: 15,20)을 처리하는 방법을 고려해야 합니다. 데이터 선택 대화 상자에서 플롯 순서를 조정하거나 중복을 처리하는 다른 기호(예: + 및 x)를 고려할 수 있습니다.