본문 바로가기
VISUALIZATION

[Tableau] 분산형 차트(Scatter Chart)

by 진자이 2023. 7. 10.

안녕하세요 진자이입니다 :) 이번 포스팅에서는 데이터의 분포와 상관관계를 파악할 때 유용한 분산형 차트에 대해 기록해보고자 합니다.

 

 

분산형 차트

행, 열 선반에 각각 1개 이상의 측정값을 활용해 해당 데이터가 어떻게 분포돼 있는지 파악할 수 있는 차트이다. 여러 마크 유형(색상, 크기 등)을 활용해 세부 정보를 추가적으로 표현하는게 가능하다. 데이터의 분포 위치를 표현하거나 상관관계를 파악할 때 사용한다. 분산형 차트를 구성하기 위해서는 1개의 차원 필드와 2개의 측정값 필드가 반드시 필요하다. 이번 실습에서는 도시를 기준으로 4가지 데이터(수익, 매출, 평균 할인율, 수량)를 한 눈에 시각화 해본다. 

 

 

기본 세팅

이제, 기본적인 차트 그리는 방법에 대해 알아본다. 먼저, 태블로 시트 빈 화면을 가져온다. 데이터는 슈퍼스토어 - 샘플 파일의 [주문] 시트를 이용한다. 데이터는 Tableau가 실습할 때 사용하라고 설치해둔 엑셀 파일을 모아둔 [저장된 데이터 원본]에서 가져올 수 있으며, [Sample - Super Store]를 누르면 된다. 한국어 [슈퍼스토어 - 샘플] 누르면 한국 상황에 맞게 번역된 파일로 열린다. 

 

분산형 차트 실습

이번 실습에서는 도시별로 매출과 수익의 상관관계를 파악할 예정이므로, [매출] 필드를 열 선반, [수익] 필드를 행 선반에 놓는다. 이후, 마크 유형을 원으로 바꿔주고 세부 정보에 [도시] 필드를 드래그한다.

 

다음으로, 각 도시에 적용된 평균 할인율에 따라 색상을 변경하고자 한다. [할인율] 필드를 색상 카드 위로 옮기고, 측정값(합계)를 측정값(평균)으로 바꿔준다.

 

 

할인율에 따라 원 색상이 더 잘 보이기 위해, 색상 마크 카드를 선택하고 [색상 편집]에서 색상을 다음과 같이 바꿔준다.

 

 

마지막으로, 수량에 따라 원의 크기를 달리 하기 위해 [수량] 필드를 마크 카드 위의 [크기]로 옮겨준다. 또한, 마크 카드 위의 [도시]를 ctrl한 상태로 [레이블] 위로 드래그하여 도시 텍스트가 출력되로록 설정한다.

 

 

완성된 차트는 다음과 같다