안녕하세요 진자이입니다 :) 이번 포스팅에서는 패스트캠퍼스의 세계 3등에게 배우는 실무 밀착 데이터 시각화 강의 내용, 그 중에서도 데이터 시각화 시작하기 내용에 대해 기록하려고 합니다.
OVERVIEW : 태블로 알아보기 & 태블로 실습하기
태블로 알아보기
- 태블로 쓰는 이유 + 태블로 제품군 + 태블로 공부법
태블로 시작하기
- 데이터 연결 + 베이직 실습 + 3가지 핵심 개념(차원과 측정값, 계산방식, 연속형과 불연속형)
- 데이터 연결하는 방법 → 연결 안되는 데이터가 없다!
- ⇒ 태블로를 배우는 이유와 공부법, 기초 시각화 실습, 핵심 개념 3가지를 얻어가자!
태블로를 쓰는 이유?
태블로의 탄생 목적은 시각적인 분석(Visual Analysis)에 있다. 또한, 태블로의 슬로건은 'SEE and UNDERSTAND DATA'인 만큼, 누구나 데이터를 보고 이해할 수 있게 하는 데에 목적이 있다. (내가 기술블로그를 작성하고 있는 이유도 마찬가지이다.
태블로의 장점
- NO Code : 코드를 작성하지 않는다
- Interactivity : 상호작용이 매우 뛰어나다
- Speed : 매우 빠른 속도로 시각화가 가능하다
- Visual Technology : X와 Y좌표만 있다면, 무엇이든지 표현할 수 있다
- Community : 공부, 피드백을 활용할 수 있는 다양한 커뮤니티가 있다(TableauPublic, MakeoverMonday, TableauTipTuesday, WorkoutWednedsay 등)
태블로 Product 에코시스템
태블로 제품군
- 데이터 전처리 → Tableau Prep : 데이터 전처리 워크플로우를 설계하는 엔지니어링 툴
- 데이터 시각화 → Tableau Desktop : 데이터를 시각적으로 분석
- 파일 읽기 → Tableau Reader
- 파일 업로드 → Tableau Server/Online : 조직 내 대시보드 배포 및 관리
- 파일 업로드 → Tableau Public : Desktop의 무료 버전 및 온라인 대시보드 갤러리 커뮤니티
Pricing Model
- Creator : Desktop + Prep + Server
- Explorer : Server
- Viewer : Server
태블로 제품군 활용 예시
태블로 공부법
- 태블로 공식 홈페이지 도움말 & 자습서 & 교육 동영상 & 백과 : 태블로 계의 교과서!
- 인터넷 강의 & 책 → Udemy / Coursera 태블로 강좌, 스티브 웩슬러 책, O'Reilly 책 추천(대스보드 설계와 데이터 시각화)
- 커뮤니티 예) Tableau Reference Guide(참고 자료 모음집), 트위터/링크드인에 #Datafam 검색
- 커뮤니티 미션 Makeover Monday / RealWorldFakeData / Workout Wednesday
- Tableau Public : 마음에 드는 대시보드를 별표 및 다운로드해서 어떤 방식으로 시각화했는지 살펴보기
태블로 시작하기 - 데이터 연결
(개인적인 내용) Tableau for Students를 이용 중이고, 메일로 온 라이센스 키 번호를 'Desktop - 키 번호 입력' 을 통해 Desktop 버전을 이용할 수 있다. 일반적으로는 Tableau 무료 버전이 이용 가능하지만, 개인 PC에 작업 저장이 불가능하고 기본적인 데이터만 이용가능하다.
데이터 연결하기 : 파일 데이터를 연결하는 방법과 서버 데이터를 연결하는 방법이 있다.
파일 데이터 연결하기
- 데이터가 자주 업데이트 되지 않는 경우 or 일회성 ad-hoc 사용가능 경우
- 파일 데이터 종류 : excel, csv, txt, json, pdf, shp file, sas, spss, r, 저장된 데이터 원본(Tableau 기본제공), Hyper, TDE
- 저장된 데이터 원본 > 문서 내 Tableau 리포지토리 > 데이터 원본 > 버전명 > ko_KR-APAC
서버 데이터 연결하기
- 실시간 대시보드를 만드는 경우
- 데이터 업데이트와 스키마 변경이 빈번할 때
- 보안이 중요한 데이터(권한)
- 서버 데이터 종류 : Tableau Server, MySQL, Google BigQuery, Google SpreadSheet, Salesforce
저장된 데이터 원본
문서 내 Tableau 리포지토리 > 데이터 원본 > 버전명 > ko_KR-APAC
태블로 베이직 실습 - 데이터 원본
데이터 원본 창 → 데이터 관계
데이터 관계는 데이터 분석을 위해 여러 테이블에서 데이터를 결합하는 방법으로, 조인 유형을 선택할 필요가 없다. 분석 중에 사용되는 필드를 기반으로 적절한 조인을 자동으로 만든다 조인과 달리 테이블로 병합되지 않고, 각 테이블을 유지하기 때문에 집계 값이 중복되지 않는다..
데이터 원본 새로 고침
- 데이터 메뉴 > 새로 고침 > 업데이트 가능
- 라이브 : 데이터베이스에 쿼리를 보내고 결과에 따라 뷰 업데이트
- 추출 : 성능향상을 위해 데이터를 로컬로 저장(오프라인)
핵심개념 1 차원과 측정값
- 차원 : 나눠서 볼 기준 (지역별, 연도별, 성별) → 숫자를 자르는 기준 → 범주형 데이터!
- 측정값 : 값(매출, 수익, 배송비) → 숫자 (수치형 데이터)
=> 차원과 측정값이 함께할 때 인사이트가 생긴다(ex 전체 매출 합계보다는 지역별 매출 비교가 인사이트!)
측정값을 행/열에 옮기면 기본적으로 측정값을 집계(합계, 평균, 최소, 최대 등)한다. 하지만, 차원을 행/열에 옮기면 기본적으로 차원으로 데이터를 쪼갠다 페이지 선반/마크/행/열/워크시트에 추가하면 뷰의 세부 수준에 영향을 준다.
핵심개념 2 연속형 불연속형
파란색과 초록색 컬럼의 차이? : 차원과 측정값이 아니다! 불연속형 데이터와 연속형 데이터의 차이!
불연속형 데이터는 개별적으로 구분되는 데이터로, 머리글(Header)의 역할로 각각 유니크해서 오름/내림차순 정렬이 가능한 데이터를 일컫는다. 연속형 데이터는 연속적 순서가 있는 데이터로 축(Axis)의 역할로 연속된 순서가 있어서 오름/내림 차순 정렬이 불가능하다. 축 기준으로, 오른쪽 마우스를 눌렀을 때도 이용할 수 있는 기능이 모두 다르며 색상 마크에 올려놓았을 때 연속형은 그라데이션으로, 불연속형은 다른 색상이 매핑된다.
핵심 개념 3 집계 방식
Row-level과 Aggregate-level로 나뉘며, 두 개의 Profit Ratio 계산 방법에는 차이가 있다. 이는 해당 마크를 클릭해서 데이터 보기를 하면 알 수 있다. Row-Level은 따로따로 계산해서 합한 것이다.
'VISUALIZATION' 카테고리의 다른 글
[Tableau] 이중 축 차트(Dual Axis Chart) (0) | 2023.07.10 |
---|---|
[Tableau] 막대 차트(Bar Chart) - 그룹 막대 | 누적 막대 | 비율막대 (0) | 2023.07.10 |
[Tableau] 기본 라인차트(Line Chart) 그리는 법 | 추세선 적용하기 (0) | 2023.07.10 |
[Fastcampus/Tableau] 좋은 워크시트의 기본 개념 갖추기 (0) | 2023.07.06 |
[Fastcampus/Tableau] 데이터 시각화와 스토리텔링 (0) | 2023.06.30 |