분석 노트/Data Visualization

[Tableau] Chap2. 태블로 기초

yourhm 2022. 9. 8. 20:24
✔️ '데이터 시각화를 위한 태블로' boostcourse 강좌를 학습하며 정리, 요약한 내용의 포스팅입니다.

 

Ep.5 태블로 부분 전체 분석

전체에서 각 멤버들의 비중을 구할 때 적합한 방식

 

퀵 테이블 계산 > 구성비율

 

- 누적 막대차트

- 파이 차트

- 도넛 차트: 이중 축 기능을 사용하여 만든다.

- 트리맵 : 비슷한 비중의 멤버가 많은 경우 파이 차트나 도넛 차트는 비교가 어렵기때문에 대안으로 트리맵을 사용할 수 있다.

 

 

 

Ep.6 태블로 상관 관계 분석

분산형 차트(scatter plot)는 측정값 간의 관계를 파악하기 위한 시각화의 한 방식이다. 분산형 차트를 만들기 위해서는 차원값은 없어도 있어도 상관 없으나, 적어도 두개 이상의 측정값은 반드시 필요하다.

 

(1) '분산형 차트' 만들기

 열선반과 행선반에 각각 측정값을 올리면 자동으로 분산형 차트가 생성된다.

 차원값을 '세부정보'에 올려서 관측개체들을 확인한다.

 마크들이 겹쳐져 있더라도 개별적인 원으로 구별하기 위해 마크 모양은 '원'으로, 테두리는 흰색으로, 색상은 '불투명도'를 적용하는 것이 좋다.

 열선반과 행선반에 올렸던 측정값에 대해 특정한 기준으로 색을 다르게 나타내고 싶다면 해당 측정값을 마크의 '색상'에 올릴 수 있다. 그 다음 색상 패널에서 기준은 원하는대로 설정할 수 있다.

 

 

(2) '데이터 설명' 기능 확인하기

 분산형 차트에서 확인하고 싶은 데이터가 있다면 해당 데이터를 클릭한 다음, 전구 모양 아이콘의 '데이터 설명' 기능을 확인해볼 수 있다.

'데이터 설명' 기능은 AI 의 힘을 활용하여 뷰 내의 특정 요소를 설명함으로써 기존에 찾지 못했던 왜(Why) 를 발견하도록 도와준다.

 고급 통계 모델인 베이지안 방법론을 기반으로 통계적으로 의미있는 설명을 제공하며, 일반적인 추세에서 벗어나 막연한 질문에 대한 대답 대신 궁극적인 원인을 찾도록 도와준다.

 

 

(3) '매개 변수' 기준으로 움직이는 동적 차트로 만들기

 좌측 사이드바 우측 상단 아래 세모 옵션(▾) - 매개 변수 만들기를 사용하여 매개 변수를 생성하자. 데이터 유형과 값의 범위, 단계 크기를 설정하자.

매개 변수를 생성했다면, 좌측 사이드바 아래 매개 변수에서 마우스 오른쪽 - [매개 변수 표시]에 체크하자.

관측개체를 확인하게 위해 분산형 차트 '세부정보'에 올릴 차원값에서 마우스 오른쪽 - 만들기 - 집합을 선택하여, 집합에 대한 조건을 추가하자. 여기서 매개 변수를 기준으로 색깔이 적용될 집합의 조건을 설정해야한다.

 예를 들어 행선반에 올린 측정값은 '수익' 이고, 매개 변수도 '수익'으로 생성했다고 하자.

     - 생성한 매개 변수 이름: p. 수익

     - 조건의 수식 기준: SUM([수익]) >= [p. 수익]

참조선을 추가하여 더 명확하게 구별하여 보고 싶다면, 좌측 사이드바 분석 패널 - 사용자 지정 - 참조선을 드래그해서 테이블 참조선 위에 놓는다. 라인: 값 부분을 해당 매개변수로 변경한다.

 

 

 

Ep.7 태블로 이중 축 vs 결합된 축

이중 축

 하나의 뷰 안에서 축을 양쪽에 이중으로 써서 차트를 만들 때 사용할 수 있다.

이중 축은 마크를 서로 다르게 구성이 가능하다.

 양쪽 이중축을 동일하게 하려면: 축 마우스 오른쪽 - [축 동기화]

 

결합된 축

• 하나의 뷰에서 한쪽에 축을 결합(또는 공유)하는 형태로 사용할 수 있다.

결합된 축은 마크가 동일하게 구성되어야 한다.

 

 

 

Ep.8 태블로 그룹 vs 집합

그룹은

항목들을 여러 그룹으로 묶을 수 있지만,

 

집합은

집합에 포함되는지 아닌지로만 구분한다. (IN/OUT)

두 개의 집합을 결합된 집합으로 만들 수 있다.

 

 

 

Ep.9 태블로 테이블 구성하기

계층

• 계층을 만들면 화면에서 드릴 다운하여 값을 세부적으로 찾는데 유용하다.

     - 날짜: 연 > 월 > 일 ⇒ 날짜는 자동으로 계층이 만들어짐.

     - 지역: 나라 > 시도 > 시군구   우리나라 기준 시군구는 '카운티'로 설정하기.

     - 상품: 대분류 > 중분류 > 소분류

 

총계

 각각의 요소들의 총 값을 보여주기 위해 총합계, 소계, 열과 행 기준으로 각각 표시할 수 있다.

• 분석 패널과 분석 메뉴에서 설정할 수 있다.

 

 

Ep.10 태블로 맵 만들기

• 나라명, 시도 이름, 시군구 이름, 주 이름, 도시 이름 등 과 같은 큰 단위의 지명으로 된 차원값에 지리적 역할을 부여하면 해당 데이터를 맵 차트로 표현할 수 있다.

단 도시나 시군구와 같은 비교적 하위 레벨 기준으로 바로 맵 차트를 만들면 중복된 지명을 갖는 데이터의 경우 제대로 표현 되지 않는다. 예를 들어 강서구는 서울특별시, 부산광역시에 모두 있는 지명으로 강서구 그 자체만 가지고는 맵 차트에 표현이 불가능하다. 따라서 상위 레벨과 항상 계층을 설정하여 맵 차트에 표현하는 것이 중요하다.

그 외에 읍면동과 같은 작은 단위의 지점 위치를 표현하고 싶다면, 위도와 경도 값을 갖고 있거나 별도의 공간(shp파일)과 조인해서 표현 가능하다.