데이터 시각화란?

2024. 11. 3. 21:46python study/sw와 ai 데이터 분석

데이터 시각화를 하는 이유

  • 많은 데이터를 빠르게 분석가능
  • 시각화를 통한 데이터를 한눈에 습득가능
  • 새로운 패턴을 발견가능
  • 항목 간의 관계 발견가능

막대차트(Bar Chart)

  • 데이터 트렌드 파악
  • 데이터 순위 파악
cf)
비교 데이터가 많으면 수평 막대가 유용함
순위를 강조하려면 오름 차순으로 표현
데이터 구분을 하려면 다른 색상으로 지정

분산형 데이터(Scatter Chart)

  • 직교 좌표계를 이용하여 점들을 표시
  • 두 개의 데이터의 관계를 나타낼 때 유용함
  • 분포 양상을 비교할 때 유용함
cf)
데이터 관계를 나타낼 때는 추세선을 사용하기도 함
변수의 관계가 두 개 이상이면 서로 다른 색상을 사용

선 차트(Plot Chart)

  • 데이터 트렌드의 변화를 확인하는 데 유용함
  • 시간의 흐름에 따른 데이터 변화를 확인하는 데 유용함
cf)
데이터 구분을 위해서 색상 활용
새로 선과 가로선의 눈금과 범위를 적절히 조절할 필요가 있음

파이차트(Pie Chart)

  • 데이터 간 비율 파악할 때 사용함
  • 상대적인 크기를 파악할 때 사용
cf)
핵심 전달을 위해 조각 개수는 한눈에 보일 정도로 해야 함
강조하고자 하는 핵심 정보만 표시

위드 클라우드(WordCloud)

  • 문자열 데이터를 분석할 때 유용함
  • 빈도, 중요도가 높은 텍스트를 강조할 때 사용함
cf)
빈도가 낮은 글자는 제외해 줄 필요가 있음

지도 차트

  • 데이터 지리적으로 비교할 때 사용함
  • 지리적 데이터 변화를 확인할 때 사용함

데이터 시각화를 위한 대표 라이브러리(matplotlib)

  • 데이터를 다양한 형태의 차트로 그려주는 데이터 시각화 패키지
  • 설치: pip install matplotlib
라이브러리 선언: import matplotlib.pyplot as plt
  • seaborn 라이브러리: 22종의 데이터 셋을 제공하고 matplotlib에 비해 손쉽게 그래프를 그리고 스타일 설정 가능

'python study > sw와 ai 데이터 분석' 카테고리의 다른 글

넘파이 활용하기  (0) 2024.11.04
numpy이해와 자료구조  (0) 2024.11.04
데이터 재설정  (0) 2024.09.30
데이터 전처리  (0) 2024.09.29
공공 데이터의 이해  (1) 2024.09.29