빅데이터와 데이터 분석
2024. 9. 16. 15:15ㆍpython study/sw와 ai 데이터 분석
빅데이터의 정의
빅데이터(Big Data)
- 기존의 데이터베이스로는 수집, 저장, 분석등을 정상적으로 어려울 만큼의 방대한 데이터
- 빅데이터의 3가지 요소(3V): 크기(volumne), 다양성(variety), 속도(velocity)
빅데이터의 활용
- 의사결정에 도움을 줌
- 의사소통 과정에서 객관적인 자료로 활용 가능
- 눈에 보이지 않는 새로운 사실을 발견할 수 있음
빅데이터 활용 예시
문제 정의
- 심야 시간대에 특정 노선에서 승객 수가 낮거나 과잉 수요가 발생하는 문제를 해결하여, 노선 최적화 및 운행 효율성을 높이기 위한 방안 찾기.
정보 수집
- 승객 탑승 데이터 (심야 버스 이용 시간, 정류장별 승하차 기록)
- 교통량 데이터 (심야 시간 교통 흐름 및 차량 밀도)
- GPS 데이터 (버스 이동 경로 및 소요 시간)
분석 결과
- 수요가 높은 구간에 추가 배차, 수요가 낮은 구간은 배차 간격 조정
- 새로운 노선 신설 또는 기존 노선 통합으로 운행 효율성 증대 정류장 위치 개선 및 승객 안내 시스템 강화
데이터 분석
- 다양한 데이터를 가공하여 유의미한 데이터로 가치를 창출
- 전처리한 데이터를 득정 데이터와 결합하여 관련 비즈니스 분야의 모니터링, 포지셔닝, 분석, 문제해결을 가능하도록 하는 과정
데이터가 주어짐 → 데이터 관계를 파악하거나 관계를 활용 → 새로운 데이터를 만들어 내는 과정
데이터 분석 과정
문제정의 → 데이터 수집 → 데이터 준비 → 데이터 탐색 → 정리 및 결과발표
- 문제 정의
무엇을 분석?
결과가 어디에 왜 필요?
어떤 종류의 데이턱 필요? - 데이터 수집
공공 데이터를 수집하여 활용
데이터 유형과 종류에 따라서 그에 적합한 수집기술 활용 - 데이터 준비
전처리 과정
데이터 여과, 데이터 정제, 데이터 통합, 데이터 축소, 데이터 변환 - 데이터 탐색
변수 간의 관련성, 데이터 분표 여부
그래프를 이용하여 시각적으로 표현 - 정리 및 결과 발표
분석 결과를 정리하여서 발표
'python study > sw와 ai 데이터 분석' 카테고리의 다른 글
| 데이터 분석 도구(colab) & 데이터 기초 (1) | 2024.09.28 |
|---|---|
| 데이터 구성(seaborn data) (1) | 2024.09.26 |
| 데이터 종류와 구조 (2) | 2024.09.16 |
| 인공지능과 데이터 과학 (4) | 2024.09.16 |
| 인공지능의 과거, 현체, 미래 (2) | 2024.09.16 |