(Ch1) R 준비 과정
2024. 8. 16. 10:42ㆍ확률 통계/R 데이터 분석
데이터 분석 과정
- 문제 정의 및 계획하기: 문제가 정확히 어떠한지를 파악한다면 데이터 분석의 방향을 잃지 않을 수 있다.
- 데이터 수집: 문제를 정의한다면 어떤 데이터가 필요한지 파악하고 데이터를 수집하는 과정을 거쳐야 한다.
- 데이터 정제 및 전처리: 데이터의 단위, 결측값(NA값)을 처리하거나 자료를 병합하거나 데이터의 구조를 변경하는 과정을 거쳐 야한다.
- 데이터 탐색: 간단한 통계 기법을 사용하여서 전반적인 데이터의 내용을 파악하는 단계이다. 예를 들면 한국의 지진 비율이 어떠한지 남녀의 비율을 확인하는지 파악하는 것이 대표적인 데이터 탐색 방법이다.
- 데이터 분석: 데이터 탐색에서 파악한 정보를 통해서 군집 분석, 분류 작업, 주성분 분석, 시계열 분석 등의 기법이 동원된다. 특히 머신러닝과 같은 부분도 이 단계에서 활용된다.
- 결과 보고: 보통 데이터 시각화 과정으로 알려져 있다.
R스튜디오 설치 및 사용
R은 오클랜드대학교의 로스 이하카와 로버트 젠틀맨에 의해서 개발된 S-PLUS의 무료 형태가 소개되었다. 이후에는 다양한 발전을 통해서 패키지 지원이 다양화되고 그래프 작성 지원 등 다양한 부분에서 발전을 이루었다.
R 설치
- https://www.r-project.org/ 을 통해서 사이트에 접속해 준다.
- 왼쪽 상단에 있는 Download 항목에서 CRAN을 선택해 준다.

- Korea 항목을 찾아서 링크를 클릭하고 설치를 진행한다. (운영체제에 알맞은 파일 선)


- install for the first time을 클릭하 다운로드 링크를 눌러 준다.


- 다운로드가 끝났다면 파일을 실행해 주고 언어를 한국어로 선택하고 확인을 누른다.

- 설치 정보가 뜨면 다음을 누르고 나서 경로가 뜬다면 경로를 변경하거나 유지한 다음에 다음을 눌러준다.


- 구성 요소를 모두 선택하여서 설치해 준 다음 스타트 옵션을 No로 선택해 주고 나머지 부분은 다 다음을 눌러서 설치완료 해준다.


R sutdio 설치하기
- R스튜디오 https://posit.co/download/rstudio-desktop/ 에 들어가서 2.Install Rstudio에서 Download RStudio Desktop for windows를 눌러서 다운로드해준다.

- 다운 로드된 파일을 실행시킨 후 전부 다음을 눌러서 설치를 완료시켜 준다.

- Rsutdio를 윈도우 시작 메뉴에서 검색하여서 R스튜디오를 실행해 준다.

'확률 통계 > R 데이터 분석' 카테고리의 다른 글
| (Ch 6) 반복문 (2) | 2024.08.25 |
|---|---|
| (Ch 5) 조건문 (0) | 2024.08.25 |
| (Ch 4) 매트릭스와 데이터프레임 (2) | 2024.08.25 |
| (Ch 3) 변수와 벡터 (6) | 2024.08.18 |
| (Ch 2) R 실행 해보기 (0) | 2024.08.17 |