15
R 을 을을을 을을을을 을을 / 을을을 을 을을을 을을을을을 을을을을을을을 . 을을을을

R 을 이용한 통계분석

Embed Size (px)

DESCRIPTION

R 을 이용한 통계분석. 소속 / 작성자. 이 문서는 나눔글꼴로 작성되었습니다 . 설치하기. 목차. 데이터 불러오기 데이터 분석하기. 1. 데이터 불러오기. 데이터 입력에는 두가지 정도 방법이 있다. 직접입력하 기 - 앞서 배운 data.frame 또는 matrix 를 통해 입력 - 직접 입력하는 방법은 소규모 자료 분석시 이용. 파일을 통해 불러오기 - read.csv 또는 read.table 을 통해 불러오기. 1. 데이터 불러오기. - PowerPoint PPT Presentation

Citation preview

R 을 이용한 통계분석

소속 / 작성자

이 문서는 나눔글꼴로 작성되었습니다 .

설치하기

목차

1. 데이터 불러오기

2. 데이터 분석하기

1. 데이터 불러오기

직접입력하기 - 앞서 배운 data.frame 또는 matrix 를

통해 입력 - 직접 입력하는 방법은 소규모 자료 분석시

이용

데이터 입력에는 두가지 정도 방법이 있다

파일을 통해 불러오기 - read.csv 또는 read.table

을 통해 불러오기

1. 데이터 불러오기1. 지정된 디렉 토리 에서 가지고 오기-getwd()

- 파일은 지정된 디렉토리에서 불러와야 함

※setwd(“ 경로” ) 를 통해 변경 가능

1. 데이터 불러오기

파일을 통해 불러오기

-read.csv(“ 파일명 .csv”)- 지정된 디렉토리에 파일이 있을경우

-read.csv(“ 경로 / 파일명 .csv”)- 지정된 디렉토리에 파일이 없는경우

Txt 파일일 경우-read.table(“ 파일명 .txt”) 로 불러옴Tip! Help( 명령어 ) 시 명령어에 따른 다양한 옵션을 볼수있음

1. 데이터 불러오기Help(read.csv)

- 명령어 옵션 변수 , 변수설명 , 사용예제 등을 확인할수 있음

2. 데이터 분석하기

- 분석하고자 하는 변수가 연속형인가 ? 범주형인가 ?

2. 데이터 분석하기- 연속형 자료

요약통계량으로 최대값 , 최소값 , 평균 , 분산 ,표준편차를 계산- 범주형 자료

요약통계량으로 백분율 등을 계산

- 분석하고자 하는 데이터가 어떤 형인가에 따라 분석기법은 달라짐

2. 데이터 분석하기- summary()

- 최소값- 1 분위수- 중앙값- 평균- 3 분위수- 최대값

2. 데이터 분석하기- 표본수 length()

- 평균 mean()

- 분산 VAR()

- 표준편차 sd() - 얼마나 모집단을 대표하는가 ?

2. 데이터 분석하기- 표준오차 sd()/sqrt(legnth())- 표본을 신뢰할수 있는가 ?

- 사분위수 fivenum()

2. 데이터 분석하기- Boxplot boxplot()

min

max

1Q

3Q

median

윗 값은 boxplot(1:31) 의 값임

2. 데이터 분석하기- 히스토그램

- hist(a$PLT,probability=TRUE)- Lines(density(a$PLT))

2. 데이터 분석하기- 줄기 잎그림

- stem(a$PLT)

2. 데이터 분석하기- Q-Q Normality plot

- qqnorm(a$PLT)- qqline(a$PLT)