R로 데이터분석을 하실때
주로 csv확장자의 엑셀파일을 읽어들여
분석을 진행하시게 됩니다.
이를 위한 기본세팅 문법들을 공유드려요.
가장먼저
한글이깨지는걸 방지하기위해
R STUDIO에서 다음 설정이 필요합니다.
한글깨짐방지
global options > code > saving > UTF-8
csv 엑셀파일 입출력에 관한 기본 문법들
파일을 불러들여오실때
변수(빈 그릇)에 저장해주는 꼴로 불러오면 됩니다.
#변수명 : df
df = read.csv("파일명.csv")
head(df, 6)
#상위 6행까지 파일내용이 간단히 표현됩니다.
tail(df , 6) #하위 6행
이때 읽어들이는 파일이
R의 워킹디렉토리와 동일한 위치에 있어야 합니다.
R 엑셀파일이 있는 위치로 디렉토리 설정
R Studio에서 워킹디렉토리를 생성할 수 있습니다.
file>New Project >existing directory>분석에 사용할 엑셀파일이 들어있는 폴더로 경로 설정
혹은 함수를 이용해 변경하는 방법이 있습니다.
getwd() # 현작업디렉토리 추출
#엑셀파일이 있는 경로와 다른지 확인 합니다.
setwd("주소") # 현작업디렉토리 주소 변경
#다르다면 엑셀파일이 있는 경로로 수정합니다.
그후
df= read.csv("파일명.csv") #파일을 불러옵니다.
,fileEncoding = "UTF-8-BOM"
#만일 여전히 한글이 깨진다면 다음 옵션 추가하기
,na.strings = c("NA", "." , "null" , "NULL")
#간혹 NA가 글자로 인식되어 null처리가 안되는데, 해당 경우를 입력해 NA 처리해주기
write.csv(df , "파일명.csv", row.names=false) #저장 #저장위치는 setwd("주소")로 설정가능
'ADP실기공부 > 기초' 카테고리의 다른 글
R 사분위수 이상치 공식 및 데이터분석을 위한 전처리 코드 (0) | 2023.03.17 |
---|---|
R함수 파생변수 요약변수 생성 #데이터전처리 (0) | 2023.03.16 |
표본추출 샘플링을 위한 R함수와 패키지들 (0) | 2023.03.16 |
결측치 처리를 위한 R함수 #데이터전처리 (0) | 2023.03.16 |
데이터전처리에 유용하게 쓰이는 암기해야할 R함수들 (1) | 2023.03.16 |