ADP실기공부/기초
R함수 mutate 및 rename 함수활용 dplyr패키지 이용하기-4 #데이터전처리
달문달
2023. 3. 22. 14:55
파생변수 추가하기 : mutate()
R함수 사용법
df %>% mutate(변수명=값처리)
df=iris #데이터셋이용
df %>% mutate(total=Sepal.Length+Sepal.Width,
mean=(Sepal.Length+Sepal.Width)/2)
%>% : 파이프 이용의 장점
#동시에 여러개 추가 가능
#추가한 변수 바로 이용가능
df %>% mutate(total=Sepal.Length+Sepal.Width) %>%
arrange(total) %>% head()
#$을 매번 붙여주지 않아도됨
#ifelse조건 사용가능
df %>% mutate( is_setosa=ifelse(Species=="setosa",1,0)
#ifelse(조건, 맞으면 나오는값, 아닐경우 값)
응용예시
df = ggplot2::mpg #데이터셋 이용
df_ans = df %>% mutate(sum=cty+hwy,
mean=sum/2) %>%
arrange(desc(mean)) %>% head(3)
변수명 변경하기 : rename()
df=rename(df, 새변수명=기존변수명)
응용예시
df=iris #데이터셋이용
df=rename(df, sl=Sepal.Length)
df %>% group_by(Species) %>%
summarise(mean=mean(sl))