ADP실기공부/기초

R함수 mutate 및 rename 함수활용 dplyr패키지 이용하기-4 #데이터전처리

달문달 2023. 3. 22. 14:55


파생변수 추가하기 : mutate()

R함수 사용법

df %>% mutate(변수명=값처리)

df=iris #데이터셋이용
df %>% mutate(total=Sepal.Length+Sepal.Width,
mean=(Sepal.Length+Sepal.Width)/2)

%>% : 파이프 이용의 장점


#동시에 여러개 추가 가능

#추가한 변수 바로 이용가능
df %>% mutate(total=Sepal.Length+Sepal.Width) %>%
    arrange(total)  %>% head()

#$을 매번 붙여주지 않아도됨

#ifelse조건 사용가능
df %>% mutate( is_setosa=ifelse(Species=="setosa",1,0)
#ifelse(조건, 맞으면 나오는값, 아닐경우 값)

응용예시

df = ggplot2::mpg  #데이터셋 이용

df_ans = df %>% mutate(sum=cty+hwy,
     mean=sum/2) %>%
    arrange(desc(mean)) %>% head(3)

변수명 변경하기 : rename()


df=rename(df, 새변수명=기존변수명)

응용예시

df=iris #데이터셋이용

df=rename(df, sl=Sepal.Length)
df %>% group_by(Species) %>%
    summarise(mean=mean(sl))