본문 바로가기

[2016 - 2019] 학부 정리/4학년

[4학년 - 빅데이터기술] R프로그래밍

###split, subset

## 종류별 아이리스를 lapply를 통해 종별 Sepal.Length의 평균을 구할 수 있다.

 split(iris, iris$Species)

 lapply(split(iris$Sepal.Length, iris$Species), mean)


## subset : 조건에 맞는 특정 부분만 찾음

 subset(iris, Species == "setosa")

 subset(iris, Species == "setosa" & Sepal.Length > 5.0)


## select : 특정 열을 선택

 subset(iris, select=c(Sepal.Length, Species))


## merge : 데이터베이스의 조인과 같음

 x<-data.frame(name=c("a","b","c"), math=c(1,2,3))

 y<-data.frame(name=c("c","b","a"), english=c(4,5,6))

 merge(x,y)


## sort : 정렬

 


## order : 정렬하기 위한 색인 순서를 반환


## with


## within