본문 바로가기

[2016 - 2019] 학부 정리/4학년

[4학년 - 빅데이터기술] R프로그래밍


 1. factor : 범주형 데이터 

 2. vector : 배열과 유사, 한가지 타입 data가 순서대로 저장

  gen <- factor("m",c("m", "f"))

 c(1,2,3) == c(1:3) == x<-1:3 모두 가능

 seq(1,10,2) 홀수

 "a" %in c("b","a","c")

 집합연산

 setdiff(c( ),c( ))

 rep( ) 

 

 3. list : 서로 다른 데이터 타입 가능, (키, 값) 

 4. matrix : 2차원의 벡터, 원소의 타입이 동일한 데이터

 

 x <- list (name="lee", height = 70)

 name 은 키값, "lee" 는 value 

 

 x$name : 키값으로 접근

 x[1] : sublist

 x[[1]] : 값 반환



 matrix(1:9, nrow=3)

 matrix(c(1,2,3,4,5,6,7,8,9), nrow=3, byrow = TRUE)

 matrix(1:9, nrow=3,   dimnames=list(c("a1","a2","a3"),c("b1","b2","b3")))

 

 rownames(x) <- c("a1","a2","a3")

 colnames(x) <- c("b1","b2","b3")


 2번째 컬럼의 값이 5보다 큰 값 출력

 x[x[ , 2] >= 5, ]

 전치 행렬 : t(x)


 5. data frame : DB의 테이블과 같은 형태, 타입은 상관  없다.

 6. array : n차 행렬

 한번에 데이터 프레임에 넣기

 d <- data.frame(x=c(1,2,3,4,5), y=c(2,4,6,8,10))

 d

  x  y

   1 1  2

   2 2  4

   3 3  6

   4 4  8

   5 5 10


 d<-data.frame(x=c(1:5), y=seq(2,10,2), z=c('M','F','M','F','M'))
 $열이름 <- : 으로 추가 할 수 있음


 


 matrix(1:12, ncol=4) == array(1:12, dim=c(3, 4))


 2*2*3차원의 배열 만들기

 array(1:12, dim=c(2,2,3))

 





 


  


 


class(c(1,2)) -> 타입판별

rm(list=ls()) 제거