[4학년 - 빅데이터기술] R프로그래밍

1. factor : 범주형 데이터	2. vector : 배열과 유사, 한가지 타입 data가 순서대로 저장
gen <- factor("m",c("m", "f"))	c(1,2,3) == c(1:3) == x<-1:3 모두 가능 seq(1,10,2) 홀수 "a" %in c("b","a","c") 집합연산 setdiff(c( ),c( )) rep( )
3. list : 서로 다른 데이터 타입 가능, (키, 값)	4. matrix : 2차원의 벡터, 원소의 타입이 동일한 데이터
x <- list (name="lee", height = 70) name 은 키값, "lee" 는 value x$name : 키값으로 접근 x[1] : sublist x[[1]] : 값 반환	matrix(1:9, nrow=3) matrix(c(1,2,3,4,5,6,7,8,9), nrow=3, byrow = TRUE) matrix(1:9, nrow=3, dimnames=list(c("a1","a2","a3"),c("b1","b2","b3"))) rownames(x) <- c("a1","a2","a3") colnames(x) <- c("b1","b2","b3") 2번째 컬럼의 값이 5보다 큰 값 출력 x[x[ , 2] >= 5, ] 전치 행렬 : t(x)
5. data frame : DB의 테이블과 같은 형태, 타입은 상관 없다.	6. array : n차 행렬
한번에 데이터 프레임에 넣기 d <- data.frame(x=c(1,2,3,4,5), y=c(2,4,6,8,10)) d x y 1 1 2 2 2 4 3 3 6 4 4 8 5 5 10 d<-data.frame(x=c(1:5), y=seq(2,10,2), z=c('M','F','M','F','M')) $열이름 <- : 으로 추가 할 수 있음	matrix(1:12, ncol=4) == array(1:12, dim=c(3, 4)) 223차원의 배열 만들기 array(1:12, dim=c(2,2,3))

class(c(1,2)) -> 타입판별

rm(list=ls()) 제거

비니닷컴