본문 바로가기

전체 글

(97)
[4학년 - 빅데이터기술] R프로그래밍 ※ 강의 자료만 보기, 2,3,4,6,7 장, 연습문제 위주, (iris, boston, ozon, state.x77)얘네 나옴 1. state.x77 1) data("state") 2) 문제 - 3번째 행과 8번째 열이 교차하는 원소 추출하기 state.x77[3, 8] - 5, 22, 44행과 1, 4, 7열에 해당하는 값 추출하기 state.x77[c(5,22,44), c(1,4,7)] - 5행부터 49행 까지를 제외한 나머지 행과 3열부터 5열까지의 원소 추출하기 state.x77[-c(5:49),c(3:5)] - state.x77의 두 번째 열인 income이 4000보다 큰 것만 추출하기 state.x77[state.x77[,2] > 4000,] 2. iris - data.frame 1) da..
[4학년 - 빅데이터기술] R프로그래밍 ###split, subset## 종류별 아이리스를 lapply를 통해 종별 Sepal.Length의 평균을 구할 수 있다. split(iris, iris$Species) lapply(split(iris$Sepal.Length, iris$Species), mean) ## subset : 조건에 맞는 특정 부분만 찾음 subset(iris, Species == "setosa") subset(iris, Species == "setosa" & Sepal.Length > 5.0) ## select : 특정 열을 선택 subset(iris, select=c(Sepal.Length, Species)) ## merge : 데이터베이스의 조인과 같음 x
[4학년 - 빅데이터기술] R프로그래밍 apply 계열 함수들apply( ) lapply( ) 적용 : 배열, 행렬 (벡터 적용 안됨!) 결과 : 벡터, 배열, 리스트 방향 : 1-행, 2-열 / apply(data, 방향, 함수) # sum 함수 sum(1:10) # matrix 행렬 d
[4학년 - 빅데이터기술] R프로그래밍 그래프 그리기 ■ 산점도 : plot(x, y)install.packages("mlbench")library(mlbench)data(Ozone)str(Ozone)plot(Ozone$V8, Ozone$V9) ■ 그래프 옵션 □ 축 이름 (xlab, ylab)plot(Ozone$V8, Ozone$V9, xlab = "Sandburg Temp", ylab = "El Monte Temp") □ 그래프 제목 (main = )plot(Ozone$V8, Ozone$V9, xlab = "Sandburg Temp", ylab = "El Monte Temp", main="Ozone") □ 점의 종류(pch)plot(Ozone$V8, Ozone$V9, xlab = "Sandburg Temp", ylab = "El Monte..
[4학년 - 빅데이터기술] R프로그래밍 1. factor : 범주형 데이터 2. vector : 배열과 유사, 한가지 타입 data가 순서대로 저장 gen
[4학년 - 빅데이터기술] R프로그래밍 R연습문제 2장 연습문제 ## chapter_2 # ex.1 # 벡터를 오름차순 혹은 내림차순으로 정렬 # - 오름차순 > ordered(fruits) [1] apple melon banana grape tomato potato Levels: apple sort(fruits) [1] "apple" "banana" "grape" "melon" "potato" "tomato" # - 내림차순 > b b [1] "tomato" "potato" "melon" "grape" "banana" "apple" # 벡터변수의 짝수 혹은 홀수번째 성분만 추출하기 ★ > fruits[seq(2,6,2)] [1] "melon" "grape" "p..
[4학년 - 빅데이터기술] R프로그래밍 데이터 조작 : iris데이터, csv 파일 입출력, apply()함수들, 여러 함수들-모든객체 삭제-rm(list = ls()) 1. iris데이터 사용하기 head(iris) - 붓꽃 데이터가 데이터 프레임으로 저장되어 있음 iris3 - 3차원 배열 형태로 저장되어 있음 다양항 데이터 셋 보려면 : library(help=datasets) 실전 데이터를 사용할 때 : data(데이터 셋 이름) 2. 파일 입출력 (csv파일) ?? 이해 X -> ppt.6 document에 csv파일 직접 저장하면 read.csv("파일명.csv")로 불러올 수 있다. ### csv파일로 저장 > write.csv(x, "b.csv", row.names = F) > read.csv("b.csv") id name sc..
[4학년 - 빅데이터기술] R프로그래밍 [데이터 타입] 변수, 스칼라, 벡터, 리스트, 행렬, 배열, 타입판별, 타입변환 1. 변수 1) 기초 데이터 타입 - integer : 정수 - numeric : 실수 - character : 문자열 - logical : 논리형(부울형) - complex : 복소수 2) 복합 데이터 구조 타입 - 벡터(vector) - 행렬(matrix) - 데이터프레임(data frame) - 리스트(list) 2. 스칼라 1) 정수, 부동 소수 모두 지원 > a b c c 2) NA(결측치) : 값이 존재하지 않음 > one two three four is.na(four) #결측치인지 확인 [1] TRUE 3) NULL : 변수가 초기화 되지 않은 경우 > x is.null(x) #null값인지 확인 4) 문자열 ..