기본 콘텐츠로 건너뛰기

R 기초_ 외부 데이터 읽어오기

1. 텍스트 data 읽기
2. CSV data 읽기
3. 엑셀 data 읽기


#1. 텍스트 data
   확장자: .txt
   구분자(separator): 공백, 콤마, 탭

* read.table() 함수 사용
read.csv와는 다르게 첫 번째 행을 헤더로 읽어들이지 않음!

[read.table() 함수 사용법]

na.strings ::  na.strings="None", na.strings=c("-",",") 

 -구분자가 공백인 경우 : sep=" "
 -구분자가 콤마인 경우 : sep=","
 -구분자가 탭으로 구분된 경우 : sep="\t"


#2. CSV data
  :엑셀 데이터의 특별한 형태
  (Comma Separated Value)

* read.csv() 함수 사용


#3. 엑셀 data
  :엑셀 데이터를 읽어오는 함수가 없기에 새로운 패키지를 설치해야 함

library(readxl)

* read_excel() 함수 사용
[read_excel() 함수 사용법]


확장자: 2007 이상 버전인 경우 .xlsx
          2003 이하 버전인 경우 .xls

ebook <- read_excel(path="d:\ebook.xlsx", sheet="data", col_names=TRUE)


<<실습하기>>
#  1. 텍스트 데이터 읽어오기
#   (1) 구분자 : 공백
s_blank <- read.table(file="c:/survey_blank.txt",
                            header=TRUE,
                            sep=" ")
s_blank

#   (2) 구분자 : 콤마
s_comma <- read.table(file="c:/survey_comma.txt",
                               header=TRUE,
                               sep=",")

#   (3) 구분자 : 탭
s_tab <- read.table(file="c:/survey_tab.txt",
                               header=TRUE,
                               sep="\t")

#  2. CSV 데이터 읽어오기
survey2015 <- read.csv(file="c:/인구주택총조사2015.csv",
                               header=TRUE)

#  3. 엑셀 데이터 읽어오기       -- 3개의 argument가 필요함
install.packages("readxl")
library(readxl)
ebook <- read_excel(path="c:/ebook.xlsx",
                           sheet="data",
                           col_names=TRUE)




[참고자료]
영상
  1. R 패키지 기초 교육 (통계청 통계교육원)
교재
  1. R과 함께 한 데이터 여행(입문), 이부일/이서현, 경문사
  2. R라뷰 R을 활용한 데이터 분석 입문편, 서진수, 더알음
  3. R Cookbook, 폴 티터, 인사이트
유투브
  1. 경희대학교 사회학과 2016년 봄학기 사회조사분석 R 강의
  2. R programming software and statistics tutorials


SocialBigData@




댓글

이 블로그의 인기 게시물

R 기초_ R 데이터 관리하기

1. R 데이터를 R 데이터로 저장하기 2. R 데이터 불러오기 3. R 데이터를 외부 데이터로 저장하기 4. R 데이터의 목록 보기 5. R 데이터 삭제하기 # 1. RData를 RData로 저장하기 * save() 함수 사용 [save() 함수의 사용법] save(ebook, file="c:\ebook.RData") # 2. RData를 불러오기 * load() 함수 사용 load(file="c:\ebook.RData") # 3. RData를 외부 데이터로 저장하기 1) 텍스트 데이터로 저장 * write.table() 함수 사용 write.table(iris, file="c:\iris.txt", sep=",", rownames=FALSE) 2) CSV 데이터로 저장 * write.csv() 함수 사용 write.csv(iris, file="c:\iris.csv", rownames=FALSE) 3) 엑셀 데이터로 저장 * 엑셀 데이터로 저장하는 여러 개의 패키지에서 제공하고 있지만   openxlsx 패키지가 Java 설치없이 무난히 사용 가능! * write.xlsx() 함수 사용 install.packages("openxlsx") library(openxlsx) write.xlsx(iris, file="c:\iris.xlsx) # 4. RData의 목록 보기 * ls() 함수 사용 # 5. RData를 삭제하기 * rm()  또는 remove() 함수 사용 [R데이터 삭제하기] [실습하기] # 1. RData를 RData로 저장하기 install.packages("readxl") library(readxl) ebook <- read_excel...

R 기초_ 데이터 핸들링(2)

1. 데이터 일부 추출하기 # 1. 데이터 일부 추출하기 * 열 추출하기 * 행 추출하기 #  (1) 열 추출하기   열이 있는 위치 로 추출하거나 열의 이름 을 가지고 추출 가능 데이터명[    , 열의 위치or열의 이름]  여러 개의 경우       - c( ) : 추출할 열들의 위치가 규칙이 없을 때        -  :   :  연달아 있는 경우에       - seq( ) : 일정한 간격으로 떨어진 열을 추출할 때  ※ 열 추출의 최종 결과 값은 벡터(vector)이다.  ※ grep() 함수로 특정 문자를 포함한 열 이름을 추출 가능하다. #  (2) 행 추출하기 행의 위치를 알거나 행의 이름을 알면 열 추출과 동일한 방법 사용 데이터명[ index , ] 비교 연산자나 논리 연산자를 이용하여 특정 조건을 만족하는 행만 추출 ※ 조건(비교,논리)을 통해 특정 행만 추출 가능   [실습하기] install.packages("ggplot2") library(ggplot2) # 1. 데이터의 내용 보기 #  (1) 데이터 전체 보기 diamonds View(diamonds) #  (2) 데이터 일부 보기 head(diamonds) tail(diamonds) head(diamonds, n=10) tail(diamonds, n=10) # 2. 데이터에서 일부 데이터 추출하기 #   (1) 열 추출하기 diamonds[ , 2] diamonds[ , 2, drop=FALSE] diamonds[ , c(2, 3, 7)] diamonds[ , 7:10] diamonds[ , seq(from=2, ...