인과관계분석

R 데이터 가져오기

다빈치스탁 2020. 9. 1. 14:42
728x90
반응형

요즈음 대부분의 증권사 HTS에서는 차트데이터를  Excel 로 보내는 기능을 제공하고 있다. 그렇게 해서 데이터를 컴에 저장을 해도 되긴 한데 이거 상당히 번거로운 작업이다. 자 이런 노가다가 하기싫어서 우리는 이베스트에서 제공하는 XingAPI를 구현했었다. 응? 뭔 소리지? 하는 분들은 오른쪽 카테고리에서 증권사API를 살펴보기를 바란다. 여기 첨부파일에도 저장되어 있으니 궁금한 사람은 다운받으면 OK!

 

자 api를 이용해서 우리는 클릭 몇 번에 지수데이터를 다 받았다. 그러면 우선 업종시계열 자료를 복사해서 새로운 excel 파일에 복사해서 붙여넣고 다른 이름으로 저장 -> 텍스트(탭으로분리), 텍스트(쉼표로분리), 엑셀저장 옵션을 이용해서 각 각 다른 확장자로 저장한 뒤 아래의 코드를 통해서 데이터를 읽어보자.

 

#작업경로를 지정하는 명령어
#아래의 괄호안에 파일이 저장된 경로를 입력해주면 된다.
setwd()

#데이터 끌어오기(텍스트형태)
mydatat<-read.table("jisu.txt",
                   header=TRUE, sep="\t", na.strings = "")
mydatat
str(mydatat)
dim(mydatat)
summary(mydatat)

#데이터 끌어오기(csv)
mydatac<-read.csv("jisu.csv",
                    header=TRUE, na.strings = "")
mydatac
str(mydatac)
dim(mydatac)
summary(mydatac)

#데이터 끌어오기(excel)
#다만, excel 형식일 경우 패키지 설치(별도의 라이브러리)가 필요하다.
#install은 한번 설치했으면 주석처리하거나 삭제
#install.packages("readxl")
library(readxl)
mydatae<-read_excel("jisu.xlsx",
                  sheet='Sheet1',
                  col_names=TRUE, 
                  na = "NA")
mydatae
str(mydatae)
dim(mydatae)
summary(mydatae)

 

위 코드를 실행해보면 그림처럼 XingAPI를 통해서 저장된 데이터를 R이 예쁘게 읽어와서 

list 형태로 잘 저장하고 있는 걸 확인할 수 있다. dim 명령어를 통해서 확인하면 499개의 데이터가 22개 정렬되어 있는 걸 확인할 수 있다. 만약 이걸 손으로 입력한다면?? ㄷㄷㄷ. 슬픈 생각은 하지 말자. 

 

자 이걸로 시계열데이터를 분석하기 위한 모든 준비 과정은 끝이 났다.  자 우리가 궁금한건 뭐다? 내일의 가격은 얼마일 것인가? 내일의 등락률은 어느 정도일 것인가? 다음 포스트부터는 이제 본격적으로 이러한 분석을 수행해보자.

 

jisu.csv
0.08MB
jisu.txt
0.08MB
jisu.xlsx
0.10MB
주식현재가및호가.xlsm
0.24MB

728x90
반응형