본문 바로가기

728x90
반응형
728x90
반응형
시계열모델링 18

[데이터로 보는 미래] 경제 순환을 반영한 삼성전자 주가 예측, Prophet 모델 활용! 안녕하세요, 다빈치스탁의 시청자 여러분. 오늘은 지난 시간에 이어서, 경기순환과 시장 예측의 심화된 내용으로, 특정 종목의 미래 주가를 예측하는 방법에 대해 알아보겠습니다. 이번 강의에서는 Prophet이라는 도구를 중심으로 살펴볼 것입니다. Prophet 모델은 페이스북에서 개발한 시계열 데이터 예측 도구로, 트렌드, 계절성, 그리고 휴일 효과를 포함하여 비선형 추세를 예측할 수 있는 가법 모델을 기반으로 합니다. 이 모델은 연간, 주간, 일간 패턴을 유연하게 포착하여 강한 계절성을 가진 데이터에 특히 적합합니다. 모델의 핵심 구성 요소는 다음과 같은 방정식으로 표현됩니다: 여기서 ( g(t) )는 트렌드 함수, ( s(t) )는 계절성 함수, ( h(t) )는 휴일 구성 요소, 그리고 ( \epsil.. 2024. 4. 11.
VAR(Vector Auto Regressive Model) 모델을 이용한 주가 예측 지난 포스트들에서 다루었던 구조화방정식, 단변량, 다변량 회귀분석 등은 일종의 횡단면적 분석이다. 즉 시계열자료가 가지는 time lag는 고려하지 않고 변수들간의 인과관계를 규명하여 미분방정식을 수립하는 것이 목적이다. 물론 이러한 것도 주가를 예측할 수 있는 하나의 방법론으로 볼 수 있겠으나 문제는 자기자신의 변동에 대한 영향력은 간과할 위험이 크다고 볼 수 있다.(물론 무시할 수 있을 정도의 영향력이라면 상관없겠지만) 시차를 고려한 모델은 지난 포스트에서 다룬 2020.10.19 - [시계열모델링] - ARIMA 모형의 분석절차(확률적 모형분석) 외 ARCH, GARCH 등이 있을 수 있다. 그러나 이러한 모형은 단변량 시계열 모델 즉 오직 자기자신의 회귀에만(Auto Regressive) 영향을 .. 2022. 7. 18.
국면전환(Regime-Switching)모형을 이용한 코스피추세 예측 지난번 포스트 내 맘대로 연구일지에서 코스지의 적정 지수를 한번 추정해봤다.(2021.08.16 - [내 맘대로 연구일지] - 코스피 지수의 적정 값은 얼마인가?) 물론 국부의 측정하는 지표로서의 관점에서는 지수는 장기적으로는 deterministic trend 한다고 봐도 무방하다. 다만 그 기다림의 시간이 너무 길고 지루할뿐더러 워런 버핏처럼 현인이 아닌 이상 장기투자의 지루함을 견딜 수 있는 사람은 매우 적다. 경기가 하락과 상승을 반복하듯이 코스피 역시 단기적인 관점에서는 bull(강세) & bear(약세)를 반복하기 때문에 코스피는 결정론적 추세를 가지는 것이 아니라 확률적 추세(stochastic trend)를 가진다고 보아야 마땅할 것이다. 이렇게 어떠한 상태에 따라 확률 과정이 다를 수 있.. 2021. 8. 20.
Multivariate GARCH(다변량 이분산 모형) 조건부 이분산이라는 말은 금융시장에 임의의 이코노믹 쇼크가 가해졌을 때 그로 인한 변동성(분산)은 바로 직전 기에 영향을 받지만 시간이 지날수록 장기 평균 분산에 근접한다는 말이다. 이러한 현상을 모델링할 때 단일 변수 시계열의 경우에는 지난번 포스트 2020.10.20 - [시계열 모델링] - (G) ARCH 모형의 분석절차에서 살펴본 것처럼 비교적 간단하게 도출할 수 있다. 그러나 금융시장의 경우 서로 복잡하게 얽혀 있기 때문에 하나의 자산에 가해진 충격은 다른 자산 혹은 다른 나라의 금융시장에도 영향을 미치는 경우가 빈번하다. 상식적으로 생각해보자. 전일 다우지수가 박살이 났다. 적당히 박살 난 게 아니라 아주 그냥 아작이 났다고 치자. 다음날 코스피는??? 슬프지만 비슷할 확률이 매우 높다. 또한.. 2021. 8. 19.
다이나믹 모델링 : 칼만필터(Kalman Filter)를 이용한 주가예측 어떠한 현상을 모델링함에 있어서 크로스섹셔널 분석(횡단면적)의 경우 변하지 않는 상수 파라미터를 추정하는 정적 추정이 더 적합할 수도 있다. 그러나 롱기튜드(종단면) 분석, 특히 시계열 자료에 있어서는 경우에 따라 시스템의 구조적인 변화 등으로 시간에 따라 변하는 상태변수를 추정하는 것이 더 유용할 때가 있는데 이러한 분석법을 동적 추정이라고 하며 그 대표적인 사례가 바로 칼만필터 모델링 기법이다. 주식분석 생성형 인공지능, 지금 바로 클릭 https://leenaissance.site/리네상스 테크놀로지인공지능 주식대장, 무엇이든 물어보세요.leenaissance.site 칼만필터 모형의 사전적 정의를 살펴보면 칼만 필터(Kalman filter)는 잡음이 포함되어 있는 측정치를 바탕으로 선형 역학계의.. 2021. 6. 28.
확률 미분방정식(SDE)을 이용한 주가 시뮬레이션 일반적으로 미분방정식이라 함은 한 개 또는 그 이상의 종속변수를 한 개 혹은 그 이상의 독립변수에 대한 도함수를 포함하는 방정식을 의미하며 이때 하나의 독립변수를 포함하는 방정식을 상미분 방정식이(ordinary differential equation)라 하고 이를 푸는 방법은 변수분리, 적분인자 등의 해석적 방법과 오일러, 룬게-쿠타 방법 등의 수치적으로 풀이할 수도 있다. 그런데 1개 이상의 독립변수가 확률과정을 가지는 재미난 현상을 모델링하기 위해 등장한 것이 바로 확률 미분 방정식(SDE : stochastic differential equation)이다. 예를 들어 쇠구슬을 3층에서 떨어뜨렸을 때 일정 시간 뒤에 물체의 낙하지점은 중력가속도를 이용한 미분방정식으로 풀 수 있고 수 차례의 반복실험.. 2021. 6. 22.
파마 프렌치의 3요인 모형 자본 자산 가격 결정 모델 (CAPM)로 알려진 전통적인 모델은 주식의 수익률과 시장 전체 수익률을 설명하는데 하나의 변수만 사용한다. 반대로 Fama–French 모델은 세 가지 변수를 사용하는데 파마과 프렌치는 기존 CAPM 에 두 가지 요소를 추가했다. Capital asset pricing model - WikipediaIn finance, the capital asset pricing model (CAPM) is a model used to determine a theoretically appropriate required rate of return of an asset, to make decisions about adding assets to a well-diversified portfolio.. 2020. 12. 14.
Facebook prophet(예언자)을 이용한 주가예측 모델링 지난번 포스트(2020/09/17 - [데이터마이닝 with R/시계열모델링 with R] - 시계열 분석이란?)에서 언급했던 시계열 모델링의 기초를 요약하면 driving force(추세)의 유무, 계절성의 유무, 인접한 자료들 사이에 상관성의 유무, 일정한 평균과 분산의 조건 등에 대한 검증 및 전처리 과정을 거친 뒤 본격적으로 시계열 분석을 수행하게 되는데 이러한 일련의 과정들을 하나의 함수로 요약해주는 예언자가 등장했다 ㄷㄷㄷ. 이름부터 prophet 이다. 예측(forecast)이 아닌 예언이라고 한다. 이름만 들어서는 누가 오만하게 예언이라고 하는가 했다가 개발주체가 페이스북이라는 이야기를 듣고 난 이후에는 음... 이하 생략한다. 주가자료에 대한 데이터만 있다면 특별한 전처리 없이도 함수 몇.. 2020. 12. 2.
(G)ARCH 모형의 분석절차 동분산의 가정은 고전적 최소자승법에서 횡단면 자료의 오차분산이 일정하다는 가정을 중요시하여 시계열 자료의 분석에서도 모든 t에 대해 분산이 일정하다는 안정성 조건을 중요시였기 때문에 ARMA 모형에서는 잔차의 분산이 동일하다고 가정한다. 하지만 실제 시계열 자료 특히 금융시계열에서는 무작위적으로 일정한 구간을 벗어난 극단값이 관측되는 경우가 많다. 이러한 오류가 자주 발생을 하자 시간의 흐름에 따라 변화하는 분산에 대한 연구로 ARCH, GARCH 모형이 개발되었다. 이러한 시계열 자료의 특징은 변동성의 군집화 현상을 보이는데 높은 변동성을 가진 구간이 그렇지 않은 구간에 비해서 집중되어 있고 분포를 살펴보면 fat-tail을 가진 뾰족한 분포를 가지는 것이 특징이다. 그래서 로버트 앵글은 특정시점 t기.. 2020. 10. 20.
ARIMA 모형의 분석절차(확률적 모형분석) 시계열 자료는 추세, 계절, 백색잡음 등 다양한 요인이 중첩되어 결정된다. 이 때 각 요인들이 결합되어 고정적인 패턴을 나타내는 확정적 모형과 그렇지 않고 불규칙적인 패턴을 보이는 확률적 모형이 있다. 대표적인 확률적 시계열 패턴이 주가변동이다. 자 그렇다면 이렇게 확률적 모형을 분석하는 절차는 어떤 과정을 거치는가에 대해 알아보자. 1. 시계열자료의 안정성을 검정 2. 불안정 시계열일 경우 적절한 변환을 통해 안정적 시계열로 변환 3. 개연성 있는 예비모형을 산정해야 하는데 이때 acf, pacf cv 지표 혹은 auto.arima 프로그램을 이용할 수 있다. 4. 선정된 모형을 통해 추정 및 평가과정을 거친 다음 최종모형을 선정한다. 5. 예측에 대한 성능평가를 통해 최대한 현실에 가까운 모형을 도출.. 2020. 10. 19.
시계열 자료의 분해법 분해법이라는 것은 시계열에 영향을 주는 일반적인 요인을 시계열에서 분리해 분석하는 방법으로 시계열의 구성요소를 추세요인, 계절요인, 순환요인 및 불규칙요인으로 구분하여 각 요소로 분해하여 분석한다. 즉 이 4가지 구성요소 중에서 추세, 계절, 순환요인을 제거한다면 남은 자료는 우연변동에 의한 정상 시계열로 만들 수 있기 때문이다. 사실 주식의 경우 로그차분을 수행하면 평균이 뮤, 분산이 시그마인 안정 시계열로 대부분 변환이 되지만 경우에 따라 그렇지 않은 경우도 있기 때문에 이러한 방법들에 대해 간략히 짚고 넘어가보자. #작업경로를 지정하는 명령어 setwd("") mydatat 2020. 10. 19.
시계열 자료의 평활법 - 회귀평활 part 2 지난번 포스트(2020/10/15 - [머신러닝 with R/시계열모델링 with R] - 시계열 자료의 평활법 - 회귀평활 part 1)에 이어서 이번에는 loess, splin 평활법 등에 대해 알아보자. 첫 째, loess(local polynomial regression) 평활법은 시계열 데이터의 특정 윈도우에 대해 가중하여 평활화를 수행하며 자료를 쪼개서 가중회귀 분석을 수행하는 방법이다. 그리고 둘 째 Spline 평활법의 경우 차원의 수를 줄이려고 의도하지 않는 분석기법인 non-parametric regression 기법을 주로 이용하는 방법으로 3차 수식의 매끄러운 곡선으로 평활화한다. #loess, Spline 방법의 자세한 수리적 유도과정에 대해 좀 더 상세한 내용을 알고자하는 사람은.. 2020. 10. 19.