본 포스팅은 POSTECH 전치혁 교수님의 '시계열분석 기법과 응용' 6장을 바탕으로 작성되었습니다.
VAR 코드는 https://github.com/loiswoo/Time-Series/blob/main/TS_study_w4.ipynb 에서 확인 가능합니다.
ex) 시계열 1: $Z_1$$_t$ (분기별 소비) , 시계열 2: $Z_2$$_t$ (분기별 소득), 시계열 3: $Z_3$$_t$ (분기별 자산)
→ 벡터자기회귀 모형이 주로 사용된다.
<VAR 모형>
-한 시계열에 대한 AR(1) 모형
$$Z_t = \phi_1 Z_(t-1) + \alpha_t$$
-두 시계열에 대한 VAR(1) 모형: 과거 한 시점(t-1)만을 이용하였기 때문에 VAR(1)로 표현
$Z_1$$_t = \phi_1$$_1Z_1$$_(t-1) + \phi_1$$_2Z_2$$_(t-1) + \alpha_1$$_t$
→ $Z_1$$_t$는 자신의 과거인 (t-1)에도 영향을 받을 수 있고, $Z_2$에도 영향을 받을 수 있다.
$Z_2$$_t = \phi_2$$_1Z_1$$_(t-1) +\phi_2$$_2Z_2$$_(t-1)+ \alpha_2$$_t$
Z끼리, 백색잡음끼리, 계수끼리 벡터, 행렬로 표현
-m차원 시계열의 VAR(1) 모형
Z의 값은 m까지 존재, $z_t = \Phi_1$ $z_t$$_1$ + $\alpha_t$ 여기서 계수 $\Phi_1$는 mxm 행렬
-m차원 시계열의 VAR(p) 모형
$z_t = \Phi_1 Z_(t-1) + \Phi_2 Z_(t-2) + ...+ \Phi_p Z_(t-p) + \alpha_t$
→ VAR(1) 형태로 표현이 가능하다.
(VAR(p) 보다는 VAR(1)가 단순한 형태여서 성질을 찾기 쉽다)
$y_t = Fy_(t-1) + v_t$
<정상성 조건>
• VAR(1) 모형의 정상성 조건
-모형: $z_t = \Phi_1z_(t-1) + \alpha_t $
계수행렬 $\Phi_1$의 고유치들의 크기가 모두 1보다 작아야 한다
• VAR(p) 모형의 정상성 조건
-모형: $z_t = \Phi_1 Z_(t-1) + \Phi_2 Z_(t-2) + ...+ \Phi_p Z_(t-p) + \alpha_t$
-VAR(1)로 변환한 형태에서 행렬 F의 고유치들의 크기가 모두 1보다 작아야 한다
방법 1: 이론적 ACF / PACF를 구하고 표본 ACF/PACF와 비교
- 교차상관관계 등이 존재하므로 쉽지 않음.
-개별 시계열에 대한 표본 ACF/PACF를 관찰하고 충분한 시차 p를 추정할 수 있음.
방법 2: 정보기준(information criteria)사용
-실제로 널리 사용되는 방법임.
-여러 시차에 대해 AIC, BIC, HQ 등을 산출하고 정보기준값이 최소인 시차 선택
1) AIC(p): Akaike information criteria
2) BIC(p): Schwarz(Bayesian) information criteria
3) HQ(p): Hannan-Quinn information criteria
→ 정보기준은 우도함수와 계수의 수로 표현이 된다
방법 3: 우도비 검정
ex) 다음은 세가지 벡터 시계열에 대한 여러 시차에 따른 VAR모형을 추정한 후 정보기준값을 산출한 결과이다. 적절한 시차 p를 구하여라.
-SC 기준으로는 시차 1이 가장 적절하다고 볼 수 있으나 대부분 기준은 시차 2가 적절하다고 선언하므로 결과적으로 시차 2가 최적이다.
-기준마다 서로 다른 시차를 제시하는 경우에는 가장 작은 시차를 최종적으로 선택하는 것도 방법이다.
Granger Causality Test(그래인저 인과관계): 여러 시계열이 있을 때 한 시계열이 다른 시계열에 어떤 영향을 주는지, 즉 인과관계(causality)를 가지는지 확인하는 것이다
ex) 서로 인과관계가 있는 시계열을 VAR로 분석할 것이다.
-Granger Cause: 시계열 ${X_t, t > 1}$이 시계열 ${Y_t, t > 1}$의 미래값을 예측하는데 도움이 될 때, ${X_t, t >= 1}$이 ${Y_t, t >=1 }$에 영향을 준다.
-그래인저 인과관계 검정
• 자기회귀 시차 모형
$$Y_t = \alpha_0 + \alpha_1 Y_(t-1) + ... + \alpha_p Y_(t-1) + \beta_1 X_(t-1) + ... + \beta_q X_(t-q) + \alpha_t$$
(Y의 현재값이 Y의 과거 값에 추가로 X의 과거값에도 영향을 받는다)
• 가설: $H_0 = \beta_1 = .. = \beta_q = 0$ ($X_t$의 계수들 베타가 모두 0 이다)
→ 기각되면 X가 Y에 영향을 준다 / 기각되지 않으면 X가 Y에 영향을 주지 않는다
• 검정통계량
여기서 $SSE_u$$_r$은 상기모형(비제한모형)의 SSE이며, $SSE_r$은 $H_0$가 옳을 때 (제한모형) SSE이다.
→ 결과 해석: 쌍방에 대해 검정( X ↔ Y).
서로 영향을 주지 않을 때는 VAR모형 분석의 의미가 없음.
비정상적인 시계열을 차분을 통해 정상적인 시계열로 변환하고 VAR 모형 추정
충격-반응 함수(impulse-response function; IRF)
한 시계열에 특정시점에서 충격이 발생했을 때 다른 시계열에 시간에 따라 어떤 영향을 주는지 분석
ex) 우리는 달러 환율이 올랐을 때 유로환율에 대한 영향, 엔화 환율에 대한 영향, GDP에 대한 영향
• VAR(1) 모형의 예
$Z_1$$_t = \phi_1$$_1 Z_1$$_(t-1) + \phi_1$$_2 Z_2$$_(t-1) +\alpha_1$$_t$
$Z_2$$_t = \phi_2$$_1 Z_1$$_(t-1) + \phi_2$$_2 Z_2$$_(t-1) +\alpha_2$$_t$
- 충격: 시점 1에서 $Z _1$$_t$에만 충격이 있고, $Z_2$$_t$에는 충격이 없음. ($\alpha_1$$_1 = \sigma_1 $)
- 반응
t =1 에서 $Z_1$$_1$에는 충격($\sigma_1$) 존재, $Z_2$$_1$에는 충격이 없음
t =2에서 $Z_1$$_2$에 충격($\phi_1$$_1 \sigma_1$) 존재, $Z_2$$_2$에도 충격($\phi_2$$_1 \sigma_1$) 존재
→ $Z_1$에 대한 충격이 $Z_1$ 뿐만 아니라 $Z_2$에도 영향을 준다.
• VAR 모형: 시계열 간의 상관관계가 있어 IRF 산출 어려움
• MA형태 모형: 여전히 오차항 간의 상관관계가 있으므로 IRF 산출 어려움
백색잡음을 이용한 MA모형으로 변환. 백색잡음은 서로 독립이므로 분석이 보다 용이하다
• 직교 오차 MA형태 모형: j번째 시계열의 충격에 대한 i번째 시계열의 시간 s이후의 반응을 분석
백색잡음을 이용하지만, 백색잡음 사이에 서로 공분산이 없는 형태이다.
→ 연관성이 많은 시계열일수록 충격에 대해서 민감하게 반응
예측오차분산분해
•필요성
-특정 시계열의 미래 불확실성에 다른 여러 시계열의 충격이 영향을 줄 수 있음
-어떤 시계열이 상대적으로 어떤 영향을 끼치고 있는지 중요도 산출이 의미 있다
-이를 위해 미래값을 예측하고 예측오차의 분산을 시계열별로 분해함(미래 불확실성에 대해서 시계열이 상대적으로 얼마나 중요한가)
• 예측 오차분산분해
-$R_i$$_j$$_k$는 i번째 시계열의 k단계 예측오차 분산에 대한 j 번째 시계열의 기여율을 비율로 나타낸다
→ 어떤 시계열이 중요한지를 분석할 수 있다.
-처음에는 LC가 100% 기여하지만,
시간이 지날수록 LC 이외에 다른 시계열도 예측오차의 표준편차에 기여를 한다.
-시감이 지남에 따라 다른 시계열의 상대적인 중요도가 증가하다가 일정하게 유지된다.
-예측오차 표준편차에 자체 시계열 이외에 다른 시계열이 얼마나 크게 영향을 주는지 알 수 있다.
•필요성
-VAR모형은 정상적 시계열에 대하여 적용한다.
-경제/금융 관련 시계열들은 비정상적이나 장기적으로 균형적 관계를 갖는 경우가 있으며 이를 공적분(Cointegration) 관계라 함
ex) 소득과 소비, 현재 가격과 선물 가격
-이런 경우 각각을 차분하여 정상적 시계열로 변환하여 분석하는 것보다 직접적으로 회귀 모형화하는 것이 보다 많은 정보를 얻음
-공적분관계가 없는 비정상적 시계열을 대상으로 회귀분석할 때 가성 회귀(spurious regression)의 문제가 발생한다
-공적분 분석을 위해서는 각 시계열이 동일 차수의 (비정상적) 누적 시계열이어야 함.
누적(integrated) 벡터 시계열
-(d-1)번 차분을 했을 때는 비정상적이지만, d번 차분을 취했을 때 정상적으로 되는 시계열을 차수 d의 누적시계열이라 함.
-이를 ${x_t, t >= 1} ~ I(d)$라고 표기
공적분(cointegration)
-$I(d)$인 누적 벡터시계열에 대해 선형결합이 차수 d 미만의 누적 시계열이 될 때, 공적분 벡터 $\alpha$를 갖는 공적분 관계에 있다고 함.
-총 m개의 시계열이 있을 때 최대 (m-1)개의 공적분 벡터가 있을 수 있음. 이때 존재하는 공적분 벡터의 최대수를 공적분 랭크(conintegration rank)라고 함
ex) 다음 세 시계열
-$Z_1$$_t = Z_1$$_(t-1) + \alpha_1$$_t$
$Z_2$$_t = \beta_1Z_1$$_t + \alpha_1$$_t$
$Z_3$$_t = \beta_2Z_1$$_t + \beta_3Z_2$$_t + \alpha_3$$_t $
-각 시계열은 $I(1)$
-$\beta_1Z_1$$_t + Z_2$$_t + Z_3$_t = \alpha_2$$_t ~ I(0)$
$-\beta_2Z_1$$_t - \beta_3Z_2$$_t + Z_3$_t= \alpha_3$$_t ~ I(0)$
오차수정모형
•필요성
-여러 시계열이 공적분 관계가 있는 경우 오차수정모형(error correction model; ECM)을 통하여 시계열 상호간의 미치는 단기 및 장기 효과를 분석할 수 있음.
-공적분 관계는 오차수정모형 표현을 위한 필요충분조검임(그레인저 표현 정리)
•단순 ECM
$$ \delta Y_t = \lambda e_(t-1) + \beta \delta X_rt + \epsilon_t$$
- [장기 효과] $\lambda e(t-1) ( \lambda < 0) $: 오차수정항(error correction term)
→ 이전 시점에서 예측오차가 양수이면(실제값이 예측값보다 크면) 다음 시점에서 Y값을 축소시켜 X와 Y의 장기적관계를 유지키시는 효과
- [단기 효과] X값에 변화가 있으면 Y값에 영향을 줌 $(\delta X_t$ 와 $\delta Y_t)$
→ (t-1) 시차 뿐만 아니라 p개의 시차를 고려할 수도 있다. 또한 Y의 시차도 고려할 수 있다.
• VAR모형과 벡터 ECM
-벡터 시계열의 경우 공적분관계가 있을 때 벡터 ECM(VECM)으로 확장됨
-I$(1)$인 VAR(p)모형은 공적분관계 여부와 관계없이 다음의 VECM으로 표현
→ 시계열을 나타내는 벡터($z_t$), 벡터의 차분($\delta z_t$) / 벡터 차분의 여러 시차(t-j)
★ $\Phi$의 랭크가 0과 m 사이인 경우: 실제적 VECM. $\Phi$가 두 개의 행렬로 분해가 가능하기 때문에 두 행렬 간의 해석이 가능하다.
공적분 검정
- Engle-Granger 검정
- Johansen 검정 → 벡터 시계열에서 공적분 관계가 몇개가 있는지를 찾아내는 것 !!!
1) 트레이스 검정
- $r_0 = 0$ 에서 귀무가설 기각되면 다음으로 $r_0=1$을 검정하는 과정을 반복
- 검정통계량은 우도비에 바탕으로 산출
2) 최대고유치 검정
-마찬가지로$ r_0 = 0 , 1, 2, ...$를 변화시키면서 순차적으로 진행
예시)
※ 공적분과 오차수정모형은 필요충분관계이다.
- 코스피200과 코스피20선물 지수 사이의 관계식을 알 수 있다. 계수가 0.9982로 거의 1에 가까운 값임을 알 수 있다.
- 코스피200의 계수의 절대값이 0.11이고, 코스피200선물의 계수의 절대값이 0.06이라는 것을 통해 코스피200이 더 빨리 조정한다는 것을 알 수 있다.
- 추정치 이외에 표준편차와 검정통계량을 이용하여 통계적 검정도 가능할 것으로 보인다.
1. 시계열 간의 인과관계가 있는가? (Granger Causality Test)
2. 정상적 시계열로 만들어서 VAR모형을 세우고 충격반응 함수를 알아보고 예측오차 분산분해(상대적 중요성)
2. 비정상적 시계열 자체를 분석 - 공적분 관계가 있다면 오차수정모형을 추정하여 장단기적인 효과를 분석
[Forecasting at Scale] Facebook 시계열 패키지 prophet 논문 리뷰 - 엄기영 (0) | 2023.05.04 |
---|---|
시계열스터디 4주차 엄기영 (0) | 2023.03.30 |
시계열 분석 스터디 4주차(김연규): VAR, ARCH/GARCH (0) | 2023.03.30 |
시계열 스터디 4주차(김태영) : VAR / ARCH / GARCH (0) | 2023.03.30 |
시계열 분석 스터디 3주차(김희준) ARIMA, SARIMA (0) | 2023.03.23 |
댓글 영역