*본 포스팅은 다음을 참고하여 작성하였습니다.
1. POSTECH 전치혁 교수님의 시계열 강좌
http://www.kmooc.kr/courses/course-v1:POSTECHk+IMEN677+2021_T2/course/
강좌 | IMEN677 | K-MOOC
www.kmooc.kr
2. 고려대학교 DMQA 연구실 김성범 교수님의 시계열 강좌 (ARIMA 1~6장)
------------------------------------------------------------------------------------------------------------------------
이번 시간에는 비정상적 시계열 데이터 및 그에 대한 모형을 다룰 예정입니다.
[1] ARIMA(Auto Regressive Integrated Moving Average) 모형
정상(stationary): 시간에 관계없이 평균과 분산이 일정한 시계열 데이터
비정상성(nonstationary): 시계열에 추세(trend) 혹은 계절성(seasonality)가 포함된 경우. 평균이나 분산이 시간에 따라 바뀐다.
*비정상성 판단 방법*
1. 그래프 -> ACF 그래프가 서서히 감소하는 추세를 보인다.
하지만 육안으로 파악하기 힘든 경우도 많아 조금 더 체계적인 방법이 필요하다.
2. 단위근 검정 (더 체계적인 가설 검정에 기반한 방법)
- 통계적 검정을 통해 시계열의 정상성 여부 판정
- ADF(Augmented Dickey-Fuller) Test
*모든 정상적 시계열은 고차원의 AR 모형으로 근사될 수 있다고 가정
귀무가설(H0): 단위근이 존재한다. (시계열이 비정상이다)
대립가설(H1): 단위근이 없다. (시계열이 정상적이다)
*대응 방안*
1. 차분(differencing)을 통해 정상 시계열로 변환
2. 함수 변환(transformation)을 통해 분산 안정화
3. 분해법으로 추세 및 계절성 제거
차분(differencing): 인근한 2값 사이의 차이를 산출하여 새로운 데이터를 형성
- constant average trend -> 1st order differencing
- varying trend(curvature) -> 2nd order differencing (대부분 2차 차분까지)
ARIMA 모형에서는 주로 1차, 2차 차분까지만 수행한다. 3차 이상의 차분까지 수행하는 경우는 드물다. 만약 2차 차분까지 했는데도 비정상성 문제가 해결이 안되면 ARIMA 모형이 아닌 다른 방법을 사용해야 한다.
가령, 1차 차분 후의 시계열이 정상이면, 원 시계열을 I(1)으로 표기할 수 있다.
비정상 시계열 -> d번 차분 -> 정상 시계열
비정상: ARIMA(p,d,q) // 정상: ARMA(p,q) -> ARIMA 모형은 3개의 parameter
*p:#of lags(AR part of model), d: order of differencing, q:# of white noise(MA part of model))
한계: 추세는 어느 정도 제거할 수 있지만, 계절성 문제는 해결할 수 없다.
[2] SARIMA (Seasonal AutoRegressive Integrated Moving Average) 모형
- 더 흔한 case (추세와 계절성이 보통 함께 존재하는 경우가 현실에서 흔하다.)
- 비계절성 ARIMA 모형의 경우 차분만으로 해결이 되지만, 계절성 ARIMA의 경우 차분 시행 후 계절성을 별도로 처리하여야 한다.
- 일반적 차분과 계절성 차분을 함께 고려한 모델!
- 비계절성 부분과 계절성 부분으로 나눌 수 있음
*모델링 단계*
1. 시계열도를 그려본다 --> 추세, 계절성 여부 판단
(하지만 육안만으로는 한계가 있다. 통계적 방법도 함께 고려되야 한다.)
2. 적절한 차분 실시
- 추세만 있는 경우: 일반 차분(선형은 1차, 곡선은 함수 변환 후 1차)
- 계절성만 있는 경우: 계절성 차분
- 둘다 있는 경우: 1) 계절성 차분 2) 추세 차분
3. 차분 시계열에 대한 ACF, PACF를 바탕으로 p,q,P,Q 파라미터 값 결정
4. 모형 검정
AIC: 작을수록 좋다 -> 근방 모델 중 AIC 값이 가장 작은 것을 선
컴퓨터가 실제로 가능한 ARIMA의 모든 p,d,q 조합을 돌리고 그 중 AIC 값이 가장 작은 값을 선택한다.
5. 잔차 검정 실시
검정과 그래프를 통해 주어진 시계열의 특징에 맞는 모형을 선택해야 한다.
cf. 계절성을 고려하지 않는다면 치명적!
모형 모수가 보다 많이 필요하고 설명력은 떨어진다
cf. B: backshift operator
*증명내용
시계열 분석 스터디 2주차(우명진) - 전통 시계열 (0) | 2023.03.23 |
---|---|
시계열 스터디 3주차(신윤): 비정상성 판단, ARIMA, SARIMA, VAR (0) | 2023.03.23 |
[시계열 스터디 3주차(엄기영)] (0) | 2023.03.22 |
시계열 스터디 3주차(김태영) : ARIMA / SARIMA (0) | 2023.03.20 |
시계열 스터디 2주차(김희준) (0) | 2023.03.17 |
댓글 영역