상세 컨텐츠

본문 제목

시계열 분석 스터디 3주차(김연규): ARIMA, SARIMA

본문

 

작성자: 17기 김연규
해당 포스팅은 포스텍 전치혁 교수님의 강의와 DMQA 김성범 교수님의 강의 내용을 바탕으로 작성되었습니다.

 

http://www.kmooc.kr/courses/course-v1:POSTECHk+IMEN677+2021_T2/about

 

시계열분석 기법과 응용

시계열 데이터 분석을 통하여 시간에 따른 상관관계 등의 패턴 추출 및 이를 바탕으로 미래에 대한 예측을 위한 다양한 기법 학습 및 응용 능력을 배양한다.

www.kmooc.kr

 

https://www.youtube.com/watch?v=g2pXzSNwcAQ&list=PLpIPLT0Pf7IqSuMx237SHRdLd5ZA4AQwd

 

ARIMA 모델 개요

1. Box-Jenkins ARIMA Procedure

  1. 데이터 전처리(변환, 차분)
  2. 시범 모델 선택(그래프 활용)
  3. 파라미터 추정
  4. 모델 평가 -> 최종 모델 결정
  5. 예측

각 단계별로 자세히 확인하고자 한다.

 

1. 데이터 전처리

  • Autocorrelation function을 활용하여 정상성 여부 확인
  • 차분하여 다시 확인

 

2. 시범 모델 선택

  • Graphical method: ACF와 PACF를 생성하여 그 패턴을 확인.

 

  • '절단', '소멸', '지수적으로 감소'의 의미

 

3. 파라미터 추정

  • 위에서 선택한 모델을 바탕으로 프로그래밍.
  • 하지만 graphical method의 한계가 존재하므로 그 근방의 모델들도 확인.

 

4. 진단(평가)

  • 규칙: 잔차의 ACF를 그렸을 때, 40개의 lag 중 bound 밖으로 나가는 값이 2~3개 이하이면 OK.
  • 진단 결과가 기준을 충족하면 최종 모델로 결정한다.

 

5. 예측

  • 위에서 결정된 최종 모델을 활용하여 미래 데이터를 예측한다.
  • 단, 모델을 결정할 때 그래프만 활용하지 않고,
  • p, d, q의 가능한 모든 조합을 반복문을 통해 고려하고,
  • AIC 등 평가 점수를 비교하여 결정한다.

 

SARIMA

  • 기존의 ARIMA 모델에 계절 변동을 반영한 모델.
  • 각 계절에 따른 독립적인 ARIMA 모델이 합쳐져 있는 모형.
  • 기존 모형에 계절성 주기를 나타내는 차수가 추가되어, ARIMA(p, d, q)(P, D, Q)s로 표기한다.

 

1. 계절성 시계열

  • 일반적 시계열에는 추세와 계절성이 동시에 존재하는 경우가 많다.
  • 추세는 차분으로 제거될 수 있지만, 계절성은 여전히 남을 수 있다.
  • 따라서 계절성은 별도로 처리해야 한다.

 

2. 계절성 차분

  • 월별 계절성이라면 s=12, 분기별 계절성이라면 s=4이다.
  • 1차 계절성 차분: 인근 두 계절 값의 차이 산출

 

3. SARIMA 모형

  • 일반적 계절성 ARIMA 모형
  • 표기: ARIMA(p, d, q)(P, D, Q)s
  • 비계절성 부분 d차 차분시 ARMA(p, q)
  • 주기 s의 계절성 부분 D차 차분시 ARMA(P, Q)

 

모형의 식별 및 추정

ARIMA 모형의 Box-Jenkins procedure와 같이 SARIMA 모형의 절차를 살펴보려고 한다.

 

1. 그래프를 그려보고 추세 및 계절성 존재여부를 판단한다.

2. 상황에 따라 적절히 차분한다.

  • 추세 X, 계절성 O: 해당 주기에 대한 계절성 차분
  • 추세 O, 뚜렷한 계절성 X: 선형추세 시 1차 차분, 곡선 추세 시 차분 전에 함수 변환 시도
  • 추세 O, 계절성 O: 계절성 차분 우선 실시 후 추세를 다시 검토하여, 여전히 있다면 1차 차분

3. 차분 시계열에 대한 ACF와 PACF를 바탕으로 p, q, P, Q를 결정한다.

  • p, q는 ARMA 모형과 동일한 방법으로 결정
  • P, Q는 주기의 배수에서 나타나는 ACF와 PACF의 패턴을 보고 결정

4. 파라미터 추정

5. 잔차 검정

 

SARIMA 모형에서의 ACF 산출 예시

Autocorrelation을 산출하는 방법은 ARIMA 모형과 유사하다.

 

SARIMA 모형을 통해 예측하는 사례

이론만으로 이해하기에는 한계가 있으므로, 경부선 차량운행 수 사례에 적용하여 살펴보고자 한다.

p-값이 일부 유의하지 않기 때문에 다른 모형을 시도해서 최적의 모델을 도출해야 한다.

관련글 더보기

댓글 영역