상세 컨텐츠

본문 제목

시계열 분석 스터디 2주차(김연규): 전통 시계열 모델

본문

작성자: 17기 김연규
해당 포스팅은 DMQA 김성범 교수님의 강의를 바탕으로 작성되었습니다.

 

https://www.youtube.com/watch?v=noFCkN6gXZ4&list=PLpIPLT0Pf7IqSuMx237SHRdLd5ZA4AQwd&index=8

 

지수 평활법 관련

1.  구간평균법

  • 과거 시점의 일정기간(N)의 평균으로 다음 시점을 예측하는 방법.

1) N 결정

2) 과거 N기간 동안의 데이터를 평균

3) 예측

 

  • 가장 간단한 방법이지만 한계가 명확하다.

1) 과거 n개의 데이터에 동일한 가중치를 줌

2) 미래의 예측값이 모두 동일함

 

 

2. 지수 평활법

단순 평균이 아닌 가중 평균(지수분포 모양에 근거하여 가중치 결정)을 이용하므로,

최근 데이터에 더 많은 가중치를 둔다.

2-1. 단순지수 평활법

1) 예측 과정

 

2) 사례 적용

 

3) alpha 결정

  • 큰 값을 사용할수록 최근 데이터에 더 큰 가중치를 적용하게 된다.
  • 보편적으로 0.2나 0.3을 사용하지만, 대부분의 소프트웨어에서는 자동으로 최적의 alpha를 계산한다.

 

4) 한계

  • 트렌드가 있는 데이터와 계절적 변동이 있는 데이터에 적합하지 않다.

 

2-2. 이중지수평활법

단순지수평활법을 2번 적용하는 방법.

 

1) 과정 요약

 

2) 사례 적용

위의 과정을 거치다 보면 지금까지의 예측과 달리 미래 시점별로 다른 예측값을 도출할 수 있다.

 

3. 홀트-윈터 지수평활법

계절변동이 존재할 때 사용하는 방법으로 삼중 지수평활법이라고 볼 수 있다.

 

1) Additive: 계절 변동의 산포가 일정한 경우

  • level, trend, seasonal 부분으로 나누어 지수평활 실시

 

2) Multiplicative: 계절 변동의 산포가 증가할 경우

  • Additive와 달리 중간 항이 - 가 아닌 / 로 구성되어 있다.

 

ARIMA 모델 개요

  • 정상 프로세스: 시간에 관계없이 평균과 분산이 일정한 시계열 데이터
  • 정상성 확인은 다른 그래프로 확인하기에는 모호하므로 Autocorrelation function의 패턴을 이용해서 확인한다.

  • 비정상성 또한 Autocorrelation function의 패턴을 이용해서 확인한다.
  • 전반적으로 완만하게 하락하거나 추세가 있는 경우 비정상 시계열이다.

1. Autoregressive (AR) Model

  • 이름에서 알 수 있듯 회귀분석의 식과 유사하다.

  • 그러나 독립변수들이 과거 시점의 자기 자신들이므로 독립 가정이 깨지게 된다.
  • 따라서 최소제곱법으로 추정치를 계산할 수 없다.

 

2. Moving Average (MA) Models

  • AR 모델과 달리 과거 시점의 에러를 이용하여 식을 구성한다.

 

3. Autoregressive and Moving Average (ARMA)

  • AR 모델과 MA 모델을 합친 모델.

 

4. Autoregressive Integrated Moving Average (ARIMA)

  • AR, MA, ARMA 등 전통시계열 모델은 정상 시계열에 대한 모델이다.
  • 현실 상에서는 대부분 비정상 시계열이므로 정상화하여 모델을 적용해야 한다.
  • 그 중 가장 간단한 방법은 차분(differencing)이다.
  • ARIMA (p, d, q) 모델에서 각각의 파라미터는 아래의 의미이다.
  •  p = AR 부분의 차수, d = 차분 횟수, q = MA 부분의 차수

 

차분

  • 현 시점 데이터에서 d 시점 데이터를 뺀 것.

  • 대부분의 데이터는 1차 혹은 2차 차분으로 충분하다.
  • 3차 이상의 차분이 필요한 시계열 데이터는 전통시계열에 모델에 적합하지 않다.

관련글 더보기

댓글 영역