심화 스터디/시계열 분석 스터디 (feat.금융)
시계열 분석 스터디 2주차(김연규): 전통 시계열 모델
김연규
2023. 5. 10. 01:12
작성자: 17기 김연규
해당 포스팅은 DMQA 김성범 교수님의 강의를 바탕으로 작성되었습니다.
https://www.youtube.com/watch?v=noFCkN6gXZ4&list=PLpIPLT0Pf7IqSuMx237SHRdLd5ZA4AQwd&index=8
지수 평활법 관련
1. 구간평균법
- 과거 시점의 일정기간(N)의 평균으로 다음 시점을 예측하는 방법.
1) N 결정
2) 과거 N기간 동안의 데이터를 평균
3) 예측
- 가장 간단한 방법이지만 한계가 명확하다.
1) 과거 n개의 데이터에 동일한 가중치를 줌
2) 미래의 예측값이 모두 동일함
2. 지수 평활법
단순 평균이 아닌 가중 평균(지수분포 모양에 근거하여 가중치 결정)을 이용하므로,
최근 데이터에 더 많은 가중치를 둔다.
2-1. 단순지수 평활법
1) 예측 과정
2) 사례 적용
3) alpha 결정
- 큰 값을 사용할수록 최근 데이터에 더 큰 가중치를 적용하게 된다.
- 보편적으로 0.2나 0.3을 사용하지만, 대부분의 소프트웨어에서는 자동으로 최적의 alpha를 계산한다.
4) 한계
- 트렌드가 있는 데이터와 계절적 변동이 있는 데이터에 적합하지 않다.
2-2. 이중지수평활법
단순지수평활법을 2번 적용하는 방법.
1) 과정 요약
2) 사례 적용
위의 과정을 거치다 보면 지금까지의 예측과 달리 미래 시점별로 다른 예측값을 도출할 수 있다.
3. 홀트-윈터 지수평활법
계절변동이 존재할 때 사용하는 방법으로 삼중 지수평활법이라고 볼 수 있다.
1) Additive: 계절 변동의 산포가 일정한 경우
- level, trend, seasonal 부분으로 나누어 지수평활 실시
2) Multiplicative: 계절 변동의 산포가 증가할 경우
- Additive와 달리 중간 항이 - 가 아닌 / 로 구성되어 있다.
ARIMA 모델 개요
- 정상 프로세스: 시간에 관계없이 평균과 분산이 일정한 시계열 데이터
- 정상성 확인은 다른 그래프로 확인하기에는 모호하므로 Autocorrelation function의 패턴을 이용해서 확인한다.
- 비정상성 또한 Autocorrelation function의 패턴을 이용해서 확인한다.
- 전반적으로 완만하게 하락하거나 추세가 있는 경우 비정상 시계열이다.
1. Autoregressive (AR) Model
- 이름에서 알 수 있듯 회귀분석의 식과 유사하다.
- 그러나 독립변수들이 과거 시점의 자기 자신들이므로 독립 가정이 깨지게 된다.
- 따라서 최소제곱법으로 추정치를 계산할 수 없다.
2. Moving Average (MA) Models
- AR 모델과 달리 과거 시점의 에러를 이용하여 식을 구성한다.
3. Autoregressive and Moving Average (ARMA)
- AR 모델과 MA 모델을 합친 모델.
4. Autoregressive Integrated Moving Average (ARIMA)
- AR, MA, ARMA 등 전통시계열 모델은 정상 시계열에 대한 모델이다.
- 현실 상에서는 대부분 비정상 시계열이므로 정상화하여 모델을 적용해야 한다.
- 그 중 가장 간단한 방법은 차분(differencing)이다.
- ARIMA (p, d, q) 모델에서 각각의 파라미터는 아래의 의미이다.
- p = AR 부분의 차수, d = 차분 횟수, q = MA 부분의 차수
차분
- 현 시점 데이터에서 d 시점 데이터를 뺀 것.
- 대부분의 데이터는 1차 혹은 2차 차분으로 충분하다.
- 3차 이상의 차분이 필요한 시계열 데이터는 전통시계열에 모델에 적합하지 않다.