본 게시글은 강필성 교수님의 다변량 데이터 분석 강의를 기반으로 작성되었습니다.
작성자 : KUBIG 16기 최규빈
차량의 가격을 어떻게 예측할 수 있을까?
Variable(X)
Target(y)
Goal
정량적인 종속변수 Y와 여러 개의 설명변수 X 사이의 linear relationship을 찾는 것
$$ y = \beta_0 + \beta_1x_1 + \beta_2x_2 ... + \beta_dx_d + \epsilon $$
$$ \beta = coefficient \quad \epsilon = noise$$
Explanatory Regression
설명적 회귀분석
Predictive Regression
설명변수 x가 1개
설명변수 x가 2개이상 존재
Linear Regression
독립변수는 설명변수간 1차항의 결합으로 표현된다
OLS
Ordinary least square, 최소자승법
성립 조건
Goodness of fit
평가지표
Sum-of-Squares Decomposition
R square
전체 데이터의 변동성(SSR) 분의 회귀식에 의해 설명될 수 있는 변동성의 비율(SSR)
$R^2 = 1 - \frac{SSE}{SST} = \frac{SSR}{SST}$
$0 \leq R^2 \leq 1 $
$R^2 = 1 $ -> the fitted equation passes through all the data points
$R^2 = 0 $ -> There is no linear relationship between the predictor variables and the target variable
단점
변수 수가 늘어날 수록 R square는 단조 증가한다
모델 평가
1. Average Error
actual y와 predicted y 사이의 평균
2. Mean Absolute Error(MAE)
평균 절대 오차
3. Mean Absolute Percentage Error(MAPE)
평균 절대 비율 오차
4,5. (Root) Mean Squared Error((R)MSE)
제곱을 통해 계산하면 미분 가능해져서 계산용이성 향상
[다변량 데이터 분석] Chapter.06 Artificial Neural Networks (1) | 2023.05.04 |
---|---|
[다변량 데이터 분석] Chapter.05 (0) | 2023.03.28 |
[다변량 데이터 분석] Chapter.04 (1) | 2023.03.21 |
[다변량 데이터 분석] Chapter.03 (0) | 2023.03.19 |
[다변량 데이터 분석] Chapter.01 (0) | 2023.03.13 |
댓글 영역