[Artificial Intelligence] 결정계수(R2 Score)와 평가지표
📈 결정 계수(R2 Score/R2-Squared) 란?
결정계수
, R2 Score
는 회귀 모델
의 적합도
확인을 위해 사용하는 기법입니다.회귀 모델
의 평가 지표 중 하나로 사용 가능하고 값은 0~1 사이의 값을 갖습니다.
결과가 1에 가까울수록 성능이 좋다는 것을 의미하고 이는 모델이 추론한 결과가
데이터를 설명하고 있는지에 대한 지표라고 생각하면 내용을 이해하기 쉽습니다.
보통 0~1 사이의 값이므로 %로 표현하고 0.9인 경우 90%의 설명력이 있다합니다.
📲 결정계수에서 사용되는 평가 지표
결정계수
에서 사용되는 지표
는 아래와 같고 결정계수
의 수식에서 이용됩니다.
SSE
(오차제곱합):∑(실제 값 - 예측 값)²
SSR
(회귀제곱합):∑(예측 값 - 평균 값)²
SSR
(전체제곱합):∑(실제 값 - 평균 값)²
R2
(결정계수):SSR / SST
=1 - (SSE / SST)
😀 회귀에서의 다른 평가 지표
회귀
에서는 결정계수
외에도 다양한 지표를 사용하고 대표적인 것을 알아봅니다.평가 지표
의 경우 모델에 적합한 것을 선택이 필요하므로 참고하는 것이 좋습니다.
🎉 MSE(Mean Squared Error) / 평균 제곱 오차
인공지능
에 대해 배우면서 가장 기초적으로 접하게 되는 오차 함수라고 볼 수 있습니다.
실제 값(y)
과 예측 값(o)
의 차이를 제곱한 뒤 전체 개수
로 나눈 값을 의미합니다.
오차가 적을 경우 MSE
의 값은 작아질 것이고 모델의 성능이 높다는 것을 의미합니다.
이전 소개했던 경사하강법
에도 해당 지표를 이용하여 손실함수
를 설계했었습니다.
이를 수식으로 표현 시 (∑(실제 값 - 예측 값)²) / n(전체 개수)
로 표현됩니다.
제곱을 하기에 오차 값
의 크기가 1보다 작은 경우 0에 급격하게 가까워지게 되고
1보다 큰 경우에는 급격히 커지기에 계산된 값의 차이가 있다는 문제가 있습니다.
✨ RMSE(Root Mean Squared Error) / 평균 제곱근 오차
MSE
로 계산된 지표 값에 제곱근(Root)를 이용하여 값을 축소시킨 지표입니다.
값을 축소시켰지만, MSE
를 이용하기에 문제는 동일하게 발생되는 지표입니다.
수식은 기존의 MSE
에서 제곱근을 이용하여 √(MSE)
의 형태를 띄게 됩니다.
🎇 MAE(Mean Absolute Error) / 평균 절대 오차
MAE
는 MSE
와 달리 제곱을 이용하는 것이 아닌 절대 값을 이용하는 방식입니다.MSE
에 비해 작은 값을 띄고, 제곱에서의 급격하게 값의 변화 문제를 방지합니다.
수식으로 표현 시 (∑|실제 값 - 예측 값|) / n(전체 개수)
로 표현됩니다.
🎆 MAPE(Mean Absolute Percentage Error) / 평균 절대 백분율 오차
MAE
를 비율로 표현하여 값의 크기에 의존되는 기존 방식을 개선할 수 있습니다.
수식은 (∑|(실제 값 - 예측 값)/실제 값|) * (100/n(전체 개수))
로 표현됩니다.
🎈 MPE(Mean Percentage Error) / 평균 백분율 오차
MAPE
에서 절대 값을 제외한 비율 값으로 모델 성능 비교 간 사용하게 됩니다.
단, 절대 값을 사용하지 않기에 양의 오차와 음의 오차가 상쇄되는 문제가 존재하여
다른 값과 달리 0에 근접하더라도 예측 모델이 정확하다는 것을 의미하지 않습니다.
수식은 (∑((실제 값 - 예측 값)/실제 값)) * (100/n(전체 개수))
로 표현됩니다.
만약 실제 값에 0이 존재할 경우 계산이 불가하고 0에 근접한 매우 작은 값의 경우MPE
의 값이 급증하는 문제로 인해 지표 자체가 직관적이지 않다는 문제가 있습니다.
끝까지 읽어주셔서 감사드립니다. 😎