2.인공지능/개념&이론

6. 회기 모델 성능 지표: MAE, MSE, RMSE, MAPE, MPE, R²

쿼드큐브 2025. 4. 23. 14:28
728x90

회귀(Regression) 모델의 성능을 평가할 때는 예측값과 실제값 사이의 차이를 수치화하여 얼마나 정확하게 예측했는지를 확인합니다.

회귀(Regression)모델은 연속적인 값을 예측하는 데 사용됩니다. 이때 예측의 정확도를 수치적으로 판단해야 하며, 이를 위해 여러 지표를 사용합니다. 대표적인 성능 지표 MAE, MSE, RMSE, MAPE, MPE, R² 에 대해서 정리 합니다. 

 

회기 모델 성능 지표: MAE, MSE, RMSE, MAPE, MPE, R²

 

목차

1. MAE(Mean Absolute Error): 평균 절대 오차

2. MSE(Mean Squared Error): 평균 제곱 오차

3. RMSE(Root Mean Squared Error): 평균 제곱근 오차

4. MAPE(Mean Absolute Percentage Error):평균 절대 백분율 오차

5. MPE(Mean Percentage Error): 평균 백분율 오차

6. R²(R-squared): 결정 계수

7. 성능지표 요약 비교

8. 모델 성능 평가 예시: 집값 예측 모델

관련 글 링크

 

 

1. MAE(Mean Absolute Error): 평균 절대 오차

예측값과 실제값 사이의 절댓값 차이의 평균입니다.

모든 오차를 동등하게 취급하므로 이상치에 덜 민감합니다.

◆ 절대값을 쓰는 이유

  • 오차는 양수(과대 예측)도 있고 음수(과소 예측)도 있습니다.
  • 단순히 평균을 내면 +와 –가 서로 상쇄되어 실제로는 큰 오차가 있음에도 "0에 가까운 좋은 성능"처럼 보일 수 있기 때문입니다.
  • 그래서 절댓값을 써서 오차의 크기만 반영합니다.

◆ 해석 예시

  • MAE = 3.2 → 예측값은 실제값에서 평균 ±3.2만큼 오차를 가집니다.
  • MAE = 0 → 예측이 완벽히 정확
  • MAE = 5 → 예측이 평균적으로 5 단위만큼 벗어남
  • 실제값: 100, 예측값: 97 → 오차 = 3 → MAE에 그대로 반영

◆ 특징

  • 단위는 그대로 유지되므로 해석이 쉽습니다 (가격, 시간, 수량 등)
  • 큰 오차에 덜 민감하여 전체적인 평균 오류를 파악할 때 적합

 

2. MSE(Mean Squared Error): 평균 제곱 오차

MSE는 오차의 크기를 제곱해서 평균낸 값으로, 큰 오차가 발생하면 그 영향력이 크게 반영됩니다.
정밀한 예측이 필요한 상황이나, 이상치를 강조하고 싶은 경우에 효과적인 성능 지표입니다.

 

 

◆ 제곱하는 이유

  • 큰 오차를 강조하기 위함.
  • 단순 평균(MAE)에서는 오차 10과 오차 1이 거의 비슷하게 취급되지만, MSE는 오차 10이 100점의 영향력을 줍니다

 

 

◆ 해석 예시

  • MSE = 25 → 오차의 평균 크기가 약 5 (5² = 25) 정도로 볼 수 있음
  • 실제: 100, 예측: 90 → 오차 = 10 → 102=10010^2 = 100 → MSE 크게 증가
  • 단위는 제곱 단위이기 때문에, 해석은 RMSE가 더 직관적입니다.

◆ 특징

  • 의료 수치 예측이나 금융 리스크 분석처럼 작은 실수 하나가 큰 문제로 이어질 수 있는 분야에서는 MSE가 유용하게 사용됩니다.
  • MSE는 수학적으로 미분이 가능하다는 점에서, 머신러닝 알고리즘에서 최적화 과정에 유리하다는 장점도 가지고 있습니다.
  • MSE는 정밀한 예측을 요구하는 상황에서 강력한 도구가 될 수 있지만, 해석의 직관성 부족과 이상치에 대한 민감도는 고려해야 할 요소입니다.

 

3. RMSE(Root Mean Squared Error): 평균 제곱근 오차

MSE는 MSE(평균 제곱 오차)의 제곱근을 씌운 값입니다.

RMSE(Root Mean Squared Error)는 예측값이 실제값과 평균적으로 얼마나 차이 나는지를 직관적으로 표현할 수 있는 회귀 성능 지표입니다.

즉, 오차를 제곱하여 평균을 낸 다음, 다시 그 값에 제곱근을 적용한 것입니다.
이렇게 하면 MSE보다 해석이 더 직관적이 되고, 단위도 실제값과 동일해집니다.

 

◆ 해석 예시

  • MSE = (25 + 16 + 25 + 4 + 25) / 5 = 19
  • RMSE = √19 ≈ 4.36
  • 평균적으로 ±4.36분 정도 오차가 발생한다고 이해할 수 있습니다.
  • RMSE = 10 → 예측값이 실제값과 평균적으로 약 ±10 단위 정도 차이
  • 단위는 실제값과 같아서 (예: 원, 분, 개수 등) 실무에 사용하기 쉽고 직관적입니다.

◆ 특징

  • RMSE는 MSE의 장점인 큰 오차에 대한 민감함을 유지하면서도, 단위 문제를 해결해 실무에 더 적합합니다.
  • MSE의 특성을 그대로 가져오기 때문에, 이상치(Outlier)가 존재할 경우 결과가 왜곡될 수 있는 단점도 있습니다.
  • 큰 오차 하나가 전체 RMSE 값을 높여버릴 수 있기 때문에, 데이터 전처리나 이상치 처리 없이 사용하면 왜곡된 판단을 할 위험도 있습니다.
  • 배달 시간, 응답 속도, 추천 시스템 정확도처럼 사용자가 실제로 느끼는 오차 크기가 중요한 경우, RMSE는 단순 수치가 아닌 “예측이 평균적으로 이만큼 틀렸다”는 식으로 바로 설명이 가능합니다.

 

4. MAPE(Mean Absolute Percentage Error): 평균 절대 백분율 오차

MAPE는 예측 오차를 "백분율(%)"로 환산하여 평균낸 값입니다.
오차를 원 단위나 시간 단위가 아닌 “퍼센트(%)”로 표현하기 때문에,
데이터의 크기나 단위에 상관없이 서로 다른 모델이나 데이터셋을 비교하기에 적합한 지표입니다.

*“예측값이 실제값과 몇 % 정도 차이나는가”를 평균적으로 나타냅니다.

 

◆ 해석 예시

  • MAPE = 8% 라면, 모델의 예측값은 실제값과 평균적으로 약 8% 차이가 난다는 의미입니다.
  • 단위는 없기 때문에, 원, 분, 개수 등 단위와 무관하게 평가 가능합니다.

◆ 사용 예

  • 단위가 서로 다른 데이터 비교가 필요할 때
  • 예: 가격(원), 수요(개), 수익률(%) 등 다양한 단위를 가진 데이터
  • 경영지표, 성과비율, 수익률 등 퍼센트 기반 분석이 필요할 때
  • 모델 성능을 일반 사용자나 비전문가에게 쉽게 설명해야 할 때
  • 예: "우리의 매출 예측 시스템은 평균적으로 실제 매출에서 5% 정도의 오차가 있어요."

 

◆ 유의사항

  •   실제값이 0이 되거나 0에 가까우면,
  • → 오차율이 무한대(inf) 또는 비정상적으로 커지는 오류 발생
  • →  데이터에서 실제값이 0에 가까운 항목을 제외하거나, SMAPE, MAE 등 다른 지표와 병행 사용
  • MAPE는 예측값이 낮을 때(과소 예측), 오차 비율이 더 커집니다.

  • 이는 리스크 보수적인 모델이 더 불리하게 평가받을 수도 있음을 의미합니다.

 

5. MPE(Mean Percentage Error): 평균 백분율 오차

MPE는 예측값이 실제값보다 평균적으로 얼마나 높은지(과대 예측), 낮은지(과소 예측)를 백분율로 계산해 보여주는 지표입니다.

예측 오차의 방향(방향성 있는 편향)을 확인할 수 있다는 것이 가장 큰 특징입니다.

 

일반적인 오차 지표(MAE, MAPE 등)는 오차의 크기만 측정합니다.
→ 하지만 예측이 항상 과소되었는지, 항상 과대되었는지는 알 수 없습니다.

MPE는 오차의 부호(+)와 (−)를 유지하여,
→ 예측값이 평균적으로 실제보다 높은지 또는 낮은지를 보여줍니다.

 

◆ 해석 예시

  • MPE = +1.43% : 예측값이 실제보다 평균적으로 1.43% 더 높게 나오는 경향이 있다
    즉, 과대 예측(bias) 존재
  • MPE = -4%
    → 평균적으로 예측값이 실제보다 4% 더 낮게 나옴 (과소 예측)

◆ 사용 예

  • 예측 시스템이 편향되어 있는지(biased) 확인하고 싶을 때
  • 예: 수요 예측 시스템이 항상 수요보다 적게 예측하는가?
  • 모델이 과대 또는 과소 예측하는 경향을 보정하려 할 때
  • 예: 광고 예산을 계획할 때 항상 초과 예상하는 문제를 조정
  • MAPE = 6%, MPE = -2%
    → 예측은 평균적으로 6% 정도 틀렸고, 그 방향은 실제보다 2% 작게 나오는 경향

 

◆ 특징

  • 오차 방향(양/음)을 반영하여 과소/과대 예측 편향 분석 가능
  • MAPE처럼 % 단위로 단위 없이 해석 가능
  • 실제값이 0에 가까우면 MAPE와 마찬가지로 MPE도 불안정
    → 0 나눗셈 문제 또는 과도한 값 발생
  • 과소/과대가 번갈아 나타날 경우 평균 MPE가 0 근처가 되어,
    → 실제 모델 성능이 좋지 않은데도 정확한 것처럼 보일 수 있음

 

6. R²(R-squared) : 결정 계수

R²는 회귀 모델이 전체 데이터의 변동(분산)을 얼마나 잘 설명하고 있는지를 나타내는 지표입니다.
쉽게 말해, "모델이 실제 데이터의 패턴을 얼마나 잘 따라가고 있는가?"를 평가합니다.

하지만 변수가 많을수록 과도하게 높아질 수 있고, 과적합 모델도 높은 R²를 가질 수 있으므로,
단독 지표보다는 RMSE, MAE, Adjusted R² 등과 함께 사용해야 보다 신뢰성 있는 평가가 가능합니다.

 

값의 범위: 0 ~ 1 사이

  • R² = 1 → 완벽하게 설명 (모델 예측이 실제와 정확히 일치)
  • R² = 0 → 아무런 설명도 못함 (무작위 예측 수준)

 

모델이 예측한 값들이 실제값의 평균보다 오차가 더 작을수록, 즉 모델이 평균보다 더 잘 맞췄을수록 R²는 1에 가까워집니다.

 

◆ 해석 예시

예: R² = 0.92

  • 모델이 전체 데이터의 분산(변동성) 중 92%를 설명하고 있다는 뜻
  • 즉, 모델이 대부분의 데이터 패턴을 잘 포착하고 있음

예: R² = 0

  • 모델의 예측값이 실제값 평균과 차이가 없음
  • 즉, 무작위 예측과 동일한 수준의 설명력

예: R² = 1

  • 모델이 모든 데이터를 완벽히 예측
  • 예측값 = 실제값 (오차 없음)

"이 모델은 매출 데이터를 약 85% 수준으로 설명할 수 있어요."

 

 

7. 성능 지표 요약 비교

지표 실무 활용 특징 설명
MAE
(Mean Absolute Error)
가격 예측, 수요 예측, 교통 시간 예측 예상치 민감도: 낮음
오차의 절댓값 평균. 큰 오차에 덜 민감하고 직관적임. 실무에 많이 사용됨.
해석: MAE = 3.2 → “예측값이 실제값과 평균적으로 ±3.2만큼 차이 남
예시: 실제값 100, 예측값 97 → 오차 3 → MAE에 그대로 반영
MSE
(Mean Squared Error)
의료 예측, 금융 위험도 평가 예상치 민감도: 높음
오차를 제곱해서 평균하므로 큰 오차에 매우 민감함.
이상치가 중요하거나 큰 오차를 절대 피해야 하는 분야에서 적합.
해석: MSE = 25 → 오차가 평균적으로 5 정도 클 수 있음 (5² = 25)
예시: 오차 10 → 10² = 100 → 큰 오차 하나가 전체 MSE 상승시킴
RMSE
(Root Mean Squared Error)
시스템 응답시간 예측, 고객 대기시간 예측 예상치 민감도: 높음
MSE에 제곱근 적용. 해석이 MAE보다 더 자연스럽고 직관적.
해석: RMSE = 4 → 평균 ±4 정도의 오차 발생
해석: 실제값 100, 예측값 96 → 오차 4 → 직관적 이해 가능
MAPE
(Mean Absolute Percentage Error)
판매량, 이익률, 매출 예측 등 비율 기반 데이터 예상치 민감도: 중간
예측 오차를 비율(%)로 나타내므로 단위가 없어 다양한 항목 간 비교 가능.
하지만 실제값이 0에 가까우면 값이 폭등해 주의 필요.
해석: MAPE = 8% → “예측값이 실제값 대비 평균 8% 차이 남
예시: 실제 200, 예측 180 → 10% 오차 → MAPE에 반영
MPE
(Mean Percentage Error)
과대·과소 예측의 경향 파악, 영업전략 보완 예상치 민감도: 중간
예측이 평균적으로 실제보다 높은지(과대), 낮은지(과소) 파악 가능.
방향성 파악에 특화된 지표이나, 양수/음수가 섞이면 상쇄될 수 있음.
해석: MPE = -4% → “예측값이 실제보다 평균 4% 더 높게 나옴 (과대 예측)”
예시: 실제 100, 예측 104 → +4% 과대 예측

(결정계수)
모델 전반 성능 평가, 여러 모델 비교 예상치 민감도: 간접적
오차 크기 자체는 알려주지 않지만,모델이 실제 데이터를 얼마나 잘 설명하는지 %로 나타냄.
1에 가까울수록 우수한 모델.
단독 사용보다는 MAE, RMSE와 함께 사용 권장.
해석: R² = 0.92 → “데이터 분산의 92%를 모델이 설명함”
예시: 0.0 = 무작위 예측 수준, 1.0 = 완벽한 예측
  • MAE = 3.2 → 예측이 평균적으로 실제보다 약 ±3.2만큼 차이 남.
  • MAPE = 8% → 예측이 평균적으로 실제값의 8% 정도 차이 남.
  • MPE = -4% → 예측값이 평균적으로 실제보다 4% 높게 나옴 (과대 예측).
  • R² = 0.92 → 모델이 92%의 데이터 분산을 설명, 모델이 사용한 변수들로 잘 설명하고 있음.
  • RMSE > MAE 차이가 크면? → "이상치(큰 오차)가 많다"는 신호일 수 있음.

 

8. 모델 성능 평가 예시 : 집값 예측 모델

부동산 데이터를 기반으로 서울시 아파트의 실거래가를 예측하는 회귀 모델을 만들었다고 가정해봅시다.

 

◆ 평가 지표 결과

지표 해석
MAE 3,200만 원 예측이 실제 가격에서 평균 ±3,200만 원 정도 오차가 발생
RMSE 4,800만 원 큰 오차에 더 민감하게 측정했을 때도 약 ±4,800만 원 수준의 오차 발생
MAPE 7.6% 예측이 실제 거래가보다 평균적으로 7.6% 차이
MPE +1.8% 예측값이 평균적으로 실제값보다 1.8% 더 높게 나오는 경향 (과대 예측)
0.91 전체 집값 데이터의 91% 변동성을 모델이 설명하고 있음 → 높은 설명력

 

◆  MAE = 3,200만 원

  • “예측값은 평균적으로 실제 집값과 3,200만 원 정도 차이가 나며, 단위 그대로 해석이 가능합니다.”
  • 실무에서 금액 기준으로 예산 오차 범위를 평가할 때 유용

◆  RMSE = 4,800만 원

  • “큰 오차가 존재하는 경우가 있고, 이를 반영하면 평균적으로 약 4,800만 원의 오차가 발생합니다.”
  • 큰 손해나 이익을 우려해야 하는 투자자/개발사에 중요

◆  MAPE = 7.6%

  • “예측값이 실제 거래가보다 평균 7.6% 오차가 있습니다.”
  • 퍼센트 기반이라 동일 모델로 다른 지역 예측할 때도 비교가 용이

◆  MPE = +1.8%

  • “예측 모델이 평균적으로 실제 집값보다 1.8% 정도 더 높게 예측하고 있습니다.”
  • 가격을 과대 평가하는 경향이 있어, 모델을 보수적으로 조정할 필요 있음

◆  R² = 0.91

  • “이 모델은 집값 변동성의 91%를 설명할 수 있을 만큼 높은 설명력을 보입니다.”
  • 즉, 모델은 시장 트렌드나 지역 특성 반영에 효과적

◆  종합 평가 예시

이 회귀 모델은 서울 아파트 실거래가 예측에서 전체 데이터의 91%를 설명할 만큼 높은 설명력을 보이며, 평균적으로 약 3,200만 원(7.6%)의 오차를 가집니다.
다만, 예측값이 실제보다 평균 1.8% 정도 높게 나오는 경향이 있어, 보수적인 평가가 필요한 실거래 활용 상황에서는 보정 계수 적용이 필요합니다.
전반적으로 정확도와 설명력이 우수하며, 투자 및 실무 분석에 충분히 활용 가능한 모델입니다.

 


 

 

관련 글 링크

https://vitalflux.com/mse-vs-rmse-vs-mae-vs-mape-vs-r-squared-when-to-use/#google_vignette

 

MSE vs RMSE vs MAE vs MAPE vs R-Squared: When to Use?

Learn about when to use which evaluation metrics of regression models - MSE, RMSE, MAE, MAPE, R-Squared. Learn with Python & R Code Examples

vitalflux.com

 

728x90