Skip to main content

에러 히스토그램

회귀 모델의 예측 오차 분포를 히스토그램으로 시각화하는 노드입니다.


설명

에러 히스토그램 노드는 회귀 모델의 예측 오차(실제값과 예측값의 차이)를 히스토그램 형태로 시각화하여 모델의 성능을 분석하는 도구입니다.

일괄 예측이 완료된 데이터셋을 입력받아 각 샘플의 예측 오차를 계산하고, 오차 값의 분포를 히스토그램으로 표시합니다. 이를 통해 모델이 어떤 범위의 오차를 주로 발생시키는지, 오차의 분포가 정규분포에 가까운지 등을 확인할 수 있습니다.

회귀 모델 전용

에러 히스토그램 노드는 회귀 모델의 평가에만 사용할 수 있습니다. 분류 모델의 평가에는 사용할 수 없습니다.


포트 구성

입력 포트

  • 데이터셋: 일괄 예측이 완료된 데이터셋 (예측값과 실제값 포함)

출력 포트

없음


히스토그램 해석

  • X축: 예측 오차 값의 범위
  • Y축: 각 오차 구간에 속하는 샘플의 빈도

에러 히스토그램을 해석할 때는 다음 세 가지를 확인합니다:

  1. 오차가 0에 얼마나 집중되어 있는지: 작은 오차 구간에 샘플이 많이 몰려 있으면 모델의 기본적인 예측력이 좋은 편입니다.
  2. 오차가 커질수록 분포가 어떻게 변화하는지: 정상적인 경우 오차가 증가함에 따라 빈도가 점진적으로 줄어드는 형태를 보입니다.
  3. 이상치가 존재하는지: 오른쪽 꼬리가 길게 나타나거나 특정 구간에 예상보다 많은 샘플이 있으면 추가 분석이 필요할 수 있습니다.

예시 해석

에러 히스토그램

위 예시 히스토그램에서는 작은 오차 구간에 대부분의 샘플이 몰려 있어 모델의 기본적인 예측력은 좋은 편입니다. 오차가 증가함에 따라 빈도가 급격히 줄어드는 정상적인 형태를 보이며, 오른쪽 꼬리가 길게 나타나 일부 샘플에서 큰 오차가 발생한 것을 확인할 수 있습니다.

이러한 큰 오차 구간의 샘플은 모델이 특정 패턴을 잘 학습하지 못했거나, 데이터 품질 이슈가 있을 가능성이 있으므로 추가 분석이 필요할 수 있습니다.


사용 방법

  1. 에러 히스토그램 노드를 캔버스에 추가합니다
  2. 일괄 예측 노드의 출력 데이터셋을 입력 포트에 연결합니다
  3. 노드를 실행하면 예측 오차의 히스토그램이 노드 바디에 표시됩니다
  4. 히스토그램을 분석하여 모델의 오차 분포를 확인합니다

예제

에러 히스토그램 예제

주의사항

회귀 모델만 지원

에러 히스토그램 노드는 회귀 문제에만 사용할 수 있습니다. 분류 모델의 평가에는 혼동 행렬이나 ROC 곡선 노드를 사용하세요.