Skip to main content

일괄 예측

학습된 모델을 사용하여 대량의 데이터에 대한 예측을 일괄적으로 수행하는 노드입니다.


설명

일괄 예측 노드는 학습이 완료된 모델을 실제 데이터에 적용하여 예측 결과를 생성합니다.

모델 학습 단계에서 학습된 패턴을 바탕으로 새로운 데이터의 레이블을 예측하며, 분류 문제의 경우 각 클래스에 속할 확률도 함께 제공할 수 있습니다.

대량의 데이터를 한 번에 처리할 수 있어, 실시간 예측이 아닌 배치 처리 방식으로 효율적인 예측이 가능합니다.


포트 구성

입력 포트

  • 데이터셋: 예측을 수행할 데이터셋
  • 학습된 모델: 모델 학습 노드에서 출력된 학습 완료 모델

출력 포트

  • 예측된 데이터셋: 예측 결과가 추가된 데이터셋

출력 데이터셋

분류 문제

컬럼명설명
(원본 데이터)입력 데이터의 모든 열
predicted [대상 레이블]모델이 예측한 클래스
scored_[클래스명]각 클래스에 속할 확률 (점수 열 추가 시)

예시:

  • 원본 데이터: 나이, 성별, 연봉 등
  • predicted 대출승인: 예측된 결과 (승인)
  • scored_승인: 승인 클래스에 속할 확률 (0.85)
  • scored_거절: 거절 클래스에 속할 확률 (0.15)

회귀 문제

컬럼명설명
(원본 데이터)입력 데이터의 모든 열
scored_[대상 레이블]모델이 예측한 연속값

예시:

  • 원본 데이터: 면적, 방 개수, 위치 등
  • scored_price: 예측된 주택 가격 (320000000)

추천 시스템

컬럼명설명
(원본 데이터)입력 데이터의 모든 열
inferred_[대상 레이블]모델이 예측한 평점/선호도 값

예시:

  • 원본 데이터: 사용자ID, 영화ID
  • inferred_평점: 예측된 평점 (4.14)

속성

원본 데이터 포함 여부

원본 데이터를 출력 데이터셋에 포함할지 선택합니다.

  • 활성화: 원본 데이터 포함

    • 모든 원본 데이터 열 + 예측 결과
    • 데이터 분석 및 비교에 유용
    • 예측 전후 데이터를 함께 확인 가능
  • 해제: 원본 데이터 제거

    • 예측 결과 + 원본 레이블 열만 출력
    • 간단한 예측 결과 확인에 적합
    • 데이터셋 크기 감소

사용 방법

  1. 일괄 예측 노드를 캔버스에 추가합니다
  2. 예측할 데이터셋을 입력 포트에 연결합니다
  3. 모델 학습 노드에서 출력된 학습된 모델을 연결합니다
  4. 점수 열 추가 여부를 선택합니다
  5. 노드를 실행하면 예측 결과가 포함된 데이터셋이 출력됩니다
  6. 데이터 테이블 노드에 연결하여 예측 결과를 확인할 수 있습니다
  7. 모델 평가 노드에 연결하여 모델의 성능을 평가할 수 있습니다

예제

일괄 예측 예제


주의사항

입력 데이터 형식

예측할 데이터는 모델 학습 시 사용한 데이터와 동일한 구조를 가져야 합니다.

  • 동일한 컬럼명
  • 동일한 데이터 타입
  • 동일한 특성(feature) 수

: 학습 시 "나이, 성별, 연봉" 3개 특성을 사용했다면, 예측 데이터에도 동일한 3개 특성이 있어야 합니다.

대상 레이블 열

예측할 데이터에는 대상 레이블 열이 없어도 됩니다.

  • 레이블이 없는 데이터: 순수 예측 수행
  • 레이블이 있는 데이터: 예측 후 모델 평가에 활용 가능

점수 열 해석

분류 문제에서 점수 열의 값은 확률을 나타내며, 모든 클래스의 점수 합은 1.0입니다.

  • scored_승인: 0.85, scored_거절: 0.15
  • 승인일 확률 85%, 거절일 확률 15%
  • 높은 점수 = 모델의 높은 확신도

회귀 문제에서는 예측된 연속값이 그대로 출력됩니다.