데이터 비닝

데이터를 특정 기준에 따라 여러 구간으로 나눕니다.

입력 포트

  • 데이터셋

출력 포트

  • 데이터셋: 특정 열의 값이 Binning 된 데이터

설정

  1. 대상 열 선택

    • Binning할 열을 선택합니다. Category 값을 포함하는 열은 선택할 수 없습니다.

  2. Binning 모드

    • 등간격: 열의 값들의 범위를 구간 개수만큼 나누고, 해당 범위 안의 값들을 오름차순으로 '0', '1', ..., '구간개수-1' 로 Binning 합니다.

    • 등빈도: 열의 값들을 오름차순으로 정렬한 후, '총 행의 수/구간 개수'만큼 오름차순으로 각각 '0', '1', ..., '구간 개수-1'로 Binning 합니다.

    • 사용자 설정: 기준값을 입력하면, 열 내의 값들은 기준값 이하는 0, 기준값 초과는 1로 Binning 됩니다. 기준값에서 소수점 이하의 값은 고려하지 않습니다.

  3. 구간 개수

    • 구간 개수를 설정합니다. 2 이상의 정수만 입력할 수 있습니다.

예제

Last updated