데이터 분할
입력받은 데이터셋을 설정한 비율과 방법에 따라 분할합니다.
Last updated
입력받은 데이터셋을 설정한 비율과 방법에 따라 분할합니다.
Last updated
데이터셋
데이터셋: 샘플링된 데이터셋
데이터셋: 남은 데이터셋
데이터 분할은 입력받은 데이터셋에서 설정한 분할 비율에 따라 데이터 인스턴스의 하위 집합을 선택하여 데이터를 분할합니다. 샘플링이 완료된 데이터셋과 샘플링된 데이터셋에 포함되지 않은 데이터셋으로 분할하여 데이터 테이블을 저장하도록 출력할 수 있습니다.
데이터 분할 노드를 다른 노드의 입력 포트와 연결할 때, 노드 연결 설정을 진행할 수 있습니다.
데이터 분할 비율 : 분할하고 싶은 비율 입력(기본 = 0.7)
데이터 분할 방법 선택
단순 랜덤 : 데이터 포인트를 무작위로 분할
계층 분할 : 각 분할에서 전체 데이터셋과 동일한 비율의 카테고리 유지 (한 카테고리의 데이터가 다른 카테고리보다 많은 경우에 유용함)
시계열 분할 : 시간 순서를 고려하여 분할