중복 제거
데이터에서 중복된 행을 제거하는 노드입니다.
설명
중복 제거 노드는 데이터셋에서 중복된 값을 가진 행을 제거합니다.
특정 열을 기준으로 중복을 확인하며, 중복된 행 중 첫 번째 행 또는 마지막 행을 유지할 수 있습니다.
데이터 정제 및 분석 시 불필요한 중복 데이터를 제거하는 데 유용합니다.
포트 구성
입력 포트
- 데이터셋
출력 포트
- 데이터셋: 중복된 값이 제거된 데이터
속성
대상 열 선택
중복 확인 작업을 수행할 열을 선택합니다.
선택한 열의 값을 기준으로 중복 여부를 판단합니다.
중복된 항목 중 어떤 행을 유지할지 선택
대상 열에서 중복된 값들을 가지는 행들 중 데이터셋에 유지할 행을 선택합니다:
- 첫 번째 행: 중복된 값 중 가장 처음 나타나는 행을 유지합니다
- 마지막 행: 중복된 값 중 가장 마지막에 나타나는 행을 유지합니다
사용 방법
- 노드를 캔버스에 추가합니다
- 데이터셋을 입력 포트에 연결합니다
- 속성에서 중복을 확인할 대상 열을 선택합니다
- 중복된 항목 중 유지할 행(첫 번째 또는 마지막)을 선택합니다
- 노드를 실행하면 중복된 행이 제거됩니다