슬라이싱
데이터를 시작지점과 종료지점을 기준으로 자르는 노드입니다.
설명
슬라이싱 노드는 데이터셋의 특정 열에서 원하는 범위의 데이터만 추출합니다.
시작 지점과 종료 지점을 지정하여 필요한 부분만 잘라낼 수 있습니다.
포트 구성
입력 포트
- 데이터셋: 슬라이싱할 데이터셋
출력 포트
- 데이터셋: 슬라이싱된 데이터셋
속성
대상 열 선택
슬라이싱할 열을 선택합니다.
시작 지점
추출하려는 데이터의 시작 지점을 입력합니다.
최솟값은 1입니다.
종료 지점
추출하려는 데이터의 종료 지점을 입력합니다.
시작 지점부터 종료 지점까지의 데이터가 추출됩니다.
예제
데이터 설명
리뷰 텍스트가 포함된 데이터셋입니다.
각 행은 고객의 리뷰 한 건을 나타내며, Review 열에는 문장형 텍스트가 포함되어 있습니다.
| ID | Review |
|---|---|
| 1 | 서비스가 매우 만족스러웠습니다. |
| 2 | 배송이 느렸어요. |
| 3 | 품질이 좋아요. |
| 4 | 가격이 조금 비싸요. |
| 5 | 포장이 꼼꼼했습니다. |
| 6 | 직원 응대가 친절했어요. |
| 7 | 재구매 의사 있습니다. |
| 8 | 색상이 화면과 달라요. |
| 9 | 설명과 동일한 제품이에요. |
| 10 | 배송이 빠르고 포장도 좋아요. |
슬라이싱 예제
Review 열에서 텍스트의 일부분만 추출합니다.
예를 들어, 문장의 앞부분만 자르거나 특정 위치부터 끝까지의 일부만 볼 수 있습니다.
노드 설정:
- 대상 열:
Review - 시작 지점: 1
- 종료 지점: 10
결과:
| ID | Review |
|---|---|
| 1 | 서비스가 매우 |
| 2 | 배송이 느렸어 |
| 3 | 품질이 좋아요 |
| 4 | 가격이 조금 |
| 5 | 포장이 꼼꼼 |
| 6 | 직원 응대가 |
| 7 | 재구매 의사 |
| 8 | 색상이 화면 |
| 9 | 설명과 동일한 |
| 10 | 배송이 빠르고 |
요약:
Review열에서 텍스트의 1번째 문자부터 10번째 문자까지를 추출함- 텍스트 길이를 제한하거나 전처리 과정에서 문장의 일부분만 사용할 때 유용함
- 총 행 개수: 10행, 원본 데이터 구조 유지
