Skip to main content

데이터 병합

두 개의 데이터 테이블을 특정한 열을 기준으로 병합하는 노드입니다.


설명

데이터 병합 노드는 두 개의 데이터셋을 공통 열을 기준으로 수평으로 병합합니다.

기준 열의 값이 같은 행끼리 매칭되며, 왼쪽 데이터에 오른쪽 데이터의 열들이 추가됩니다.

두 데이터셋 모두에 존재하는 행만 남습니다.


포트 구성

입력 포트

  • 데이터셋: 공동 열을 가진 두 개의 데이터셋

출력 포트

  • 데이터셋: 기준 열을 통해 병합된 하나의 데이터

속성

기준 열

기준 열은 왼쪽 데이터에서 선택 가능하며 두 데이터가 공통으로 가지고 있는 컬럼을 선택할 수 있습니다.

공통 컬럼을 선택하지 않으면 자동으로 선택됩니다.


노드 연결 설정

다른 노드의 출력 포트를 데이터 병합 노드와 연결할 때, 두 개의 입력 포트 중 어느 것에 연결할지 선택할 수 있는 노드 연결 설정 팝업이 표시됩니다.

  • 왼쪽: 데이터 병합 시 기준이 되는 테이블
  • 오른쪽: 데이터 병합 시 기준 테이블에 맞추어 추가되는 테이블

자세한 내용은 다중 포트 연결을 참고하세요.


예제

데이터 설명

두 개의 데이터셋을 병합하는 예제입니다.
학생의 기본 정보와 수강 과목 정보를 student_id 기준으로 합칩니다.
두 데이터셋 모두에 존재하는 학생만 남도록 병합됩니다.

  • students.csv: 학생의 기본 정보 (5명)
    • 컬럼: student_id, name, age, major
student_idnameagemajor
S001김민수21Computer Science
S002이서연22Mathematics
S003박지훈23Economics
S004최유진20Design
S005정하늘24Statistics
  • courses.csv: 수강 과목 및 성적 정보 (5명)
    • 컬럼: student_id, course_id, course_name, grade
student_idcourse_idcourse_namegrade
S001C101Python ProgrammingA
S002C102Linear AlgebraB+
S003C103MicroeconomicsA-
S004C104UX DesignB
S006C105Data AnalysisA
업로드 시간

S005는 수강 과목이 없고, S006은 학생 정보에 없는 데이터입니다.


데이터 병합 예제

노드 설정:

  • 기준 열: student_id
  • 왼쪽 데이터: students.csv
  • 오른쪽 데이터: courses.csv

결과:

student_idnameagemajorcourse_idcourse_namegrade
S001김민수21Computer ScienceC101Python ProgrammingA
S002이서연22MathematicsC102Linear AlgebraB+
S003박지훈23EconomicsC103MicroeconomicsA-
S004최유진20DesignC104UX DesignB

요약:

  • student_id를 기준으로 병합됨
  • 두 데이터셋 모두에 존재하는 학생만 남음 (S001~S004)
  • 왼쪽에만 있는 S005, 오른쪽에만 있는 S006은 제외됨
  • 총 행 개수: 4행, 열 개수: 7개

데이터 병합 예제