특성 중요도 비교
모델의 전체 데이터와 선택된 데이터에 대한 특성 중요도를 비교하는 노드입니다.
설명
특성 중요도 비교 노드는 학습된 모델에서 전체 데이터와 선택된 데이터 간의 특성 중요도를 비교하는 도구입니다.
왜 사용하나요?
같은 모델이라도 데이터가 다르면 각 특성의 중요도가 달라질 수 있습니다. 예를 들어:
- 전체 자동차 데이터에서는
engine-size가 가장 중요할 수 있지만 - 특정 브랜드(audi) 데이터만 보면
compression-ratio가 더 중요할 수 있습니다
이 노드를 사용하면 이런 차이를 한눈에 확인할 수 있습니다.
그래프 구성
각 특성마다 두 개의 막대가 나란히 표시됩니다:
- 진한 파란색 막대: 전체 데이터에서의 특성 중요도
- 빨간색 막대: 선택된 데이터에서의 특성 중요도
막대의 높이는 중요도 점수를 나타내며, 두 막대를 비교하여 어떤 데이터에서 특성이 더 중요한지 쉽게 파악할 수 있습니다.
포트 구성
입력 포트
- 데이터셋: 전체 데이터셋
- 데이터셋: 선택된 데이터셋
- 데이터셋을 연결했을 때 여러 행이 있을 경우, 첫 번째 행이 자동으로 선택됩니다.
- 학습된 모델: 학습이 완료된 모델 (모델 학습 노드의 출력)
출력 포트
없음
설정
색상
막대 색상을 변경할 수 있습니다. 전체 데이터와 선택된 데이터를 구분하기 위한 색상을 커스터마이징할 수 있습니다.
X축 / Y축
축에 표시되는 텍스트의 글꼴 스타일을 변경할 수 있습니다. 레이블과 텍스트의 가독성을 개선하기 위해 글꼴 설정을 조정할 수 있습니다.
사용 방법
- 특성 중요도 비교 노드를 캔버스에 추가합니다
- 모델 학습 노드의 출력(학습된 모델)을 세 번째 입력 포트에 연결합니다
- 모델 학습에 사용된 전체 데이터셋을 첫 번째 입력 포트에 연결합니다
- 비교하고자 하는 선택된 데이터셋을 두 번째 입력 포트에 연결합니다
- 리스트 노드에서 특정 행을 선택한 후 연결할 수 있습니다
- 노드를 실행하면 전체 데이터와 선택된 데이터의 특성 중요도가 비교 그래프로 표시됩니다
- 그래프를 분석하여 두 데이터셋 간의 특성 중요도 차이를 확인합니다
예제
