서포트 벡터 머신
서포트 벡터를 사용하여 데이터를 분류하거나 회귀 분석을 수행하는 머신러닝 모델입니다.
설명
서포트 벡터 머신(SVM)은 데이터를 분류하기 위한 최적의 결정 경계를 찾는 알고리즘입니다.
두 클래스 사이의 마진(거리)을 최대화하는 초평면을 찾아 데이터를 분리하며, 경계에 가장 가까운 데이터 포인트(서포트 벡터)를 기준으로 합니다.
커널 함수를 사용하여 선형적으로 분리되지 않는 데이터를 고차원 공간으로 변환하여 분류할 수 있습니다.
포트 구성
입력 포트
없음
출력 포트
- 미학습 모델: 학습되지 않은 서포트 벡터 머신 모델 (학습 노드에 연결하여 사용)
속성
커널
선형적으로 분리되지 않는 데이터를 고차원 공간으로 변환하는 커널 함수를 선택합니다.
-
RBF (방사 기저 함수): 가우시안 분포 기반으로 무한 차원 공간으로 매핑
- 비선형 데이터에 효과적
- 가장 널리 사용되는 커널
-
선형: 입력 데이터를 그대로 사용하여 선형 분리 수행
- 고차원 매핑 없음
- 선형적으로 분리 가능한 데이터에 적합
-
다항식: 다항식 함수로 고차원 공간으로 매핑
- 주어진 차수의 다항식으로 데이터 변환
- 곡선 형태의 결정 경계 생성
-
시그모이드: 로지스틱 시그모이드 함수로 고차원 공간으로 매핑
- 신경망과 유사한 동작
감마
커널 함수의 폭을 제어하는 파라미터입니다.
-
작은 값: 커널 함수의 폭이 넓어짐, 모델이 단순해짐
- 데이터 포인트들 간의 영향 범위가 넓음
- 과소적합 가능성
-
큰 값: 커널 함수의 폭이 좁아짐, 모델이 복잡해짐
- 데이터 포인트들 간의 영향 범위가 좁음
- 과적합 가능성
적절한 감마 값을 찾기 위해 모델 성능을 평가하고 조정하는 과정이 필요합니다.
사용 방법
- 서포트 벡터 머신 노드를 캔버스에 추가합니다
- 커널 함수를 선택합니다 (RBF, 선형, 다항식, 시그모이드)
- 감마 값을 설정합니다
- 출력된 미학습 모델을 모델 학습 노드에 연결합니다
- 학습용 데이터셋을 모델 학습 노드에 연결합니다
- 학습이 완료되면 학습된 모델을 일괄 예측 노드와 모델 평가 노드에서 사용할 수 있습니다
예제
