로지스틱 회귀
로지스틱 함수를 사용하여 이진 분류 문제를 해결하는 머신러닝 모델입니다.
설명
로지스틱 회귀는 입력 데이터를 기반으로 특정 범주에 속할 확률을 예측하는 분류 알고리즘입니다.
로지스틱 함수(시그모이드 함수)를 사용하여 출력값을 0과 1 사이의 확률로 변환합니다.
이진 분류(예: 합격/불합격, 스팸/정상) 문제에 특히 적합하며, 해석이 쉽고 계산 효율이 높습니다.
포트 구성
입력 포트
없음
출력 포트
- 미학습 모델: 학습되지 않은 로지스틱 회귀 모델 (학습 노드에 연결하여 사용)
속성
모드
회귀 모델의 유형과 규제 방법을 선택합니다.
-
단순: 규제 없이 독립 변수와 종속 변수 간의 선형 관계를 학습합니다
- 가장 기본적인 형태
-
릿지 (Ridge): L2 규제를 적용한 모델
- 모델의 가중치를 제한하여 과적합 방지
- 변수들 간의 상관관계가 높을 때 유용
-
라쏘 (Lasso): L1 규제를 적용한 모델
- 일부 가중치를 0으로 만들어 변수 선택 가능
- 중요하지 않은 변수를 자동으로 제거
-
엘라스틱넷 (ElasticNet): L1 + L2 규제를 결합한 모델
- 변수 선택과 과적합 방지를 동시에 수행
- 상관관계가 높고 변수 선택이 필요한 경우 유용
레이블 불균형을 위한 클래스 가중치 사용
클래스 불균형 문제를 해결하기 위해 가중치를 조정합니다.
레이블 불균형이란 한 클래스의 데이터가 다른 클래스보다 훨씬 많은 경우를 말합니다.
- 사용: 데이터가 적은 클래스에 높은 가중치 부여
- 불균형한 데이터에 공정하게 대응
- 소수 클래스의 예측 성능 향상
- 미사용: 모든 클래스에 동일한 가중치 적용
- 데이터가 균형적인 경우 사용
사용 방법
- 로지스틱 회귀 노드를 캔버스에 추가합니다
- 모드를 선택합니다 (단순, 릿지, 라쏘, 엘라스틱넷)
- 레이블 불균형이 있다면 클래스 가중치 사용을 설정합니다
- 출력된 미학습 모델을 모델 학습 노드에 연결합니다
- 학습용 데이터셋을 모델 학습 노드에 연결합니다
- 학습이 완료되면 학습된 모델을 일괄 예측 노드와 모델 평가 노드에서 사용할 수 있습니다
예제
