Skip to main content

로지스틱 회귀

로지스틱 함수를 사용하여 이진 분류 문제를 해결하는 머신러닝 모델입니다.


설명

로지스틱 회귀는 입력 데이터를 기반으로 특정 범주에 속할 확률을 예측하는 분류 알고리즘입니다.

로지스틱 함수(시그모이드 함수)를 사용하여 출력값을 0과 1 사이의 확률로 변환합니다.

이진 분류(예: 합격/불합격, 스팸/정상) 문제에 특히 적합하며, 해석이 쉽고 계산 효율이 높습니다.


포트 구성

입력 포트

없음

출력 포트

  • 미학습 모델: 학습되지 않은 로지스틱 회귀 모델 (학습 노드에 연결하여 사용)

속성

모드

회귀 모델의 유형과 규제 방법을 선택합니다.

  • 단순: 규제 없이 독립 변수와 종속 변수 간의 선형 관계를 학습합니다

    • 가장 기본적인 형태
  • 릿지 (Ridge): L2 규제를 적용한 모델

    • 모델의 가중치를 제한하여 과적합 방지
    • 변수들 간의 상관관계가 높을 때 유용
  • 라쏘 (Lasso): L1 규제를 적용한 모델

    • 일부 가중치를 0으로 만들어 변수 선택 가능
    • 중요하지 않은 변수를 자동으로 제거
  • 엘라스틱넷 (ElasticNet): L1 + L2 규제를 결합한 모델

    • 변수 선택과 과적합 방지를 동시에 수행
    • 상관관계가 높고 변수 선택이 필요한 경우 유용

레이블 불균형을 위한 클래스 가중치 사용

클래스 불균형 문제를 해결하기 위해 가중치를 조정합니다.

레이블 불균형이란 한 클래스의 데이터가 다른 클래스보다 훨씬 많은 경우를 말합니다.

  • 사용: 데이터가 적은 클래스에 높은 가중치 부여
    • 불균형한 데이터에 공정하게 대응
    • 소수 클래스의 예측 성능 향상
  • 미사용: 모든 클래스에 동일한 가중치 적용
    • 데이터가 균형적인 경우 사용

사용 방법

  1. 로지스틱 회귀 노드를 캔버스에 추가합니다
  2. 모드를 선택합니다 (단순, 릿지, 라쏘, 엘라스틱넷)
  3. 레이블 불균형이 있다면 클래스 가중치 사용을 설정합니다
  4. 출력된 미학습 모델을 모델 학습 노드에 연결합니다
  5. 학습용 데이터셋을 모델 학습 노드에 연결합니다
  6. 학습이 완료되면 학습된 모델을 일괄 예측 노드와 모델 평가 노드에서 사용할 수 있습니다

예제

로지스틱 회귀 예제