AI Canvas
AI Canvas 바로가기
  • 시작하기
    • 서비스 소개
    • 주요 용어 설명
    • 계정 및 언어 설정
  • 캔버스 기본 사용법
    • 캔버스 탭 관리
    • 캔버스 화면 관리
    • 캔버스 공유 및 권한 설정
    • 노드 조작 및 관리
    • 엣지 조작 및 관리
    • 스케줄 설정
    • 노드별 크레딧 소모량
  • 노드 종류
    • 데이터
      • URL 리더
      • 데이터
      • PDF 데이터
      • 데이터 분할
      • 데이터 저장소
      • 명령 프롬프트
      • 예제 데이터
      • 이미지 데이터
      • 텍스트 입력
      • 텍스트-데이터 변환
    • API
      • 기업공시
      • 깃허브 커밋
      • 대화형 아바타
      • 크롤링
      • 프롬프트
    • 전처리
      • 결측치 채우기
      • 그룹화
      • 데이터 병합
      • 데이터 비닝
      • 데이터 수정
      • 데이터 어노테이션
      • 데이터 연결
      • 스케일링
      • 슬라이싱
      • 열 선택
      • 열 타입 변경
      • 이미지 임베딩
      • 이상치 제거
      • 중복 제거
      • 차원 축소
      • 텍스트 임베딩
      • 텍스트 전처리
      • 특성 생성
      • 파이썬 스크립트
      • 표본 재추출
      • 픽셀 변환
      • 행 결합
      • 행 선택
    • 모델
      • YOLO 모델
      • 결정 트리
      • 그래디언트 부스팅
      • 랜덤 포레스트
      • 로지스틱 회귀
      • 모델 학습
      • 서포트 벡터 머신
      • 선형 회귀
      • 시계열 모델 학습
      • 신경망
      • 얼굴 인식
      • 에이다 부스트
      • 일괄 예측
      • 추천 SVD++
      • 추천 모델 학습
      • 추천 베이스라인
      • 프로펫
    • 평가
      • ROC 커브
      • 메트릭
      • 모델 평가
      • 에러 히스토그램
      • 정답 비율
      • 정확도
      • 특성 중요도
      • 특성 중요도 비교
      • 혼동 행렬
    • 알림
      • 이메일 전송
    • 시각화
      • 막대 그래프
      • 수평 막대 그래프
      • 선도표
      • 바이올린 플롯
      • 박스 플롯
      • 산점도 그래프
      • 히트맵
      • 원 그래프
      • 게이지 차트
      • 버블 차트
      • 결측치 비율
      • 데이터 개수
      • 예측값 비교
      • 평균 비교
      • PR 트랜드
      • 특성 통계
      • 평균 예측값
      • 워드클라우드
    • UI
      • 데이터 정보
      • 데이터 테이블
      • 리스트
      • 버튼
      • 샌드박스
      • 아이콘
      • 예측하기
      • 이미지 뷰어
      • 챗 UI
      • 텍스트 출력
      • 텍스트 편집기
      • 페이지
      • 필터
      • 행
      • PDF 뷰어
      • CM
    • 애플리케이션
      • 애플리케이션
    • 배포
      • 배포
  • 워크스페이스 관리
    • 워크스페이스 보기
    • 워크스페이스 생성 및 설정
    • 워크스페이스 공유 및 권한 설정
  • 애플리케이션 페이지
    • 로그인 및 로그아웃
    • 설정 및 캔버스
    • 권한 및 멤버 관리
  • 캔버스 실습 가이드
    • 1. AI 모델 구축
      • 데이터셋 준비
        • 데이터셋 업로드
      • 탐색적 데이터 분석
        • 데이터 살펴보기
        • 결측치 확인하기
      • 데이터 전처리
        • 결측치 채우기
        • 열 선택
      • AI 모델 구축
        • 데이터 분할
        • 학습 알고리즘 선택
        • 모델 학습
        • 모델 사용해보기
      • 데이터 검증
        • 검증 진행
      • 모델 평가
        • 모델 평가
        • 특성 중요도 살펴보기
      • 결과 화면
    • 2. 데이터 시각화
      • 막대 그래프
      • 박스 플롯
      • 산점도 그래프
      • 원 그래프
      • 데이터 개수
      • 에러 히스토그램
      • 예측값 비교
      • 결과 화면
    • 3. 대시보드 UI 제작 및 애플리케이션 구축/배포
      • 페이지 구성하기
      • 애플리케이션 구축
      • 애플리케이션 배포
      • 결과 화면
    • 4. 프레임을 활용한 프레젠테이션 및 캔버스 공유
      • 프레임을 활용한 프레젠테이션
      • 캔버스 공유하기
    • 가이드 전체 영상
  • 인공지능 교육 영상
    • 회귀 모델의 평가지표
    • 분류 모델의 평가지표
Powered by GitBook
On this page
  • 설정
  • 예제
  1. 노드 종류
  2. 모델

모델 학습

주어진 데이터를 바탕으로 모델을 학습시킵니다.

Previous로지스틱 회귀Next서포트 벡터 머신

Last updated 8 months ago

입력 포트

  • 데이터셋

  • 미학습 모델

출력 포트

  • 학습된 모델

설정

  1. 모델 이름

    입력한 이름은 워크스페이스 목록에서 해당 모델의 이름으로 표시됩니다. 모델을 쉽게 식별할 수 있도록 구체적이고 명확한 이름을 입력하세요.

  2. 대상 레이블 선택 모델에 주입할 정답 데이터인 레이블을 선택합니다. 이는 모델이 예측한 출력과 비교해 오차를 최소화할 수 있는 방향으로 모델의 파라미터를 업데이트합니다.

  3. 학습 방법 선택

    • 단순 학습 : 주어진 데이터를 모델의 학습을 위한 학습 데이터, 모델의 성능을 평가하기 위한 테스트 데이터로 나눕니다. 전체 데이터를 학습에 사용하고, 학습된 모델의 성능을 평가하기 위해 테스트 데이터를 사용합니다. 데이터를 학습 데이터와 테스트 데이터로 나눌 때, 일반적으로 일정 비율(예: 70% 학습, 30% 테스트)로 분할합니다. 이는 간단하고 빠르게 모델을 학습하고 평가할 수 있지만, 데이터 분할에 따라 모델의 성능이 달라질 수 있는 단점이 있습니다.

    • k-fold 교차 검증, k-fold의 k값 설정 : 데이터를 K개의 폴드(fold)로 나누어 모델 학습과 성능 평가를 수행합니다. 전체 데이터를 K개의 폴드로 나누고, K번의 반복을 수행합니다. 각 반복에서는 K-1개의 폴드를 학습 데이터로 사용하고, 남은 1개의 폴드를 테스트 데이터로 사용하여 모델의 성능을 평가합니다. 이 과정을 K번 반복하여 모든 폴드가 한 번씩 테스트 데이터로 사용되고, 모델의 성능은 K번의 평가 결과를 평균내어 얻습니다. K-fold 교차 검증은 단순 학습보다 안정적이고 신뢰할 수 있는 성능 평가를 제공합니다.

    • 데이터 섞기 여부 결정 : 데이터셋의 순서에 따른 편향을 줄이기 위해 데이터셋을 일정한 순서로 나열한 후 순서를 무작위로 해 섞을 것인지를 결정합니다.

    • 그리드 서치를 통한 하이퍼파라미터 튜닝 : 그리드 서치는 모든 가능한 하이퍼파라미터 조합을 탐색해 모델을 학습하고 검증하고 모델의 성능을 최적화합니다. 그리드 서치는 모든 하이퍼파라미터 조합을 시도하기 때문에 탐색 범위가 큰 경우에는 비효율적일 수 있지만, 탐색 범위가 작을 때는 간단하고 효과적인 방법이 될 수 있습니다.

    • 하이퍼파라미터 그리드 서치의 매개변수 수 입력 : 하이퍼파라미터마다 후보값의 집합을 정의하고, 이를 조합해 그리드 서치를 수행하는데, 조합 가능한 하이퍼파라미터의 수를 입력합니다. 매개변수의 수가 적절하게 많을수록 가능한 조합의 수가 증가하므로 학습 데이터에 대한 성능이 향상될 수 있습니다. 반대로 수가 적을수록 가능한 조합의 수가 감소하므로 학습 데이터에 대한 성능이 감소할 수 있습니다.

예제

*학습 데이터의 용량이 크거나 모델 특성에 따라 모델 학습에 시간이 다소 소요될 수 있으나, 백그라운드로 나가도 학습은 계속되오니 자유롭게 워크스페이스를 드나들어도 됩니다.*