모델 학습
주어진 데이터를 바탕으로 모델을 학습시킵니다.
Last updated
주어진 데이터를 바탕으로 모델을 학습시킵니다.
Last updated
데이터셋
미학습 모델
학습된 모델
모델 이름
입력한 이름은 워크스페이스 목록에서 해당 모델의 이름으로 표시됩니다. 모델을 쉽게 식별할 수 있도록 구체적이고 명확한 이름을 입력하세요.
대상 레이블 선택 모델에 주입할 정답 데이터인 레이블을 선택합니다. 이는 모델이 예측한 출력과 비교해 오차를 최소화할 수 있는 방향으로 모델의 파라미터를 업데이트합니다.
학습 방법 선택
단순 학습 : 주어진 데이터를 모델의 학습을 위한 학습 데이터, 모델의 성능을 평가하기 위한 테스트 데이터로 나눕니다. 전체 데이터를 학습에 사용하고, 학습된 모델의 성능을 평가하기 위해 테스트 데이터를 사용합니다. 데이터를 학습 데이터와 테스트 데이터로 나눌 때, 일반적으로 일정 비율(예: 70% 학습, 30% 테스트)로 분할합니다. 이는 간단하고 빠르게 모델을 학습하고 평가할 수 있지만, 데이터 분할에 따라 모델의 성능이 달라질 수 있는 단점이 있습니다.
k-fold 교차 검증, k-fold의 k값 설정 : 데이터를 K개의 폴드(fold)로 나누어 모델 학습과 성능 평가를 수행합니다. 전체 데이터를 K개의 폴드로 나누고, K번의 반복을 수행합니다. 각 반복에서는 K-1개의 폴드를 학습 데이터로 사용하고, 남은 1개의 폴드를 테스트 데이터로 사용하여 모델의 성능을 평가합니다. 이 과정을 K번 반복하여 모든 폴드가 한 번씩 테스트 데이터로 사용되고, 모델의 성능은 K번의 평가 결과를 평균내어 얻습니다. K-fold 교차 검증은 단순 학습보다 안정적이고 신뢰할 수 있는 성능 평가를 제공합니다.
데이터 섞기 여부 결정 : 데이터셋의 순서에 따른 편향을 줄이기 위해 데이터셋을 일정한 순서로 나열한 후 순서를 무작위로 해 섞을 것인지를 결정합니다.
그리드 서치를 통한 하이퍼파라미터 튜닝 : 그리드 서치는 모든 가능한 하이퍼파라미터 조합을 탐색해 모델을 학습하고 검증하고 모델의 성능을 최적화합니다. 그리드 서치는 모든 하이퍼파라미터 조합을 시도하기 때문에 탐색 범위가 큰 경우에는 비효율적일 수 있지만, 탐색 범위가 작을 때는 간단하고 효과적인 방법이 될 수 있습니다.
하이퍼파라미터 그리드 서치의 매개변수 수 입력 : 하이퍼파라미터마다 후보값의 집합을 정의하고, 이를 조합해 그리드 서치를 수행하는데, 조합 가능한 하이퍼파라미터의 수를 입력합니다. 매개변수의 수가 적절하게 많을수록 가능한 조합의 수가 증가하므로 학습 데이터에 대한 성능이 향상될 수 있습니다. 반대로 수가 적을수록 가능한 조합의 수가 감소하므로 학습 데이터에 대한 성능이 감소할 수 있습니다.
*학습 데이터의 용량이 크거나 모델 특성에 따라 모델 학습에 시간이 다소 소요될 수 있으나, 백그라운드로 나가도 학습은 계속되오니 자유롭게 워크스페이스를 드나들어도 됩니다.*