스케일링
데이터의 값 범위를 조절하여 동일한 척도로 맞춥니다.
Last updated
데이터의 값 범위를 조절하여 동일한 척도로 맞춥니다.
Last updated
데이터셋
데이터셋: 스케일링이 적용된 데이터 셋
스케일링은 데이터의 값 범위를 조절하는 과정으로, 다양한 변수 간에 공평한 비교를 가능하게 합니다. 기법으로는 대표적으로 표준 정규화와 최소-최대 정규화가 있습니다. 스케일링을 통해 모델 학습 시 데이터 특성 간의 비교가 향상되며, 이상치의 영향을 줄이고 모델의 성능을 향상시킬 수 있습니다.
1. 다중 열 선택
스케일링을 적용시키고 싶은 컬럼을 선택할 수 있다.
2. 스케일링 방법 선택
표준 정규화 : 데이터의 평균을 0, 표준편차를 1로 조정하여 데이터를 표준 정규 분포에 가깝게 만듭니다.
최소 - 최대 정규화 : (변수 - 최솟값) / (최댓값 - 최솟값)의 식으로 계산여 데이터를 0과 1사이의 값으로 조정하는데 사용합니다