열 선택
Last updated
Last updated
그럼 이제 데이터셋의 열을 선택해보겠습니다. 데이터셋의 부분 중 모델의 학습에 사용될 열을 선택하는 것입니다.
우선, 왼쪽 바의 '전처리' 파트에서 '열 선택' 위젯을 캔버스에 추가하고, '결측치 채우기' 위젯의 output을 '열 선택' 위젯의 input으로 넣어줍니다.
이 데이터셋에는 많은 열이 있습니다. 여기서 id_col 열은 그저 데이터의 id를 나타내는 열로, 자동차의 특성과 관련이 없어 모델 학습에 도움을 주지 못 합니다. 따라서 우선 다른 특성들은 건드리지 않고 id_col의 체크박스를 해제한 후, '적용하기'를 눌러 id_col 열을 데이터셋에서 제외시킵니다.
자동차 산업 도메인에 관한 지식이 풍부한 사람은 열 선택을 포함한 데이터 전처리를 성공적으로 할 수 있을 것입니다. 자동차들의 가격과 각종 특성들에 대해 아는 것이 많기 때문입니다. 마찬가지로 어떤 데이터셋을 다루든 해당 분야에 대한 지식이 많을수록 데이터를 전처리하기에 유리합니다.
'열 선택' 위젯을 우클릭하고 '데이터 보기'를 클릭하면 id_col 열이 사라진 모습을 확인할 수 있습니다.