주요 개념
AI Canvas를 사용하다 보면 몇 가지 중요한 용어들을 접하게 됩니다. 이 글에서는 AI Canvas의 기본적인 구성 요소들을 이해하기 쉽게 설명해드리겠습니다.
노드
노드는 AI Canvas의 기본 구성 요소로, 데이터의 처리, 분석, 혹은 특정 작업을 수행하는 개별 블록입니다. 예를 들어, 데이터를 크롤링하거나 이메일을 보내는 등의 작업을 각각 하나의 노드로 구성할 수 있습니다. 각 노드는 입력과 출력 포트(엣지)로 다른 노드와 연결되어 전체 워크플로우를 형성합니다.
노드 헤더
노드 헤더는 노드의 상단에 위치하며, 해당 노드의 이름과 간단한 정보를 표시하는 부분입니다. 사용자는 노드 헤더를 통해 노드의 역할을 쉽게 파악할 수 있으며, 필요에 따라 노드의 이름을 수정할 수도 있습니다. 노드 헤더는 노드를 드래그하거나 이동할 때도 주요하게 사용됩니다.
포트 및 엣지
포트는 노드 간 데이터를 주고받는 입출력 지점이며, 엣지는 포트를 통해 노드끼리 연결되는 선을 의미합니다. 각 노드는 입력 포트와 출력 포트를 가질 수 있으며, 이 포트들을 엣지로 연결하여 데이터 흐름을 정의합니다. 입력 포트는 데이터를 받아들이고, 출력 포트는 데이터를 다음 노드로 전달합니다.
포트 종류
데이터 관련 포트
- 데이터셋: 기본 데이터셋 입출력
- 선택된 데이터셋: 사용자가 선택한 데이터 (버블차트, 리스트 노드에서 선택)
- 샘플링된 데이터셋: Split Data로 나눈 데이터셋
- 남은 데이터셋: Split Data로 나눈 후 남은 데이터셋
- 이미지 데이터셋: 이미지 데이터 처리용
- 평가된 데이터셋: 모델 예측 점수가 포함된 데이터
모델 관련 포트
- 미학습 모델: 학습 전 초기 모델
- 미학습 추천 모델: 추천 시스템 학습 전 모델
- 미학습 시계열 모델: 시계열 학습 전 모델
- 학습된 모델: 학습 완료 후 예측에 사용 가능한 모델
애플리케이션 관련 포트
- 페이지: 애플리케이션 페이지 구성용
- 배포: 애플리케이션 배포용
데이터 타입
데이터 타입은 데이터셋의 각 컬럼(열)이 어떤 종류의 값을 가지는지 나타냅니다. 올바른 데이터 타입을 설정하면 AI 모델 학습 및 분석의 정확성이 높아집니다.
데이터 타입 종류
- Unique(고유값): ID, 시리얼 넘버 등 중복되지 않는 고유 값
- Category(범주형): 사과, 바나나, 오렌지 등 고정된 선택지 중 하나
- Continuum(연속형): 온도, 거리, 무게 등 연속적인 실수 값
- Discrete(이산형): 학생 수, 페이지 수 등 쪼갤 수 없는 정수 값
- Datetime(날짜/시간형): 날짜 및 시간 데이터
- Image(이미지형): 사진, 그림 등 이미지 파일
- Audio(오디오형): 음성, 사운드 등 오디오 파일