주요 용어 설명
AI Canvas를 사용하다 보면 몇 가지 중요한 용어들을 접하게 됩니다. 이 글에서는 AI Canvas의 기본적인 구성 요소들을 이해하기 쉽게 설명해드리겠습니다.
노드 (Node)
노드는 AI Canvas의 기본 구성 요소로, 데이터의 처리, 분석, 혹은 특정 작업을 수행하는 개별 블록입니다. 예를 들어, 데이터를 크롤링하거나 이메일을 보내는 등의 작업을 각각 하나의 노드로 구성할 수 있습니다. 각 노드는 입력과 출력 포트(엣지)로 다른 노드와 연결되어 전체 워크플로우를 형성합니다.
노드 헤더 (Node Header)
노드 헤더는 노드의 상단에 위치하며, 해당 노드의 이름과 간단한 정보를 표시하는 부분입니다. 사용자는 노드 헤더를 통해 노드의 역할을 쉽게 파악할 수 있으며, 필요에 따라 노드의 이름을 수정할 수도 있습니다. 노드 헤더는 노드를 드래그하거나 이동할 때도 주요하게 사용됩니다.
포트 및 엣지 (Port & Edge)
포트는 노드 간 데이터를 주고받는 입출력 지점이며, 엣지는 포트를 통해 노드끼리 연결되는 선을 의미합니다. 각 노드는 입력 포트와 출력 포트를 가질 수 있으며, 이 포트들을 엣지로 연결하여 데이터 흐름을 정의합니다. 입력 포트는 데이터를 받아들이고, 출력 포트는 데이터를 다음 노드로 전달합니다.
포트 종류
데이터셋(Dataset): 입력된 데이터셋을 처리하거나 분석할 때 사용되는 포트입니다.
선택된 데이터셋(Selected Dataset): 사용자가 선택한 데이터셋을 나타냅니다. 버블차트나 리스트 노드를 이용하여 선택할 수 있습니다.
샘플링된 데이터셋(Sampled Dataset): 샘플링된 데이터셋으로, 전체 데이터셋 중 일부 데이터를 추출한 결과를 전달하는 포트입니다.
남은 데이터셋(Remaining Dataset): 샘플링 후 남은 데이터를 나타냅니다. 샘플링된 데이터셋과 함께 사용하여 나머지 데이터를 처리할 때 유용합니다.
이미지 데이터셋(Image Dataset): 이미지 데이터셋을 처리하는 포트입니다. 이미지 데이터를 입력받아 처리하는 노드에 연결됩니다.
모델(Model): 학습된 모델을 나타내는 포트로, 학습 과정이 완료된 모델을 전달할 때 사용됩니다.
미학습 모델(Untrained Model): 학습되지 않은, 초기 상태의 모델을 나타냅니다. 학습 과정을 시작하기 전의 모델을 전달하는 포트입니다.
미학습 추천 모델(Untrained Recommender): 학습되지 않은 추천 모델을 나타내는 포트입니다. 추천 시스템을 학습하기 전 상태에서 사용됩니다.
미학습 시계열 모델(Untrained Time Series): 학습되지 않은 시계열 모델을 나타냅니다. 시계열 데이터를 처리하기 전의 모델을 전달할 때 사용됩니다.
학습된 모델(Trained Model): 학습이 완료된 모델을 나타냅니다. 이 모델은 다른 데이터에 적용하여 예측이나 분석을 수행할 수 있습니다.
평가된 데이터셋(Scored Dataset): 모델에 의해 점수가 매겨진 데이터셋입니다. 예측 결과에 따라 점수가 할당된 데이터를 전달할 때 사용됩니다.
페이지(Page): 페이지 노드에서 출력되는 포트로, 애플리케이션과 연결되어 페이지 구성을 담당합니다.
배포(Deploy): 애플리케이션을 배포할 때 사용하는 포트입니다.\
데이터 타입 (Data Type)
데이터 타입은 노드가 처리하는 데이터의 유형을 나타냅니다. AI Canvas에서는 다양한 데이터 타입을 지원하며, 올바른 데이터 타입을 선택하는 것은 AI 모델 학습 및 분석의 정확성을 높이는 중요한 요소입니다.
데이터 타입 종류
Unique(고유값): 각 데이터 값이 고유한 경우를 나타냅니다. 예를 들어, ID나 시리얼 넘버 등 중복되지 않는 값을 표현할 때 사용됩니다.
Category(범주형): 데이터가 서로 다른 여러 범주로 나뉘는 경우를 나타냅니다. 예를 들어, '사과', '바나나', '오렌지'와 같은 과일 이름이 해당됩니다. 데이터의 값들이 고정된 선택지 중 하나일 때 사용합니다.
Continuum(연속형): 숫자형 데이터로, 연속적인 값을 나타냅니다. 예를 들어, 온도, 거리, 무게와 같은 데이터를 처리할 때 사용됩니다. 실수형 데이터로 표현됩니다.
Discrete(이산형): 연속적이지 않고 고정된 값을 가지는 숫자형 데이터를 나타냅니다. 예를 들어, 학생의 수, 책의 페이지 수와 같이 더 이상 쪼갤 수 없는 단위를 나타낼 때 사용됩니다.
Datetime(날짜/시간형): 날짜 및 시간과 관련된 데이터를 나타냅니다. 예를 들어, 특정 날짜나 시간을 기록하고 분석할 때 사용됩니다.
Image(이미지형): 이미지 파일을 데이터로 사용하는 경우를 나타냅니다. 예를 들어, 사진이나 그림과 같은 데이터를 처리할 때 사용됩니다.
Audio(오디오형): 오디오 파일을 데이터로 사용하는 경우를 나타냅니다. 예를 들어, 음성 파일이나 사운드를 분석할 때 사용됩니다.
Last updated