AI Canvas
AI Canvas 바로가기
  • 시작하기
    • 서비스 소개
    • 주요 용어 설명
    • 계정 및 언어 설정
  • 캔버스 기본 사용법
    • 캔버스 탭 관리
    • 캔버스 화면 관리
    • 캔버스 공유 및 권한 설정
    • 노드 조작 및 관리
    • 엣지 조작 및 관리
    • 스케줄 설정
    • 노드별 크레딧 소모량
  • 노드 종류
    • 데이터
      • URL 리더
      • 데이터
      • PDF 데이터
      • 데이터 분할
      • 데이터 저장소
      • 명령 프롬프트
      • 예제 데이터
      • 이미지 데이터
      • 텍스트 입력
      • 텍스트-데이터 변환
    • API
      • 기업공시
      • 깃허브 커밋
      • 대화형 아바타
      • 크롤링
      • 프롬프트
    • 전처리
      • 결측치 채우기
      • 그룹화
      • 데이터 병합
      • 데이터 비닝
      • 데이터 수정
      • 데이터 어노테이션
      • 데이터 연결
      • 스케일링
      • 슬라이싱
      • 열 선택
      • 열 타입 변경
      • 이미지 임베딩
      • 이상치 제거
      • 중복 제거
      • 차원 축소
      • 텍스트 임베딩
      • 텍스트 전처리
      • 특성 생성
      • 파이썬 스크립트
      • 표본 재추출
      • 픽셀 변환
      • 행 결합
      • 행 선택
    • 모델
      • YOLO 모델
      • 결정 트리
      • 그래디언트 부스팅
      • 랜덤 포레스트
      • 로지스틱 회귀
      • 모델 학습
      • 서포트 벡터 머신
      • 선형 회귀
      • 시계열 모델 학습
      • 신경망
      • 얼굴 인식
      • 에이다 부스트
      • 일괄 예측
      • 추천 SVD++
      • 추천 모델 학습
      • 추천 베이스라인
      • 프로펫
    • 평가
      • ROC 커브
      • 메트릭
      • 모델 평가
      • 에러 히스토그램
      • 정답 비율
      • 정확도
      • 특성 중요도
      • 특성 중요도 비교
      • 혼동 행렬
    • 알림
      • 이메일 전송
    • 시각화
      • 막대 그래프
      • 수평 막대 그래프
      • 선도표
      • 바이올린 플롯
      • 박스 플롯
      • 산점도 그래프
      • 히트맵
      • 원 그래프
      • 게이지 차트
      • 버블 차트
      • 결측치 비율
      • 데이터 개수
      • 예측값 비교
      • 평균 비교
      • PR 트랜드
      • 특성 통계
      • 평균 예측값
      • 워드클라우드
    • UI
      • 데이터 정보
      • 데이터 테이블
      • 리스트
      • 버튼
      • 샌드박스
      • 아이콘
      • 예측하기
      • 이미지 뷰어
      • 챗 UI
      • 텍스트 출력
      • 텍스트 편집기
      • 페이지
      • 필터
      • 행
      • PDF 뷰어
      • CM
    • 애플리케이션
      • 애플리케이션
    • 배포
      • 배포
  • 워크스페이스 관리
    • 워크스페이스 보기
    • 워크스페이스 생성 및 설정
    • 워크스페이스 공유 및 권한 설정
  • 애플리케이션 페이지
    • 로그인 및 로그아웃
    • 설정 및 캔버스
    • 권한 및 멤버 관리
  • 캔버스 실습 가이드
    • 1. AI 모델 구축
      • 데이터셋 준비
        • 데이터셋 업로드
      • 탐색적 데이터 분석
        • 데이터 살펴보기
        • 결측치 확인하기
      • 데이터 전처리
        • 결측치 채우기
        • 열 선택
      • AI 모델 구축
        • 데이터 분할
        • 학습 알고리즘 선택
        • 모델 학습
        • 모델 사용해보기
      • 데이터 검증
        • 검증 진행
      • 모델 평가
        • 모델 평가
        • 특성 중요도 살펴보기
      • 결과 화면
    • 2. 데이터 시각화
      • 막대 그래프
      • 박스 플롯
      • 산점도 그래프
      • 원 그래프
      • 데이터 개수
      • 에러 히스토그램
      • 예측값 비교
      • 결과 화면
    • 3. 대시보드 UI 제작 및 애플리케이션 구축/배포
      • 페이지 구성하기
      • 애플리케이션 구축
      • 애플리케이션 배포
      • 결과 화면
    • 4. 프레임을 활용한 프레젠테이션 및 캔버스 공유
      • 프레임을 활용한 프레젠테이션
      • 캔버스 공유하기
    • 가이드 전체 영상
  • 인공지능 교육 영상
    • 회귀 모델의 평가지표
    • 분류 모델의 평가지표
Powered by GitBook
On this page
  • 설명
  • 예제
  1. 노드 종류
  2. 평가

특성 중요도

모델의 변수 중요도를 확인합니다.

입력 포트

  • 학습된 모델

  • 데이터셋: 모델 학습에 사용된 데이터

출력 포트

  • 데이터셋: 각 특성(feature)의 중요도를 나타내는 값들이 포함된 데이터셋입니다. 주요 컬럼은 다음과 같습니다:

    • column_name: 특성(열)의 이름

    • importances_mean: 특성 중요도의 평균값

    • importances_std: 특성 중요도의 표준 편차

    • importances_percent(%): 전체에서 해당 특성의 중요도가 차지하는 비율(%)

설명

모델이 예측할 때 각 변수가 예측값에 얼마나 기여하는지를 백분율로 나타냅니다.

만약 writing score 열의 특성 중요도가 68.1%, gender 열의 특성 중요도가 19.6%라고 한다면

writing score 열은 예측 시에 gender 열에 비해 약 3.4~3.5배정도 기여도(영향력)가 더 크다고 할 수 있습니다.

만약 scored_math score 열의 특성 중요도가 0%라면 해당 열은 예측에 거의 영향을 주지 않는다고 할 수 있습니다.

이를 통해 이용해 예측값(학생의 이탈 여부, 자동차 가격, ...)을 결정하는 것에 영향을 주는 것이 무엇인지 즉, 학생이 왜 이탈하는지 / 자동차가 왜 비싼가를 파악할 수 있습니다

계산 방법

  1. 모델 평가를 진행합니다

  2. 특정 특성(열)의 값을 랜덤하게 섞어서 모델이 예측할 때 해당 특성을 제대로 사용하지 못하게 합니다.

  3. (2번에 의해 특정 특성을 사용하지 못하는 상태에서) 모델을 다시 평가합니다.

  4. 1번과 3번의 평가를 비교하여 해당 특성의 중요도를 계산합니다.

  5. 모든 특성에 대해 특성 중요도가 계산될 때 까지 2번부터 반복합니다

(간단한 예시)

1번에서의 성능 : 0.90 A를 섞은 후의 성능 : 0.80 -> A의 중요도 : 0.10 B를 섞은 후의 성능 : 0.85 -> B의 중요도 : 0.05 ...

이와 같이 계산한 뒤 합을 1로 정규화(만약 중요도 총합이 0.5라면 모든 값에 * 2)한 다음 퍼센트로 변환합니다.

예제

*데이터의 용량이나 모델의 특성에 따라 특성 중요도 산출에 시간이 다소 소요될 수 있으나, 백그라운드로 나가도 산출 작업은 계속되오니 자유롭게 워크스페이스를 드나들어도 됩니다.*

Previous정확도Next특성 중요도 비교

Last updated 6 months ago