본문 바로가기
자격증/ADsP

ADsP #14

by 카너먼 2023. 2. 16.

오늘 공부한 내용

▣ 03장: 정형 데이터 마이닝

01 _ 데이터 마이닝

__1. 데이터 마이닝 개요

__2. 데이터 분할

__핵심문제


공부한 내용 정리

1. 데이터 마이닝 개요

(1) 데이터 마이닝 이해

① 데이터 마이닝

② 통계분석과 데이터 마이닝의 차이

(2) 데이터 마이닝의 종류

① 방법에 따른 분류

  • 지도 학습
  • 비지도 학습
지도 학습 비지도 학습
회귀(연속형) 선형회귀분석 군집 k-means
  의사결정나무(회귀트리모형)   SOM(Self-Organizing Map)
  SVR(Support Vector Regression)   DBSCAN(밀도 기반 군집)
  신경망 모형   병합 군집
  릿지(Ridge)   계층군집
  라쏘(Lasso) 연관 Apriori
분류(범주형) 로지스틱회귀 차원축소 PCA(주성분분석)
  신경망모형   LDA(선형판별분석)
  의사결정나무(분류트리모형)   SVD(특잇값 분해)
  k-NN(k-최근접 이웃 알고리즘)   MDS(다차원 척도법)
  앙상블    
  SVM(Support Vector Machine)    
  나이브 베이즈 분류    

② 데이터 마이닝의 분석 목적에 따른 분류

  • 분류 분석
  • 군집 분석
  • 연관 분석

(3) 데이터 마이닝의 프로세스

  1. 목적 정의
  2. 데이터 준비
  3. 데이터 가공
  4. 데이터 마이닝 기법 적용
  5. 검증

2. 데이터 분할

(1) 데이터 분할의 이해

① 데이터 분할

② 과적합(과대적합)과 과소적합

 

☞ 파라미터와 하이퍼 파라미터 

파라미터: 매개 변수, 사람의 개입 없이 발견되는 최적의 값

하이퍼 파라미터: 초매개 변수, 모델 외적인 요소, 분석자가 직접 찾아줘야 하는 최적의 값

 

(2) 데이터 분학을 통한 검증

① 홀드 아웃

② k-Fold 교차 검증

③ 붓스트랩

④ 계층별 k-겹 교차검증


 
2023 이지패스 ADsP 데이터분석 준전문가
2023년 ADsP 시험 합격을 위한 최신 기출문제 완벽 분석! 총 860문항 압도적 문제 수 + 수험서 앱(16회차 기출 및 모의고사 수록) 제공!
저자
전용문, 박현민
출판
위키북스
출판일
2023.01.16

※ 해당 책으로 공부한 내용입니다.

'자격증 > ADsP' 카테고리의 다른 글

ADsP #16  (0) 2023.02.20
ADsP #15  (0) 2023.02.17
ADsP #13  (0) 2023.02.15
ADsP #12  (0) 2023.02.14
ADsP #11  (0) 2023.02.13