오늘 공부한 내용
▣ 03장: 정형 데이터 마이닝
01 _ 데이터 마이닝
__1. 데이터 마이닝 개요
__2. 데이터 분할
__핵심문제
공부한 내용 정리
1. 데이터 마이닝 개요
(1) 데이터 마이닝 이해
① 데이터 마이닝
② 통계분석과 데이터 마이닝의 차이
(2) 데이터 마이닝의 종류
① 방법에 따른 분류
- 지도 학습
- 비지도 학습
지도 학습 | 비지도 학습 | ||
회귀(연속형) | 선형회귀분석 | 군집 | k-means |
의사결정나무(회귀트리모형) | SOM(Self-Organizing Map) | ||
SVR(Support Vector Regression) | DBSCAN(밀도 기반 군집) | ||
신경망 모형 | 병합 군집 | ||
릿지(Ridge) | 계층군집 | ||
라쏘(Lasso) | 연관 | Apriori | |
분류(범주형) | 로지스틱회귀 | 차원축소 | PCA(주성분분석) |
신경망모형 | LDA(선형판별분석) | ||
의사결정나무(분류트리모형) | SVD(특잇값 분해) | ||
k-NN(k-최근접 이웃 알고리즘) | MDS(다차원 척도법) | ||
앙상블 | |||
SVM(Support Vector Machine) | |||
나이브 베이즈 분류 |
② 데이터 마이닝의 분석 목적에 따른 분류
- 분류 분석
- 군집 분석
- 연관 분석
(3) 데이터 마이닝의 프로세스
- 목적 정의
- 데이터 준비
- 데이터 가공
- 데이터 마이닝 기법 적용
- 검증
2. 데이터 분할
(1) 데이터 분할의 이해
① 데이터 분할
② 과적합(과대적합)과 과소적합
☞ 파라미터와 하이퍼 파라미터
파라미터: 매개 변수, 사람의 개입 없이 발견되는 최적의 값
하이퍼 파라미터: 초매개 변수, 모델 외적인 요소, 분석자가 직접 찾아줘야 하는 최적의 값
(2) 데이터 분학을 통한 검증
① 홀드 아웃
② k-Fold 교차 검증
③ 붓스트랩
④ 계층별 k-겹 교차검증
2023 이지패스 ADsP 데이터분석 준전문가
2023년 ADsP 시험 합격을 위한 최신 기출문제 완벽 분석! 총 860문항 압도적 문제 수 + 수험서 앱(16회차 기출 및 모의고사 수록) 제공!
- 저자
- 전용문, 박현민
- 출판
- 위키북스
- 출판일
- 2023.01.16
※ 해당 책으로 공부한 내용입니다.