본문 바로가기

위키북스18

ADsP #18 오늘 공부한 내용 04 _ 연관분석 __1. 연관분석의 개요 및 측도 __2. 연관분석의 알고리즘과 특징 __핵심문제 __기출유형문제 __예상문제 공부한 내용 정리 1. 연관분석의 개요 및 측도 (1) 연관분석의 개요 장바구니 분석 탐색적 기법의 일종 비지도 학습 사용이 편리하고 계산이 간편 품목의 수가 증가하면 분석 계산이 기하급수적으로 증가 (2) 연관분석의 측도 지지도 전체 거래 중 A와 B라는 두 개의 품목이 동시에 포함된 거래의 비율로, 지지도가 높다는 것은 그 두개의 아이템이 같이 잘 팔린다는 것을 의미 신뢰도 어떤 하나의 품목이 구매되었을 때 다른 품목 하나가 구매될 확률로, 조건부 확률 A가 구매되었을 때 B가 구매될 확률인 신뢰도(A→B)와, B가 구매되었을 때 A가 구매될 확률(B→A).. 2023. 2. 23.
ADsP #17 오늘 공부한 내용 03 _ 군집분석 __1. 군집분석 __2. 계층적 군집분석 __3. 혼합 분포 군집 __4. 자기조직화지도(SOM) __핵심문제 공부한 내용 정리 03 군집분석 1. 군집분석 (1) 군집분석 개요 (2) 거리 측도 ① 변수가 연속형인 경우 유클라디안 거리 두 점 사이의 거리를 계산할 때 널리 쓰임. 두 점 사이의 가장 짧은 거리 계산. 변수들의 산포정도를 감안하지 않음 맨하튼 거리 '시가거리', 두 점 사이를 가로지르지 않고 길을 따라 갔을 때의 거리. 변수의 차이의 단순합으로 계산한 거리 체리셰프 거리 변수 간 거리 차이 중 최댓값을 데이터 간의 거리 표준화 거리 유클라디안 거리에서 변수 간 차이로 어떤 변수가 거리 측정에 크게 기여하지 못하는 문제를 표준 편자로 나눔으로써 해결 마.. 2023. 2. 21.
ADsP #16 오늘 공부한 내용 02 _ 분류분석 __4. 인공신경망 분석 __5. 나이브베이즈 분류 __6. k-NN 알고리즘 __7. 서포트벡터머신 __8. 분류 모형 성과 평가 __핵심문제 공부한 내용 정리 4. 인공신경망 분석 (1) 인공신경망 개요: 인간의 뇌를 모방하여 만들어진 학습 및 추론 모형 인공신경망의 분석의 장단점 장점 잡음에 민감하게 반응하지 않는다. 비선형적인 문제를 분석하는데 유용하다. 패턴인식, 분류, 예측 등의 문제에 효과적이다. 스스로 가중치를 학습하므로 다양하고 많은 데이터에 효과적이다. 단점 모형이 복잡할 경우 학습에 오랜 시간이 소요된다. 초기 가중치에 따라 전역해가 아닌 지역 해로 수렴할 수 있다. 추정한 가중치의 신뢰도가 낮다. 결과에 대한 해석이 쉽지 않다. 은닉층의 수와 은닉.. 2023. 2. 20.
ADsP #15 오늘 공부한 내용 02 _ 분류분석 __1. 로지스틱 회귀분석 __2. 의사결정나무 __3. 앙상블분석 공부한 내용 정리 02 분류분석 1. 로지스틱 회귀분석 (1) 로지스틱 회귀분석 개요 ① 로지스틱스 회귀분석 회귀분석을 분류에 이용한 방법 독립변수의 선형결합을 이용해 사건의 발생 가능성을 예측하는 분석 방법으로 종속변수가 범주형 변수일 때 사용 가능하다. ★★★② 로지스틱스 회귀분석의 변수 종속변수가 속할 수 있는 집단이 두 개로 이진 분류가 기본, 세 개 이상의 집단을 분류하는 경우 '다중 로지스틱 회귀분석'이라고 한다. 독립변수가 연속형이면서 종속변수가 범주형일 때 가능하다. 만약 독립변수가 범주형일 경우에는 그 범주형 독립변수를 더미변수로 변환하면 가능하다. ★★★(2) 로지스틱 회귀분석의 알고.. 2023. 2. 17.
ADsP #14 오늘 공부한 내용 ▣ 03장: 정형 데이터 마이닝 01 _ 데이터 마이닝 __1. 데이터 마이닝 개요 __2. 데이터 분할 __핵심문제 공부한 내용 정리 1. 데이터 마이닝 개요 (1) 데이터 마이닝 이해 ① 데이터 마이닝 ② 통계분석과 데이터 마이닝의 차이 (2) 데이터 마이닝의 종류 ① 방법에 따른 분류 지도 학습 비지도 학습 지도 학습 비지도 학습 회귀(연속형) 선형회귀분석 군집 k-means 의사결정나무(회귀트리모형) SOM(Self-Organizing Map) SVR(Support Vector Regression) DBSCAN(밀도 기반 군집) 신경망 모형 병합 군집 릿지(Ridge) 계층군집 라쏘(Lasso) 연관 Apriori 분류(범주형) 로지스틱회귀 차원축소 PCA(주성분분석) 신경망모형.. 2023. 2. 16.
ADsP #13 오늘 공부한 내용 05 _ 시계열 분석 __1. 시계열 분석 개요 __2. 시계열 모형 __핵심문제 공부한 내용 정리 1) 시계열 분석의 개념 1. 시계열 분석의 개념: 일정 기간으로 기록된 자료에 대하여 특성을 파악하고 미래를 예측하는 분석 방법 2. 시계열 자료의 자기상관성 공분산이 시계열 자료에서 중요한 이유는 시계열 자료의 자기 상관성 때문 대부분의 시계열 자료들은 자기 상관성을 가지며, 따라서 공분산은 0이 아니다. 시계열 분석에서는 상관 정도를 나타내는 자기 상관 계수가 중요 3. 시계열 분석의 자료 정상성과 비정상성(대부분의 시계열 자료) 시계열 분석을 하려면 정상성 자료가 필요 정상성 자료: 일정한 평균, 분산이 시점에 의존하지 않을 것 2) 시계열 자료의 정상성 조건 1. 일정한 평균: .. 2023. 2. 15.