챌린지16 ADsP #12 오늘 공부한 내용 04 _ 다변량 분석 __1. 다차원 척도법 __2. 주성분분석(PCA) __핵심문제 공부한 내용 정리 다변량 분석 다차원 척도법(MDS): 객체 간의 근접성을 시각화하는 통계분석, 군집분석과 유사하다 다차원 척도법은 데이터를 축소하는 목적 데이터들의 유사성 혹은 비유사성과 같은 데이터들의 정보 속성을 파악하기 위한 수단으로 활용 다차원 척도법의 척도 개체의 실제 거리와 모형에 의해 추정된 거리 사이의 적합도를 측정하기 위해 Stress 척도를 사용한다 $stress= \sqrt{ \frac{\sum(실제거리-추정거리)^{2}}{ \sum실제거리^{2} } }$ stress 값은 0~1 사이의 값을 가지며 값이 낮을수록 적합도가 높다고 판단한다. 보통 0.5 이내면 적합도가 좋다고 판단.. 2023. 2. 14. ADsP #11 오늘 공부한 내용 03 _ 회귀분석 __1. 회귀분석 개요 __2. 단순선형회귀분석 __3. 다중선형회귀분석 __4. 최적 회귀방정식 __5. 고급 회귀분석 __핵심문제 공부한 내용 정리 회귀분석이란? 하나 이상의 독립변수들이 종속변수에 얼마나 영향을 미치는지 추정하는 통계기법 회귀분석의 종류: 단순회귀, 다중회귀, 다항회귀, 비선형회귀 회귀분석의 가정: 선형성 독립성 등분산성 회귀분석 모형의 적합성 회귀분석의 통계적 유의 검증 회귀계수의 유의성 검증 모형의 설명력 회귀분석 결과의 해석 intercept: y절편 Estimate: 기울기, 회귀계수 std.error: 표준편차 pr(>|t|): p값 회귀 방정식: 회귀계수*변수+y절편 F값과 P값 회귀계수의 영향력이 크면 F값도 크다. 두 집단 사이에 유.. 2023. 2. 13. ADsP #10 오늘 공부한 내용 02 _ 기초통계 __1. t-검정 __2. 분산 분석(ANOVA) __3. 교차분석 __4. 상관분석 __핵심문제 공부한 내용 정리 일 표본 t-검정 하나의 모집단의 평균(n) 값을 특정값과 비교하는 경우 일 표본 단측 t-검정: ~보다 크다, ~보다 작다 처럼 한쪽으로의 방향성 일 표본 양측 t-검정: ~이다, ~가(이) 아니다 처럼 방향성이 없는 경우 ★★이(독립) 표본 t-검정 독립적인 두 개의 집단에 대하여 모평균의 값이 같은지 검정 등분산성(분산이 같음)을 만족해야 함 이 표본 단측 t-검정: ~이(가) ~보다 크다, ~이(가) ~보다 작다 처럼 두 집단 사이의 대소 이 표본 양측 t-검정: 두 집단이 같다, 두 집단이 다르다 처럼 대소가 차이가 있는지 검정 ★★대응 표본 t.. 2023. 2. 11. ADsP #9 오늘 공부한 내용 ▣ 02장: 통계 분석 01 _ 통계의 이해 __1. 통계 개요 __2. 확률과 확률분포 __3. 추정과 가설검정 __핵심문제 공부한 내용 정리 ★★표본조사: 모집단들 대표할 수 있는 표본집단을 선별하여 표본조사를 실시 표본의 대표성을 신뢰할 수 있어야 통계 분석 결과 또한 신뢰할 수 있음 ★신뢰조사: 신뢰 수준 95% = 100번 조사했을 때 오차 범위 내에서 동일한 결과가 95번 발생 ★오차범위: 오차범위 +-3% ★★표본추출 방법: 단순 랜덤 추출법: N개의 모집단에서 n개의 데이터를 무작위로 추출, 사다리 타기, 제비 뽑기 계통 추출법: 일정 간격을 두고 데이터를 추출하는 방법 집락, 군집 추출법: 데이터를 여러 집락으로 구현한 뒤, 단순 랜덤 추출법으로 선택된 집락의 데이터를 .. 2023. 2. 10. ADsP #8 오늘 공부한 내용 03과목 데이터 분석 02 _ 데이터 마트 __1. 데이터 마트의 이해 __2. 데이터 마트 개발을 위한 R 패키지 활용 __핵심문제 03 _ 데이터 탐색 __1. 탐색적 데이터 분석(EDA) __2. 결측값 __3. 이상값 __핵심문제 공부한 내용 정리 ★데이터 마트: 데이터 웨어 하우스로부터 특정 사용자가 관심을 갖는 데이터들을 주제별, 부서별로 추출하여 모은 작은 규모의 데이터 웨어 하우스, reshape, sqldf, plyr 사용 데이터 전처리 -데이터를 정제(Cleaning): 결측치, 이상치 처리 -변수를 처리: 변수 선택, 차원 축소, 파생변수 생성, 변수 변환, 불균형 데이터 처리 데이터 마트 개발을 위한 R패키지 rshape -melt: 데이터의 특정변수를 기준으로 녹.. 2023. 2. 9. ADsP #7 오늘 공부한 내용 03과목 데이터 분석 ▣ 01장: R 기초와 데이터 마트 01 _ R 기초 __1. R 설치 및 기본 사용법 __2. R 기본 문법 __핵심문제 공부한 내용 정리 R 데이터구조★ 백터 - 타입이 같은 여러 데이터를 하나의 행으로 저장(1차원) - 'c'를 써서 묶을 수 있다. 행렬 - 2차원 구조를 가진 백터 - 벡터의 성질을 가지고 있으므로 행렬에 저장된 데이터는 모두 같은 데이터 타입이다. - 자동으로 타입이 변환된다. - 'matrix'를 사용하여 행렬을 만들 경우 'nrow'를 사용하여 행의 수를 결정하거나, 'ncol'을 사용하여 열의 수를 결정할 수 있다. - 'byrow' 옵션에 T(TRUE)를 지정하면 열이 아닌 행으로 저장된다. - 'dim' 함수를 이용하여 행렬로 변환.. 2023. 2. 8. 이전 1 2 3 다음