본문 바로가기

전산통계6

chapter10 - 상관분석과 회귀분석 상관분석상관계수데이터: 두 연속 변량(X, Y)에 대한 자료가$(x_1, y_1), (x_2, y_2), ..., (x_n, y_n)$독립변수(설명변수)x에 대하여 종속변수(반응변수)y의 값을 관측 -> 데이터가 pair로 얻어진다.표본상관계수의 성질표본상관계수는 X와 Y 사이에 어느 정도 직선 관계가 있는지를 나타냄. $-1 \leq r \leq 1$r r r = +=이면, 모든 점은 직선 위에 있다. 무상관(無相關)r = 0일 때, 상관관계가 없다는 뜻은 두 변량 X, Y사이에 선형관계가 없음을 뜻한다.  이차식의 관계가 있음에도 상관계수의 값은 0무상관 검정가설 설정:$H_0: p = 0 || H_1: p \neq 0$검정통계량: 자유도가 n-2인 t분포$t_0 = r\frac{\sqrt n-2}{.. 2023. 6. 5.
chapter9 - 범주형 자료분석(교차분석) 이변량 자료의 분석반응변수설명변수범주형 자료연속형 자료범주형 자료교차분석분산분석연속형 자료로지스틱 회귀분석회귀분석적합도 검정(Goodness of fit)적합도 - 실험 또는 관측 결과와 이론적인 기댓값의 일치 정도관측도수 - 실험 또는 관측된 도수기대도수 - 귀무가설이 사실인 경우 기대되는 도수기대도수 구하는 법각 범주의 비율은 $p10, p20, ..., pk$라고 하고, 전체 관측치가 N이라면 $e_i = N * P_i$예를 들어 300번의 주사위가 공정하다면$ e_i = 300 *\frac{1}{6} = 50$귀무가설:$p_1 = p10, p_2 = p20, ... ,pk = pk0$검정통계량 구하는 법관측도수와 기대도수의 차$n_i - e_i$의 차가 작을수록 적합검정통계량 =$x^2_0 = \.. 2023. 6. 4.
chapter 8 - 분산분석 *결과확인 할 때, 항상 대립가설로 놓고 확인한다.ex) p-value 이변량 자료의 분석반응변수설명변수범주형 자료연속형 자료범주형 자료교차분석분산분석연속형 자료로지스틱 회귀분석회귀분석실험계획법(Experimental Design)공장의 생산 제품에 대한 품질 및 공정 최적화 실험 방법자료 수집 방법최소 실험으로 최대 정보일원배치분산분석분산분석의 가설귀무가설:$H_0: \mu_1 = \mu_2 = \mu_3 = \mu_4$대립가설:$H_1$: 적어도 2개의 값은 다르다. 분산분석표(ANOVA 테이블)요인제곱합자유도평균제곱합F값유의확률처리(집단간)SSTk-1MST=SST / (k-1)F = MST / MSEp-value오차(집단내)SSEk(n-1)MSE=SSE / k(n-1)전체TSSnk-1 총 제곱합(T.. 2023. 6. 3.
chapter 7 - 가설검정 가설(hypothesis)아직 입증되지 않은 주장통계적 가설모집단의 분포에 대한 가설$H_0: \mu = 3 VS H_1: \mu \neq 3$$H_0: \mu = 81 VS H_1: \mu $H_0: p = \frac{7}{10} VS H_1: p > \frac{7}{10}$$H_0: \mu_1 = \mu_2 VS H_1: \mu_1 > \mu_2$가설의 종류 귀무가설(null hypothesis) - $H_0$: 기존에 알려져 있던 사실대립가설(alternative hypothesis) - $H_1$: 새로운 사실 또는 주장예제 더보기1.어느 공장에서는 공정온도. 100'c에서 제조. 제품의 강도는 정규분포$N(60, 2^2)$. 공정온도를 변화시켰을 때 평균 강도에 차이가 있을까?귀무가설:$H_0:.. 2023. 6. 3.