F검정
분산분석은 F검정(F test)을 통해 수행
F검정은 집단 간 분산과 집단 내 분산의 비로 계산되는 F값(F-value, F-statistic)을 가설검정을 위한 검정통계량으로 사용
F검정 결과가 통계적으로 유의미하면 집단 간 평균의 차이가 존재(즉 독립변수가 종속변수에 영향을 미침)
집단평균의 분산이 크더라도 각 집단간의 분산 또한 크다면 집단간의 분포가 겹치는 영역이 넓어져 명확히 구분되지 않으면 집단간의 평균이 다르다고 주장하기 힘들어진다.
그렇다면 우리가 알고싶은것은 집단간의 분산과 집단평균의 분산의 비율이 얼마나 커야 집단간의 평균이 다르다고 주장할 수 있는가? 이다.
F분포
F분포. 두 개의 자유도에 의해 분포의 모양이 결정되며 대체로 오른쪽으로 긴 꼬리를 갖는다.
$$F분포\ =\ \frac{집단\ 간\ 분산}{집단\ 내\ 분산}$$
$$집단\ 간\ 분산= \frac{집단\ 간\ 제곱합}{자유도}$$
$$집단\ 간\ 분산 = \frac{\sum_g\left[(\overline{x_g}-\overline{x})^2\cdot n_g\right]}{g-1}$$
$$g=집단의\ 개수,\ \overline{x_g}= g집단의 표본평균,\ \overline{x}=전체 표본평균,\ n_g=g집단의 표본크기$$
$$집단\ 내\ 분산 = \frac{집단\ 내\ 제곱합}{자유도}$$
$$집단\ 내\ 분산 = \frac{\sum_g\left[s_g^2 \cdot (n_g-1)\right]}{n-g}$$
$$g=집단의\ 개수,\ \overline{s_g}= g집단의 표준편차,\ n_g=집단의 표본크기$$
F-value는 두 분산의 비율로 나타내기 때문에 항상 양수값을 가진다.
F-value
F분포에서 유의수준에 따라 F-value을 통해 귀무가설을 채택하거나 기각할 수 있다.
귀무가설(H0) : 모집단간의 분산은 같다.
대립가설(1): 모집단간의 분산은 다르다.
F 검정의 결과, 귀무가설이 기각된다면 모집단간의 분산이 통계적으로 다르다고 할 수 있다.
from scipy.stats import f_oneway
f_oneway(A,B) #A집단과 B집단으로 Ftest
>>>[OUT] :
F_onewayResult(statistic= , pvalue= ) #결과값
'기초 통계' 카테고리의 다른 글
중심극한정리 (0) | 2022.03.01 |
---|---|
자유도 (0) | 2022.03.01 |
평균, 편차, 분산, 표준편차 (0) | 2022.02.27 |
티스토리 블로그 수학수식 입력하기 (0) | 2022.02.27 |