통계학 Statistics | |||
{{{#!wiki style="margin:0 -10px -5px; min-height:calc(1.5em + 5px); word-break: keep-all" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin:-5px -1px -11px" | <colbgcolor=#4d4d4d><colcolor=#fff> 수리통계학 | 기반 | 실해석학 (측도론) · 선형대수학 · 이산수학 |
확률론 | 사건 · 가능성 · 확률 변수 · 확률 분포 (표본 분포 · 정규 분포 · 이항 분포 · 푸아송 분포 · 카이제곱분포 · t분포 · Z분포 · F-분포 · 결합확률분포) · 확률밀도함수 · 확률질량함수 · 조건부확률 · 조건부기댓값 · 조건부분산 · 전체 확률의 법칙 · 베이즈 정리 · 도박사의 오류 · 도박꾼의 파산 · 몬티 홀 문제 · 뷔퐁의 바늘 · 마르코프 부등식 · 체비쇼프 부등식 · 큰 수의 법칙 (무한 원숭이 정리) · 중심극한정리 · 벤포드의 법칙 | ||
통계량 | 평균 (제곱평균제곱근 · 산술 평균 · 기하 평균 · 조화 평균 · 멱평균 · 대수 평균) · 기댓값 · 편차 (절대 편차 · 표준 편차) · 분산 (공분산) · 결정계수 · 변동계수 · 상관계수 · 대푯값 · 자유도 | ||
추론통계학 | 가설 · 변인 · 추정량 · 점추정 · 신뢰 구간 · 상관관계와 인과관계 · 실험통계학 · p-해킹 · 통계의 함정 · 그레인저 인과관계 · 신뢰도와 타당도 | ||
통계적 방법 | 회귀 분석 · 최소제곱법 · 분산 분석 · 주성분 분석 (요인 분석) · 시계열 분석 · 패널 분석 · 2SLS · 생존 분석 · GARCH · 비모수통계학 · 준모수통계학 · 기계학습 (군집 분석 · 분류 분석) · 위상 데이터분석 · 외삽법 · 메타 분석 · 모델링 (구조방정식) | ||
기술통계학 · 자료 시각화 | 도표 (그림그래프 · 막대그래프 · 선 그래프 · 원 그래프 · 상자 수염 그림 · 줄기와 잎 그림 · 산포도 · 산점도 · 히스토그램 · 도수분포표) · 그래프 왜곡 · 이상점 | }}}}}}}}} |
수식없이 설명하는 F분포
1. 개요
f분포(F-distribution 또는 Snedecor's F-distribution 또는 Fisher–Snedecor distribution)는 통계학에서 사용하는 연속 확률 분포(continuous probability distribution)로 분산 분석에 많이 사용한다.독립적인 두 카이 제곱 분포에 관한 비로써 정의된다. 자유도는 분자에 해당하는 카이제곱분포의 자유도와 분모에 해당하는 카이제곱분포의 자유도에 의해 결정된다. 분산 비 검정, 분산 분석, 회귀 분석 등에 사용한다.
F-분포로 하는 검정(test)을 F-검정(F-test)이라고 한다.
2. 정의
[math(U_1\sim\chi^2_{\nu_1},\,U_2\sim\chi^2_{\nu_2})]이고 [math(U_1)]과 [math(U_2)]가 서로 독립일 때 F-분포를 다음과 같이 정의한다.[math(X=\dfrac{U_1/\nu_1}{U_2/\nu_2}\sim F_{\nu_1,\,\nu_2})]
[math(\nu_1)]은 [math(U_1)](분자)의 자유도이고, [math(\nu_2)]는 [math(U_2)](분모)의 자유도이다.
평균은 [math(E(X)=\frac{\nu_2}{\nu_2-2}\;(\nu_2 > 2))]이고 분산은 [math(Var(X)=\frac{2\nu_2^2(\nu_1+\nu_2-2)}{\nu_1(\nu_2-2)^2(\nu_2-4)}\;(\nu_2 > 4))]이다.
[math(X\sim F_{\nu_1,\,\nu_2})]의 확률밀도함수는 다음과 같이 주어진다.
[math(\Large{f_X(x) = \frac{\left(\frac{\nu_1}{\nu_2}\right)^{\frac{\nu_1}{2}}}{B\left(\frac{\nu_1}{2}, \frac{\nu_2}{2}\right)} \cdot \frac{x^{\frac{\nu_1-2}{2}}}{\left(1 + \frac{\nu_1}{\nu_2} x\right)^{\frac{\nu_1 + \nu_2}{2}}},\;x > 0})]
여기서 [math({B\left(\frac{\nu_1}{2}, \frac{\nu_2}{2}\right)})]는 베타 함수이다.
한편, [math(F_{\nu_1,\;\nu_2,\;\alpha})]는 [math(X\sim F_{\nu_1,\;\nu_2})]에 대하여 [math(P[X\geq a]=\alpha)]가 되도록 하는 [math(a)]의 값을 일컫는다.
3. 분산비검정
분산비검정(variance ratio test)이란 다음과 같이 두 분산을 비교할 때 사용하는 방법이다.두 카이 제곱 분포 [math(U_1=\dfrac{(n_1-1){s_1}^2}{{\sigma_1}^2}\sim\large{\chi^2_{n_1-1}})]과 [math(U_2=\dfrac{(n_2-1){s_2}^2}{{\sigma_2}^2}\sim\large{\chi^2_{n_2-1}})]에 대하여
[math(\begin{aligned}F&=\dfrac{U_1/\nu_1}{U_2/\nu_2}=\dfrac{\cfrac{\cancel{(n_1-1)}{s_1}^2}{{\sigma_1}^2\cdot\cancel{{\nu_1}} }}{\dfrac{\cancel{(n_2-1)}{s_2}^2}{{\sigma_2}^2\cdot\cancel{{\nu_2}} }}\\ \\&=\dfrac{{s_1}^2/{\sigma_1}^2}{{s_2}^2/{\sigma_2}^2}=\dfrac{{s_1}^2/{s_2}^2}{{\sigma_1}^2/{\sigma_2}^2}\sim \large{F_{n_1-1,\;n_2-1}}\end{aligned})]
[math((\because \nu_1=n_1-1,\;\nu_2=n_2-1))]
[math((\because \nu_1=n_1-1,\;\nu_2=n_2-1))]
4. 성질
분모와 분자의 자유도가 서로 바뀌어 있는 두 [math(F)]분포에 대하여 다음과 같은 중요한 성질이 성립한다.[math(\Large{F_{\nu_1,\;\nu_2,\;\alpha}}=\dfrac1{\Large{F_{\nu_2,\;\nu_1,\;1-\alpha} }})]
- [증명]
- 두 [math(F)]분포 [math(X\sim\Large{F_{\nu_1,\;\nu_2}})]이고 [math(Y=\dfrac1X\sim\Large{F_{\nu_2,\;\nu_1}})]이 있을 때[math(\begin{aligned}{\color{red}\Large P\left[X\geq{F_{\nu_1,\;\nu_2,\;\alpha}}\right]}&=\alpha\\\Large P\left[Y\geq{F_{\nu_2,\;\nu_1,\;1-\alpha}}\right]&=1-\alpha\end{aligned})]
두 번째 식을 변형하면[math(\begin{aligned}{\Large P\left[\dfrac1Y\leq\dfrac1{{F_{\nu_2,\;\nu_1,\;1-\alpha} }}\right]}&=1-\alpha\\\rightarrow{\color{red}{\Large P\left[\dfrac1Y\geq\dfrac1{{F_{\nu_2,\;\nu_1,\;1-\alpha} }}\right]}}&=\alpha\end{aligned})]
빨간색 식끼리는 값이 [math(\alpha)]로 같으면서, [math(Y=\dfrac1X)]이므로 결국 다음 양변이 같을 수밖에 없다.[math(\Large{F_{\nu_1,\;\nu_2,\;\alpha}}=\dfrac1{\Large{F_{\nu_2,\;\nu_1,\;1-\alpha} }})]
또한, [math(boldsymbol t)]분포를 제곱하면 분자와 분모의 자유도가 각각 1, [math(\boldsymbol \nu)]인 [math(\boldsymbol F)]분포가 된다.
[math(\begin{aligned}t&=\dfrac{Z}{\sqrt{U/\nu}}\sim t_\nu\\\rightarrow t^2&=\dfrac{Z^2/1}{U/\nu}\sim F_{1,\;\nu}\end{aligned})]
5. 그래프
확률 밀도 함수 | 누적 분포 함수 |
매개변수: 자유도 d1 > 0, d2 > 0
6. 관련 문서
- 확률 분포
- 정규 분포
- 표준 정규 분포(z-분포)
- 스튜던츠 t-분포(t-분포)
- 카이-제곱 분포(χ2 분포)
- 분산 분석(analysis of variance, ANOVA)
- 회귀 분석(regression analysis)
- 상관 계수
- Microsoft Excel/함수 목록: 간단한 통계학 계산은 엑셀이나 Calc로 할 수 있다.