카이-제곱 통계량이란 무엇입니까?
카이 제곱 ( χ 2) 통계량은 기대치가 실제 관측 된 데이터 (또는 모형 결과)와 비교되는 방식을 측정하는 테스트입니다. 카이 제곱 통계량을 계산하는 데 사용되는 데이터는 무작위, 미가공, 상호 배타적이며 독립 변수에서 추출하고 충분히 큰 표본에서 추출해야합니다. 예를 들어, 동전을 100 번 던지는 결과는이 기준을 충족합니다.
카이 제곱 검정은 종종 가설 검정에 사용됩니다.
카이-제곱의 공식
χc2 = ∑ (Oi−Ei) 2Ei 여기서: c = 자유도 O = 관찰 된 값 E = 예상치 (들) 시작 {정렬} & \ chi ^ 2_c = \ sum \ frac {(O_i-E_i) ^ 2} {E_i} \ & \ textbf {여기서:} \ & c = \ text {자유도} \ & O = \ text {관찰 된 값} \ & E = \ text {예상 된 값 } \ \ end {aligned} χc2 = ∑Ei (Oi−Ei) 2 여기서: c = 자유도 O = 관찰 된 값 E = 예상치 (들)
카이-제곱 통계량은 무엇을 알려줍니까?
카이 제곱 검정에는 크게 두 가지 종류가 있습니다. "성별 점수와 SAT 점수 사이에 관계가 있습니까?"와 같은 관계 문제를 묻는 독립성 테스트; 그리고 "코인을 100 번 던졌다면 50 번 머리를 올리고 50 번 꼬리를 올릴까요?"와 같은 질문을합니다.
이러한 테스트의 경우, 자유도는 실험 내 변수 및 샘플의 총 수를 기반으로 특정 귀무 가설을 기각 할 수 있는지 여부를 결정하는 데 사용됩니다.
예를 들어, 학생 및 코스 선택을 고려할 때 30 명 또는 40 명의 학생의 표본 크기는 중요한 데이터를 생성하기에 충분히 크지 않을 수 있습니다. 400 명 또는 500 명의 학생으로 구성된 표본을 사용하여 연구에서 동일하거나 유사한 결과를 얻는 것이 더 유효합니다.
다른 예에서, 동전을 100 번 던지는 것을 고려하십시오. 공정한 동전을 100 번 던지면 예상되는 결과는 머리가 50 번, 꼬리가 50 번 나타날 것입니다. 실제 결과는 머리가 45 번, 꼬리가 55 번 나타나는 결과 일 수 있습니다. 카이 제곱 통계량은 예상 결과와 실제 결과 간의 불일치를 보여줍니다.
카이-제곱 검정의 예
남성과 여성 모두 2, 000 명의 다른 유권자에 대해 무작위 여론 조사가 실시되었다고 상상해보십시오. 응답 한 사람들은 성별과 공화당, 민주당 또는 독립 여부에 따라 분류되었습니다. 공화당, 민주당 및 독립으로 표시된 열과 남성과 여성으로 표시된 두 개의 행이있는 그리드를 상상해보십시오. 2, 000 명의 응답자 데이터가 다음과 같다고 가정합니다.
카이 제곱 통계량을 계산하는 첫 번째 단계는 예상 빈도를 찾는 것입니다. 이들은 그리드의 각 "셀"에 대해 계산됩니다. 성별에는 두 가지 범주와 정치적 견해의 세 가지 범주가 있으므로 총 6 개의 예상 빈도가 있습니다. 예상 빈도에 대한 공식은 다음과 같습니다.
E (r, c) = n (r) × c (r) n 여기서: r = 문제의 행 c = 문제의 열 = 해당 합계 \ 시작 {정렬} & E (r, c) = \ frac {n (r) 곱하기 c (r)} {n} \ & \ textbf {where:} \ & r = \ text {문제가있는 행} \ & c = \ text {문제가있는 열} \ & n = \ text {총 해당} \ \ end {aligned} E (r, c) = nn (r) × c (r) 여기서: r = 행의 행 = 질문의 열 = 해당 총계
이 예에서 예상 빈도는 다음과 같습니다.
- E (1, 1) = (900 x 800) / 2, 000 = 360E (1, 2) = (900 x 800) / 2, 000 = 360E (1, 3) = (200 x 800) / 2, 000 = 80E (2, 1) = (900 x 1, 200) / 2, 000 = 540E (2, 2) = (900 x 1, 200) / 2, 000 = 540E (2, 3) = (200 x 1, 200) / 2, 000 = 120
다음은 다음 공식을 사용하여 카이 제곱 통계량을 계산하는 데 사용되는 값입니다.
Chi-squared = ∑2E (r, c) where: O (r, c) = 주어진 행과 열에 대한 관측 된 데이터 \ begin {aligned} & \ text {Chi-squared} = \ sum \ frac {^ 2} {E (r, c)} \ & \ textbf {where:} \ & O (r, c) = \ text {주어진 행과 열에 대한 관찰 된 데이터} \ \ end {aligned} ∑E (r, c) 2 여기서: O (r, c) = 주어진 행과 열에 대한 관측 된 데이터
이 예에서 각 관측 값에 대한 표현식은 다음과 같습니다.
- O (1, 1) = (400-360) 2/360 = 4.44O (1, 2) = (300-360) 2/360 = 10O (1, 3) = (100-80) 2/80 = 5O (2, 1) = (500-540) 2/540 = 2.96O (2, 2) = (600-540) 2/540 = 6.67O (2, 3) = (100-120) 2/120 = 3.33
카이 제곱 통계량은이 값의 합 또는 32.41과 같습니다. 결과가 통계적으로 유의한지 여부에 따라 설정의 자유도를 고려하여 카이 제곱 통계표를 볼 수 있습니다.