자유도는 무엇입니까?
자유도는 데이터 샘플에서 자유롭게 변경할 수있는 논리적으로 독립적 인 값의 최대 수를 나타냅니다.
주요 테이크 아웃
- 자유도는 데이터 샘플에서 자유로이 변할 수있는 최대 값의 논리적으로 독립적 인 값의 수를 나타냅니다. 자유도는 일반적으로 카이와 같은 통계에서 다양한 형태의 가설 검정과 관련하여 논의됩니다. 카이-제곱 통계량의 중요성과 귀무 가설의 유효성을 이해하려는 경우 자유도 계산이 중요합니다.
자유도 이해
자유도를 개념적으로 이해하는 가장 쉬운 방법은 다음과 같은 예입니다.
- 간단하게하기 위해 5 개의 양의 정수로 구성된 데이터 샘플을 고려하십시오. 값은 알려진 관계가없는 숫자 일 수 있습니다. 이 데이터 샘플은 이론적으로 5 자유도를 갖습니다. 샘플의 숫자 중 4 개는 {3, 8, 5 및 4}이며 전체 데이터 샘플의 평균은 6으로 나타납니다. 다섯 번째 숫자는 10이어야합니다. 변경할 자유가 없으므로이 데이터 샘플의 자유도는 4입니다.
자유도에 대한 공식은 데이터 샘플의 크기에서 1을 뺀 것과 같습니다.
의 Df = N−1 여기서: Df = 자유도 N = 표본 크기
자유도는 카이-제곱과 같은 통계에서 다양한 형태의 가설 검정과 관련하여 일반적으로 논의됩니다. 카이-제곱 통계량의 중요성과 귀무 가설의 유효성을 이해하려고 할 때 자유도를 계산해야합니다.
카이-제곱 검정
카이-제곱 검정에는 두 가지 종류가 있습니다. "성별 점수와 SAT 점수 사이에 관계가 있습니까?"와 같은 관계 문제를 묻는 독립성 테스트; 그리고 "코인을 100 번 던졌다면 50 번 머리를 올리고 50 번 꼬리를 올릴까요?"와 같은 질문을합니다.
이러한 테스트의 경우, 자유도는 실험 내 변수 및 샘플의 총 수를 기반으로 특정 귀무 가설을 기각 할 수 있는지 여부를 결정하는 데 사용됩니다. 예를 들어, 학생 및 코스 선택을 고려할 때 30 명 또는 40 명의 학생의 표본 크기는 중요한 데이터를 생성하기에 충분히 크지 않을 수 있습니다. 400 명 또는 500 명의 학생으로 구성된 표본을 사용하여 연구에서 동일하거나 유사한 결과를 얻는 것이 더 유효합니다.
자유도의 역사
자유도의 초기이자 가장 기본적인 개념은 1800 년대 초에 수학자이자 천문학자인 Carl Friedrich Gauss의 작품에 얽혀있었습니다. 이 용어의 현대적인 사용법과 이해는 영어 통계학자인 윌리엄 실리 고셋 (William Sealy Gosset)이 그의 익명 성을 유지하기 위해 1908 년 Biometrika에 발표 한 "평균의 가능성있는 오류"라는 기사에서 처음으로 설명되었습니다.
그의 글에서 Gosset은 "자유도"라는 용어를 구체적으로 사용하지 않았습니다. 그러나 그는 결국 Student 's T-distribution으로 알려진 것을 개발하는 과정에서 개념에 대해 설명했습니다. 실제 용어는 1922 년까지 인기를 얻지 못했습니다. 영어 생물 학자와 통계 학자 Ronald Fisher는 카이 제곱 개발 작업에 대한 보고서와 데이터를 게시하기 시작할 때 "자유도"라는 용어를 사용하기 시작했습니다.
