목차
- T- 테스트 란 무엇입니까?
- T 테스트 설명
- 모호한 테스트 결과
- T- 검정 가정
- T- 검정 계산
- 상관 (또는 쌍을 이룬) T- 검정
- 등분 산 (풀링) T- 검정
- 동일하지 않은 분산 T- 검정
- 사용할 T- 검정 결정
- 동일하지 않은 분산 T- 검정 예
T- 테스트 란 무엇입니까?
t- 검정은 특정 기능과 관련이있을 수있는 두 그룹의 평균간에 유의 한 차이가 있는지 확인하는 데 사용되는 일종의 추론 통계입니다. 코인을 100 번 뒤집은 결과로 기록 된 데이터 세트와 같은 데이터 세트가 정규 분포를 따르고 알 수없는 분산이있을 때 주로 사용됩니다. t- 검정은 가정에 적용 할 수있는 가정을 검정 할 수있는 가설 검정 도구로 사용됩니다.
t- 검정은 t- 통계량, t- 분포 값 및 두 데이터 집합 간의 차이 확률을 결정하기위한 자유도를 조사합니다. 세 개 이상의 변수로 검정을 수행하려면 분산 분석을 사용해야합니다.
T 테스트
T 테스트 설명
본질적으로 t- 검정을 통해 두 데이터 세트의 평균값을 비교하고 동일한 모집단에서 온 것인지 확인할 수 있습니다. 위의 예에서, 우리가 A 급 학생들과 B 급 학생들의 다른 표본을 취한다면, 학생들이 정확히 같은 평균과 표준 편차를 가질 것으로 기대하지는 않을 것입니다. 이와 유사하게, 위약 투여군에서 채취 한 시료와 약물 처방 군에서 채취 한 시료의 평균 및 표준 편차는 약간 다릅니다.
수학적으로 t- 검정은 두 세트 각각에서 표본을 추출하여 두 평균이 같다는 귀무 가설을 가정하여 문제 설명을 설정합니다. 적용 가능한 공식을 기반으로 특정 값이 계산되어 표준 값과 비교되며, 귀무 가설이 그에 따라 수락되거나 거부됩니다.
귀무 가설이 기각 될 자격이있는 경우 데이터 판독 값이 강력하고 우연이 아님을 나타냅니다. t- 검정은이 목적으로 사용되는 많은 시험 중 하나 일뿐입니다. 통계학자는 t- 검정 이외의 검정을 추가로 사용하여 더 많은 변수와 표본 크기가 더 큰 검정을 조사해야합니다. 표본 크기가 큰 경우 통계학자는 z- 검정을 사용합니다. 다른 테스트 옵션으로는 카이-제곱 테스트 및 f- 테스트가 있습니다.
t- 검정에는 세 가지 유형이 있으며 종속적이고 독립적 인 t- 검정으로 분류됩니다.
주요 테이크 아웃
- t- 검정은 특정 기능과 관련이있을 수있는 두 그룹의 평균간에 유의 한 차이가 있는지 확인하는 데 사용되는 추론 통계 유형입니다. t- 검정은 가설 검정 목적으로 사용되는 많은 검정 중 하나입니다. t- 검정을 계산하려면 세 가지 주요 데이터 값이 필요합니다. 여기에는 각 데이터 세트의 평균 값 (평균 차이라고 함), 각 그룹의 표준 편차 및 각 그룹의 데이터 값 수의 차이가 포함됩니다.T- 검정에는 여러 가지 유형이 있습니다. 필요한 데이터 및 분석 유형.
모호한 테스트 결과
의약품 제조업체가 새로 발명 된 의약품을 테스트하려고합니다. 그것은 한 그룹의 환자에게 약물을 시도하고 대조군이라는 다른 그룹에 위약을 제공하는 표준 절차를 따릅니다. 대조군에 제공된 위약은 의도 된 치료 적 가치가없는 물질이며 실제 약물이 제공되는 다른 그룹이 어떻게 반응 하는지를 측정하기위한 벤치 마크 역할을합니다.
약물 시험 후, 위약 투여 대조군의 구성원은 3 년의 평균 수명이 증가한 것으로보고하고, 새로운 약물을 처방받은 그룹의 구성원은 4 년의 평균 수명이 증가한 것으로보고 하였다. 즉각적인 관찰 결과는 약물을 사용하는 그룹에 대해 결과가 더 좋으므로 약물이 실제로 효과가 있음을 나타낼 수 있습니다. 그러나 관찰은 우연한 발생, 특히 놀라운 운이 원인 일 수도 있습니다. t- 검정은 결과가 실제로 정확하고 전체 모집단에 적용 가능한지 결론을 내리는 데 유용합니다.
학교에서 A 클래스의 100 명의 학생들이 평균 85 %의 점수를 받았으며 표준 편차는 3 %입니다. 클래스 B에 속한 다른 100 명의 학생들은 평균 87 %의 점수를 받았으며 표준 편차는 4 %였습니다. 클래스 B의 평균이 클래스 A의 평균보다 우수하지만, 클래스 B의 학생들의 전체 성과가 클래스 A의 학생들보다 우수하다는 결론에 도달하는 것은 옳지 않을 수 있습니다. 평균적으로 클래스 B의 표준 편차는 클래스 A의 표준 편차보다 높습니다. 이는 클래스 A와 비교할 때 극단적 인 백분율이 클래스 A와 비교할 때 훨씬 더 많이 퍼져 있음을 나타냅니다. t- 검정은 어느 수업이 더 나아 졌습니까?
T- 검정 가정
- t- 검정에 관한 첫 번째 가정은 측정 규모와 관련이 있습니다. t- 검정에 대한 가정은 수집 된 데이터에 적용되는 측정 규모가 IQ 시험의 점수와 같은 연속적 또는 순 서적 척도를 따른다는 것입니다. 두 번째 가정은 간단한 무작위 표본에 대한 것으로 가정합니다. 세 번째 가정은 데이터가 플롯 될 때 정규 분포, 종 모양 분포 곡선을 생성하며, 네 번째 가정은 표본 크기가 상당히 크다는 것입니다. 표본 크기가 클수록 결과 분포가 일반적인 종 모양 곡선에 접근해야한다는 것을 의미합니다. 마지막 가정은 분산의 동질성입니다. 표본의 표준 편차가 대략 동일 할 때 동종 또는 동일 분산이 존재합니다.
T- 검정 계산
t- 검정을 계산하려면 세 가지 주요 데이터 값이 필요합니다. 여기에는 각 데이터 세트의 평균 값 차이 (평균 차이라고 함), 각 그룹의 표준 편차 및 각 그룹의 데이터 값 수가 포함됩니다.
t- 검정의 결과는 t- 값을 생성합니다. 이 계산 된 t- 값은 임계 값 테이블 (T- 분포 테이블이라고 함)에서 얻은 값과 비교됩니다. 이 비교는 우연히 평균 간의 차이가 발생할 가능성 또는 데이터 집합에 본질적인 차이가 있는지 여부를 확인하는 데 도움이됩니다. t- 검정은 그룹 간의 차이가 연구에서 실제 차이를 나타내는 지 또는 의미없는 통계적 차이 일 가능성이 있는지에 대한 질문입니다.
T- 분포 테이블
T- 분포 테이블은 단일 꼬리 및 이중 꼬리 형식으로 제공됩니다. 전자는 명확한 방향 (양수 또는 음수)으로 고정 된 값 또는 범위를 갖는 경우를 평가하는 데 사용됩니다. 예를 들어, 한 쌍의 주사위를 굴릴 때 출력 값이 -3 미만으로 남아 있거나 7보다 큰 확률은 얼마입니까? 후자는 좌표가 -2와 +2 사이인지 묻는 것과 같은 범위 경계 분석에 사용됩니다.
계산은 MS Excel과 같은 필요한 통계 기능을 지원하는 표준 소프트웨어 프로그램으로 수행 할 수 있습니다.
T- 값과 자유도
t- 검정은 출력으로 t- 값과 자유도라는 두 가지 값을 생성합니다. t- 값은 두 샘플 세트의 평균과 샘플 세트 내에 존재하는 차이 간의 차이의 비율입니다. 분자 값 (두 샘플 세트의 평균 간 차이)은 계산하기 간단하지만 분모 (샘플 세트 내에 존재하는 차이)는 관련된 데이터 값의 유형에 따라 약간 복잡해질 수 있습니다. 비율의 분모는 분산 또는 변동성을 측정 한 것입니다. t- 점수라고도하는 t- 값이 높을수록 두 샘플 세트간에 큰 차이가 있음을 나타냅니다. t- 값이 작을수록 두 샘플 세트간에 더 많은 유사성이 존재합니다.
- 큰 t- 점수는 그룹이 다르다는 것을 나타내고 작은 t- 점수는 그룹이 유사 함을 나타냅니다.
자유도는 변화 할 자유가 있고 귀무 가설의 중요성과 유효성을 평가하는 데 필수적인 연구의 값을 말합니다. 이러한 값의 계산은 일반적으로 샘플 세트에서 사용 가능한 데이터 레코드 수에 따라 다릅니다.
상관 (또는 쌍을 이룬) T- 검정
상관 된 t- 검정은 샘플이 일반적으로 유사한 단위의 일치하는 쌍으로 구성되거나 반복 측정의 경우가 수행됩니다. 예를 들어, 특정 치료를 받기 전과 후에 동일한 환자가 반복적으로 검사되는 사례가있을 수 있습니다. 이 경우 각 환자는 자신에 대한 대조 샘플로 사용됩니다.
이 방법은 또한 샘플이 어떤 방식으로 관련되거나 어린이, 부모 또는 형제 자매를 포함하는 비교 분석과 같이 특성이 일치하는 경우에도 적용됩니다. 상관 또는 쌍을 이루는 t- 검정은 두 세트의 샘플이 관련된 경우를 포함하므로 종속 유형입니다.
쌍을 이루는 t- 검정에 대한 t- 값 및 자유도를 계산하는 공식은 다음과 같습니다.
- 평균 1 및 평균 2는 각 샘플 세트의 평균값이며 var1 및 var2 는 각 샘플 세트의 분산을 나타냅니다.
나머지 두 유형은 독립 t- 검정에 속합니다. 이러한 유형의 샘플은 서로 독립적으로 선택됩니다. 즉, 두 그룹의 데이터 세트가 동일한 값을 참조하지 않습니다. 여기에는 100 명의 환자 그룹이 각각 50 명의 환자 두 세트로 분할되는 경우가 포함됩니다. 그룹 중 하나가 대조군이되고 위약이 제공되는 반면, 다른 그룹은 처방 된 치료를받습니다. 이것은 서로 짝을 이루지 않는 두 개의 독립적 인 샘플 그룹을 구성합니다.
등분 산 (또는 풀링) T- 검정
등분 산 t- 검정은 각 그룹의 표본 수가 동일하거나 두 데이터 세트의 분산이 유사한 경우에 사용됩니다. 등분 산 t- 검정에 대한 t- 값 및 자유도를 계산하는 데 다음 공식이 사용됩니다.
의 T- 값 = n1 + n2-2 (n1-1) × var12 + (n2-1) × var22 × n11 + n21 평균 1− 평균 2 여기서, 평균 1 및 평균 2 = 각 샘플 세트의 평균값 var2 = 각 샘플 세트의 차이 n1 및 n2 = 각 샘플 세트의 레코드 수
과, 의 자유도 = n1 + n2−2 여기서: n1 및 n2 = 각 표본 세트의 레코드 수
동일하지 않은 분산 T- 검정
동일하지 않은 분산 t- 검정은 각 그룹의 샘플 수가 다르고 두 데이터 세트의 분산도 다른 경우에 사용됩니다. 이 테스트는 Welch의 t- 테스트라고도합니다. 동일하지 않은 분산 t- 검정에 대한 t- 값 및 자유도를 계산하는 데 다음 공식이 사용됩니다.
의 T- 값 = n1var12 + n2var22 평균 1− 평균 2 여기서, 평균 1 및 평균 2 = 각 샘플 세트의 평균값 var1 및 var2 = 각 샘플 세트의 편차 n1 및 n2 = 각 샘플 세트의 레코드 수
과, 의 자유도 = n1-1 (n1var12) 2 + n2-1 (n2var22) 2 (n1var12 + n2var22) 2 여기서: var1 및 var2 = 각 샘플 세트의 편차 n1 및 n2 = 번호 각 샘플 세트의 레코드 수
사용할 올바른 T- 검정 결정
다음 순서도를 사용하여 샘플 세트의 특성에 따라 사용해야하는 t- 검정을 결정할 수 있습니다. 고려해야 할 주요 항목에는 샘플 레코드의 유사 여부, 각 샘플 세트의 데이터 레코드 수 및 각 샘플 세트의 분산이 포함됩니다.
Julie Bang의 이미지 © Investopedia 2019
동일하지 않은 분산 T- 검정 예
아트 갤러리에서받은 그림을 대각선으로 측정한다고 가정합니다. 한 그룹의 샘플에는 10 개의 그림이 포함되고 다른 그룹에는 20 개의 그림이 포함됩니다. 해당 평균 및 분산 값을 갖는 데이터 세트는 다음과 같습니다.
세트 1 | 세트 2 | |
19.7 | 28.3 | |
20.4 | 26.7 | |
19.6 | 20.1 | |
17.8 | 23.3 | |
18.5 | 25.2 | |
18.9 | 22.1 | |
18.3 | 17.7 | |
18.9 | 27.6 | |
19.5 | 20.6 | |
21.95 | 13.7 | |
23.2 | ||
17.5 | ||
20.6 | ||
18 | ||
23.9 | ||
21.6 | ||
24.3 | ||
20.4 | ||
23.9 | ||
13.3 | ||
평균 | 19.4 | 21.6 |
변화 | 1.4 | 17.1 |
세트 2의 평균이 세트 1의 평균보다 높지만 세트 2의 분산이 세트 1보다 상당히 높기 때문에 모든 그림의 평균 길이가 약 21.6 단위라고 결론을 내릴 수는 없습니다. 우연히 또는 실제로 차이가 있습니까? 미술관에서받은 모든 그림의 전체 인구에서? 두 표본 집합간에 평균이 같다는 귀무 가설을 가정하여 문제를 설정하고 가설이 참인지 확인하기 위해 t- 검정을 수행합니다.
데이터 레코드의 수가 다르고 (n1 = 10 및 n2 = 20) 분산도 다르므로 t- 값과 자유도는 불평등 분산 T- 검정에 언급 된 공식을 사용하여 위의 데이터 세트에 대해 계산됩니다. 부분.
t- 값은 -2.24787입니다. 두 t- 값을 비교할 때 빼기 부호를 무시할 수 있으므로 계산 된 값은 2.24787입니다.
자유도 값은 24.38이며 값을 최소 정수 값으로 내림해야하는 수식 정의로 인해 24로 줄어 듭니다.
정규 분포가 가정 될 때마다 확률 수준 (알파 수준, 유의 수준, p )을 수용 기준으로 지정할 수 있습니다. 대부분의 경우 5 % 값을 가정 할 수 있습니다.
자유도 값을 24로, 5 % 유의 수준을 사용하면 t- 값 분포표를 보면 2.064가됩니다. 이 값을 계산 된 값 2.247과 비교하면 계산 된 t- 값이 5 %의 유의 수준에서 테이블 값보다 크다는 것을 나타냅니다. 따라서 평균간에 차이가 없다는 귀무 가설을 기각하는 것이 안전합니다. 인구 집단에는 본질적인 차이가 있으며 우연히 아닙니다.
투자 계정 비교 ×이 표에 표시된 오퍼는 Investopedia가 보상을받는 파트너 관계에서 제공됩니다. 공급자 이름 설명관련 용어
분산 분석 (ANOVA) 작동 방식 분산 분석 (ANOVA)은 데이터 세트에서 발견 된 총 변동성을 랜덤 및 시스템 요인의 두 가지 구성 요소로 분리하는 통계 분석 도구입니다. Z- 검정 정의 z- 검정은 분산을 알고 표본 크기가 클 때 두 모집단 평균이 다른지 여부를 확인하는 데 사용되는 통계 검정입니다. more 자유도 정의 자유도는 데이터 샘플에서 자유로이 변할 수있는 논리적으로 독립적 인 최대 값 수를 나타냅니다. 자세히 T 분포 이해 AT 분포는 표본 크기가 작거나 분산이 알려지지 않은 모집단 모수를 추정하는 데 적합한 확률 함수 유형입니다. more 반 편차의 측정 반 편차는 투자 수익률의 평균 이하 변동을 평가하는 방법입니다. 표준 편차에 대한 대안으로 사용됩니다. 자세히 Bonferroni 테스트 Bonferroni 테스트는 통계 분석에 사용되는 다중 비교 테스트 유형입니다. 더 많은 파트너 링크관련 기사
경제학
t- 검정을 수행 할 때 어떤 가정이 이루어 집니까?
위기 관리
미래 변동성을 측정하기 위해 역사적 변동성 사용
주식 거래 전략 및 교육
Excel을 사용하여 주가를 시뮬레이션하는 방법
재무 비율
Excel에서 IRR을 어떻게 계산합니까?
수학 및 통계
상대 표준 오차 란 무엇입니까
재무 비율
Excel에서 순 현재 가치 (NPV)를 계산하는 공식은 무엇입니까?
