Homoskedastic은 무엇입니까?
Homoskedastic (또는 "homoscedastic"이라고도 함)은 회귀 모형에서 잔차 또는 오차 항의 분산이 일정한 조건을 나타냅니다. 즉, 예측 변수의 값이 변함에 따라 오차 항은 크게 변하지 않습니다. 그러나 homoskedasticity가 없으면 회귀 모델에 종속 변수의 성능을 설명하기 위해 추가 예측 변수를 포함해야 할 수도 있습니다.
주요 테이크 아웃
- 회귀 모형에서 오차항의 분산이 일정하면 동종 일치가 발생합니다. 오차항의 분산이 균일 한 경우 모형이 잘 정의되었습니다. 분산이 너무 많으면 모형이 제대로 정의되지 않았을 수 있습니다. 예측 변수를 더 추가하면 종속 변수의 성능을 설명하는 데 도움이 될 수 있습니다. 반대로, 이분산성은 오차 항의 분산이 일정하지 않은 경우에 발생합니다.
Homoskedastic의 작동 방식
Homoskedasticity는 선형 회귀 모델링의 한 가정입니다. 회귀선 주위의 오차 분산이 크게 변하면 회귀 모형이 잘못 정의 될 수 있습니다. "균질성"의 반대가 "이종성"인 것과 동일하게, 균일 성도의 반대는 이질성이다. 이분산성 (일명 "이분산성"이라고도 함)은 회귀 방정식에서 오차 항의 분산이 일정하지 않은 조건을 나타냅니다.
분산이 예측 된 결과와 주어진 상황의 실제 결과 사이의 측정 된 차이라는 것을 고려할 때, 균일 성 결정은 정확성을 위해 어떤 요소가 조정되어야 하는지를 결정하는 데 도움이 될 수 있습니다.
특별 고려 사항
단순 회귀 모형 또는 방정식은 4 개의 항으로 구성됩니다. 왼쪽에는 종속 변수가 있습니다. 모델이 "설명"하려는 현상을 나타냅니다. 오른쪽에는 상수, 예측 변수 및 잔차 또는 오차 항이 있습니다. 오차항은 예측 변수에 의해 설명되지 않은 종속 변수의 변동량을 나타냅니다.
Homoskedastic의 예
예를 들어, 각 학생이 공부 한 시간을 사용하여 학생 시험 점수를 설명하려고한다고 가정하십시오. 이 경우 검정 점수는 종속 변수가되고 연구에 소요 된 시간은 예측 변수가됩니다.
오차항은 시험 시간에 의해 설명되지 않은 시험 점수의 분산 량을 나타냅니다. 이 분산이 균일하거나 균일 성이면 모형이 시험 성능에 대한 적절한 설명이 될 수 있음을 시사합니다. 이는 연구에 소요 된 시간으로 설명합니다.
그러나 분산은이 분산 일 수 있습니다. 오류 용어 데이터의 플롯은 많은 양의 연구 시간이 높은 시험 점수와 매우 밀접하게 일치하지만 낮은 연구 시간 시험 점수는 광범위하게 변하고 심지어 매우 높은 점수를 포함했음을 보여줍니다. 따라서 점수의 분산은 하나의 예측 변수 (연구 시간)에 의해 잘 설명되지 않습니다. 이 경우 다른 요소가 작동 중일 수 있으며 모델을 식별하기 위해 모델을 개선해야 할 수도 있습니다. 추가 조사를 통해 일부 학생들은 시험에 대한 답변을 미리 보았거나 이전에 비슷한 시험을 보았으므로이 특정 시험에 대해 공부할 필요가 없음을 알 수 있습니다.
따라서 회귀 모형을 개선하기 위해 연구원은 시험 전에 학생이 답을 보았는지 여부를 나타내는 다른 설명 변수를 추가합니다. 회귀 모델에는 두 가지 설명 변수, 즉 공부하는 시간과 학생이 답에 대한 사전 지식이 있는지 여부가 있습니다. 이 두 변수를 사용하면 검정 점수의 분산이 더 많이 설명되고 오차 항의 분산이 동일 할 수 있으며 모형이 잘 정의되어 있음을 나타냅니다.