Durbin Watson 통계 란 무엇입니까?
Durbin Watson (DW) 통계량은 통계적 회귀 분석의 잔차에서 자기 상관에 대한 검정입니다. Durbin-Watson 통계량은 항상 0과 4 사이의 값을 갖습니다. 값 2.0은 표본에서 자기 상관이 감지되지 않음을 의미합니다. 0에서 2보다 작은 값은 양의 자기 상관을 나타내고 2에서 4 사이의 값은 음의 자기 상관을 나타냅니다.
양의 자기 상관을 나타내는 주가는 어제 가격이 오늘 가격과 양의 상관 관계를 가짐을 나타냅니다. 따라서 어제 주식이 하락하면 오늘도 하락할 가능성이 있습니다. 반면에 자기 상관이 음수 인 보안은 시간이 지남에 따라 자체적으로 부정적인 영향을 미치므로 어제 하락할 경우 오늘 상승 할 가능성이 더 큽니다.
주요 테이크 아웃
- Durbin Watson 통계량은 데이터 세트의 자동 상관 검정입니다.DW 통계량은 항상 0에서 4.0 사이의 값을 갖습니다. 값이 2.0이면 샘플에서 자기 상관이 감지되지 않음을 의미합니다. 0에서 2.0 사이의 값은 양의 자기 상관을 나타내고 2.0에서 4.0 사이의 값은 음의 자기 상관을 나타냅니다. 자기 상관은 회사의 재무 건전성 또는 관리 대신 차트 기술을 사용하여 보안 가격 추세와 가장 관련이있는 기술 분석에 유용 할 수 있습니다.
Durbin Watson 통계의 기초
직렬 상관이라고도하는 자기 상관은 기록 데이터를 찾아야하는 것을 모르는 경우 기록 데이터를 분석하는 데 중요한 문제가 될 수 있습니다. 예를 들어, 주가는 하루 하루 너무 급격하게 변하지 않는 경향이 있기 때문에, 이 관측에 유용한 정보가 거의 없더라도 하루 하루 가격이 서로 밀접하게 연관 될 수 있습니다. 자기 상관 문제를 피하기 위해 가장 쉬운 금융 솔루션은 일련의 과거 가격을 매일 매일 일련의 백분율 가격 변동으로 변환하는 것입니다.
자기 상관은 회사의 재무 건전성 또는 관리 대신 차트 기술을 사용하여 보안 가격의 추세 및 관계와 가장 관련이있는 기술 분석에 유용 할 수 있습니다. 기술 분석가는 자기 상관을 사용하여 유가 증권의 과거 가격이 미래 가격에 미치는 영향을 확인할 수 있습니다.
Durbin Watson 통계는 통계 학자 James Durbin 및 Geoffrey Watson의 이름을 따서 명명되었습니다.
자기 상관은 주식과 관련된 운동량 요인이 있는지를 보여줄 수 있습니다. 예를 들어, 역사적으로 주식의 자기 상관 값이 높다는 것을 알고 지난 며칠 동안 주식이 견실 한 증가를 목격했다면 다가오는 며칠 동안 (주요 시계열)의 움직임이 합리적으로 예상 될 수 있습니다. 뒤쳐진 시계열의 시계열 및 위쪽으로 이동합니다.
더빈 왓슨 통계의 예
Durbin Watson 통계량에 대한 공식은 다소 복잡하지만 일련의 데이터에서 보통 최소 제곱 회귀의 잔차를 포함합니다. 다음 예는이 통계를 계산하는 방법을 보여줍니다.
다음 (x, y) 데이터 포인트를 가정하십시오.
의 쌍 1 = (10, 1, 100) 쌍 2 = (20, 1, 200) 쌍 3 = (35, 985) 쌍 4 = (40, 750) 쌍 5 = (50, 1, 215) 쌍 6 = (45, 1, 000)
최소 제곱 법을 사용하여 "최적 적합 선"을 찾는 경우이 데이터의 최적 적합 선에 대한 방정식은 다음과 같습니다.
의 Y = −2.6268x + 1, 129.2
Durbin Watson 통계량을 계산하는 첫 번째 단계는 가장 적합한 방정식을 사용하여 예상되는 "y"값을 계산하는 것입니다. 이 데이터 세트의 경우 예상되는 "y"값은 다음과 같습니다.
의 예상 Y (1) = (− 2.6268 × 10) + 1, 129.2 = 1, 102.9 예측 Y (2) = (− 2.6268 × 20) + 1, 129.2 = 1, 076.7 예상 Y (3) = (− 2.6268 × 35) + 1, 129.2 = 1, 037.3 예상 Y (4) = (− 2.6268 × 40) + 1, 129.2 = 1, 024.1 예상 Y (5) = (− 2.6268 × 50) + 1, 129.2 = 997.9 예상 Y (6) = (− 2.6268 × 45) + 1, 129.2 = 1, 011
다음으로 실제 "y"값과 예상되는 "y"값의 차이 인 오차가 계산됩니다.
의 오류 (1) = (1, 100−1, 102.9) = − 2.9 오류 (2) = (1, 200-1, 076.7) = 123.3 오류 (3) = (985−1, 037.3) = − 52.3 오류 (4) = (750-1, 024.1) = −274.1 오류 (5) = (1, 215−997.9) = 217.1 오류 (6) = (1, 000−1, 011) = − 11
다음으로 이러한 오류를 제곱하고 합산해야합니다.
의 오류의 제곱 = (− 2.92 + 123.32 + −52.32 + −274.12 + 217.12 + −112) = 140, 330.81
다음으로 오류 값에서 이전 오류를 뺀 값을 계산하고 제곱합니다.
의 차이 (1) = (123.3 − (− 2.9)) = 126.2 차이 (2) = (− 52.3−123.3) = − 175.6 차이 (3) = (− 274.1 − (− 52.3)) = − 221.9 차 (4) = (217.1 − (− 274.1)) = 491.3 차 (5) = (− 11−217.1) = − 228.1 차이의 제곱 광장 = 389, 406.71
마지막으로 Durbin Watson 통계량은 제곱 값의 몫입니다.
의 더빈 왓슨 = 389, 406.71 / 140, 330.81 = 2.77
일반적으로 1.5 ~ 2.5 범위의 검정 통계량 값은 상대적으로 정상입니다. 이 범위를 벗어난 값은 문제의 원인이 될 수 있습니다. Durbin–Watson 통계량은 많은 회귀 분석 프로그램에 의해 표시되지만 특정 상황에는 적용되지 않습니다. 예를 들어 지연 종속 변수가 설명 변수에 포함 된 경우이 테스트를 사용하는 것은 부적절합니다.