단계적 회귀 란 무엇입니까?
회귀 분석은 변수 사이의 관계를 식별하기 위해 널리 사용되는 통계적 접근 방식입니다. 아이디어는 더 나은 정보에 근거한 결정을 내리기 위해 관련 데이터를 모으는 것이며 투자 세계에서 일반적인 관행입니다. 단계적 회귀는 독립 변수를 자동으로 선택하는 회귀 모델의 단계별 반복 구성입니다. 통계 소프트웨어 패키지의 가용성은 수백 개의 변수가있는 모델에서도 단계적 회귀를 가능하게합니다.
단계적 회귀의 유형
단계적 회귀의 기본 목표는 일련의 검정 (F- 검정, t- 검정)을 통해 종속 변수에 크게 영향을 미치는 일련의 독립 변수를 찾는 것입니다. 이 과정은 반복을 통해 컴퓨터에서 수행되며, 반복 또는 분석주기를 반복하여 결과 또는 결정에 도달하는 프로세스입니다. 통계 소프트웨어 패키지의 도움으로 자동 테스트를 수행하면 개인의 시간을 절약 할 수 있다는 이점이 있습니다.
주요 테이크 아웃
- 회귀 분석은 독립 변수와 종속 변수 사이의 관계를 이해하고 측정하는 통계적 접근 방법입니다. 단계적 회귀 분석은 모형 내 각 독립 변수의 통계적 유의성을 검사하는 방법입니다. 순방향 선택 접근 방법은 변수를 추가 한 다음 통계적 유의성을 테스트합니다. 후진 제거 방법은 많은 변수가로드 된 모델로 시작한 다음 전체 결과에 대한 중요성을 테스트하기 위해 하나의 변수를 제거합니다. 단계적 회귀 분석은 데이터를 모델에 적합시켜 원하는 결과를 얻는 접근법이므로 많은 비평가가 있습니다.
단계별 회귀 분석은 한 번에 하나의 독립 변수를 시도하고 통계적으로 유의하면 회귀 모델에 포함 시키거나 모형에 모든 잠재적 독립 변수를 포함시키고 통계적으로 유의하지 않은 변수를 제거하여 달성 할 수 있습니다. 일부는 두 방법의 조합을 사용하므로 단계적 회귀에 대한 세 가지 접근 방식이 있습니다.
- 순방향 선택은 모델에 변수가없는 상태에서 시작하여 모델에 추가 될 때마다 각 변수를 테스트 한 다음 통계적으로 가장 중요한 것으로 간주되는 변수를 유지합니다. 결과가 최적화 될 때까지 프로세스를 반복합니다. 한 번에 하나씩 삭제 한 다음 제거 된 변수가 통계적으로 유의한지 확인하기위한 테스트 양방향 제거는 어떤 변수를 포함하거나 제외해야하는지 테스트하는 처음 두 가지 방법의 조합입니다.
역 제거 방법을 사용하는 단계적 회귀의 예는 장비 가동 시간, 장비 수명, 직원 규모, 외부 온도 및 연중 시간과 같은 변수를 사용하여 공장의 에너지 사용량을 이해하려는 시도입니다. 이 모델에는 모든 변수가 포함되어 있습니다. 각 변수는 통계적으로 가장 중요한 변수를 결정하기 위해 한 번에 하나씩 제거됩니다. 결국, 모델은 연중 시간과 온도가 가장 중요하다는 것을 보여줄 수 있으며, 아마도 공장에서의 최대 에너지 소비는 에어컨 사용이 최고 일 때를 암시합니다.
단계적 회귀의 한계
선형 및 다변량의 회귀 분석은 오늘날 투자 세계에서 널리 사용됩니다. 아이디어는 종종 과거에도 존재하여 미래에도 반복 될 수있는 패턴을 찾는 것입니다. 예를 들어 간단한 선형 회귀 분석은 P / E 비율이 낮은 주식 (독립 변수)이 더 높은 수익률 (종속 변수)을 제공하는지 여부를 결정하기 위해 수년 동안의 가격 대비 수익률과 주식 수익률을 볼 수 있습니다. 이 접근법의 문제점은 시장 상황이 종종 변하고 과거에 유지되었던 관계가 현재 또는 미래에 반드시 사실을 유지하지는 않는다는 것입니다.
한편, 단계적 회귀 과정에는 많은 비평가가 있으며, 이 방법의 사용을 완전히 중단하라는 요구도 있습니다. 통계 학자들은 부정확 한 결과, 프로세스 자체의 고유 한 편향, 반복을 통해 복잡한 회귀 모델을 개발하기위한 상당한 컴퓨팅 능력의 필요성 등 접근법에 대한 몇 가지 단점을 지적합니다.
