다중 선형 회귀 – MLR이란 무엇입니까?
간단히 다중 회귀라고도하는 MLR (다중 선형 회귀)은 반응 변수의 결과를 예측하기 위해 여러 설명 변수를 사용하는 통계 기법입니다. 다중 선형 회귀 (MLR)의 목표는 설명 (독립) 변수와 반응 (종속) 변수 사이의 선형 관계를 모델링하는 것입니다.
본질적으로 다중 회귀는 설명 변수가 두 개 이상 포함 된 보통 최소 자승 (OLS) 회귀의 확장입니다.
다중 선형 회귀에 대한 공식은
의 yi = β0 + β1xi1 + β2xi2 +… + βpxip + ϵ 여기서 i = n 관측치: yi = 종속 변수 xi = 확장 변수 β0 = y 절편 (일정한 βp = 각 설명 변수에 대한 기울기 계수 ϵ = 모델의 오차 항 (잔차라고도 함)
다중 선형 회귀 설명
단순 선형 회귀 분석은 분석 가나 통계학자가 다른 변수에 대해 알려진 정보를 기반으로 한 변수에 대한 예측을 할 수있는 함수입니다. 선형 회귀는 하나의 독립 변수와 종속 변수라는 두 개의 연속 변수가있는 경우에만 사용할 수 있습니다. 독립 변수는 종속 변수 또는 결과를 계산하는 데 사용되는 매개 변수입니다. 다중 회귀 모델은 여러 설명 변수로 확장됩니다.
다중 회귀 모델은 다음 가정을 기반으로합니다.
- 종속 변수와 독립 변수 사이에는 선형 관계가 있습니다. 독립 변수는 서로 너무 밀접한 상관 관계가 없습니다.y i 관측 값은 모집단에서 독립적으로 무작위로 선택됩니다. 잔차는 평균 0과 분산으로 분포해야합니다 σ.
결정 계수 (R-squared)는 독립 변수의 변동에 의해 결과 변동이 얼마나 설명 될 수 있는지 측정하는 데 사용되는 통계적 지표입니다. 예측 변수가 결과 변수와 관련이없는 경우에도 더 많은 예측 변수가 MLR 모델에 추가되므로 R 2는 항상 증가합니다.
따라서 R 2 자체는 모델에 포함되어야하는 예측 변수와 제외해야하는 예측 변수를 식별하는 데 사용할 수 없습니다. R 2 는 0과 1 사이 일 수 있으며, 여기서 0은 독립 변수로 결과를 예측할 수 없음을 나타내고 1은 독립 변수에서 오류없이 결과를 예측할 수 있음을 나타냅니다.
다중 회귀 결과를 해석 할 때 베타 계수는 다른 모든 변수를 일정하게 유지하면서 유효합니다 ("모두 동일"). 다중 회귀 분석의 결과는 방정식으로 수평으로 표시되거나 테이블 형식으로 수직으로 표시 될 수 있습니다.
다중 선형 회귀를 사용하는 예
예를 들어, 분석가는 시장의 움직임이 XOM (Exxon Mobil) 가격에 어떤 영향을 미치는지 알고 싶어 할 수 있습니다. 이 경우 그의 선형 방정식은 S & P 500 지수의 값을 독립 변수 또는 예측 변수로, XOM의 가격을 종속 변수로 갖게됩니다.
실제로, 이벤트의 결과를 예측하는 여러 가지 요소가 있습니다. 예를 들어 Exxon Mobil의 가격 변동은 전체 시장의 성능 그 이상에 달려 있습니다. 유가, 금리 및 유가 선물의 가격 변동과 같은 다른 예측 변수는 XOM의 가격과 다른 석유 회사의 주가에 영향을 줄 수 있습니다. 둘 이상의 변수가 존재하는 관계를 이해하기 위해 다중 선형 회귀가 사용됩니다.
MLR (다중 선형 회귀)을 사용하여 여러 랜덤 변수 간의 수학적 관계를 결정합니다. 즉, MLR은 여러 독립 변수가 하나의 종속 변수와 어떻게 관련되어 있는지 검사합니다. 각각의 독립 인자가 종속 변수를 예측하도록 결정되면, 여러 변수에 대한 정보를 사용하여 결과 변수에 미치는 영향 수준에 대한 정확한 예측을 생성 할 수 있습니다. 모델은 모든 개별 데이터 요소에 가장 가까운 직선 (선형) 형태로 관계를 만듭니다.
위의 MLR 방정식을 참조하십시오.
- y i = 종속 변수: XOMx의 가격 i1 = 금리 x i2 = 유가 x i3 = S & P 500 지수 x i4 = 유가 선물의 가격 B 0 = 시간 0의 y 절편 B 1 = 종속의 단위 변화를 측정하는 회귀 계수 x i1이 변할 때 변수-금리가 변할 때 XOM 가격의 변화 B 2 = x i2가 변할 때 종속 변수의 단위 변화를 측정하는 계수 값 – 유가가 변할 때 XOM 가격의 변화
최소 제곱 추정값 B 0, B 1, B 2 … B p 는 일반적으로 통계 소프트웨어에 의해 계산됩니다. 회귀 모델에 많은 변수가 포함될 수 있으므로 각 독립 변수는 숫자 1, 2, 3, 4… p로 구분됩니다. 다중 회귀 모델을 사용하면 분석가가 여러 설명 변수에 제공된 정보를 기반으로 결과를 예측할 수 있습니다.
그러나 각 데이터 요소가 모델에서 예측 한 결과와 약간 다를 수 있으므로 모델이 항상 완벽하게 정확하지는 않습니다. 실제 결과와 예측 결과의 차이 인 잔차 값 E는 이러한 약간의 변동을 설명하기 위해 모델에 포함됩니다.
XOM 가격 회귀 모델을 통계 계산 소프트웨어를 통해 실행한다고 가정하면 다음과 같은 결과가 반환됩니다.
분석가는이 변수를 다른 변수가 일정하게 유지하는 경우 시장의 석유 가격이 1 % 증가하면 XOM 가격이 7.8 % 증가 함을 의미하는 것으로 해석합니다. 이 모델은 또한 XOM 가격이 이자율 1 % 상승에 따라 1.5 % 감소 할 것임을 보여줍니다. R 2 는 Exxon Mobil 주가 변동의 86.5 %가 금리, 유가, 유가 선물 및 S & P 500 지수의 변동으로 설명 될 수 있음을 나타냅니다.
주요 테이크 아웃
- 간단히 다중 회귀 분석이라고도하는 MLR (다중 선형 회귀)은 반응 변수의 결과를 예측하기 위해 여러 설명 변수를 사용하는 통계 기법입니다. 다중 회귀는 하나의 설명 변수를 사용하는 선형 (OLS) 회귀의 확장입니다. MLR은 계량 경제학 및 재무 유추에 광범위하게 사용됩니다.
선형 회귀와 다중 회귀의 차이점
선형 (OLS) 회귀 분석은 일부 설명 변수가 변경된 경우 종속 변수의 반응을 비교합니다. 그러나 종속 변수가 하나의 변수로만 설명되는 경우는 드 rare니다. 이 경우 분석가는 다중 회귀 분석을 사용하여 둘 이상의 독립 변수를 사용하여 종속 변수를 설명하려고 시도합니다. 다중 회귀는 선형 및 비선형 일 수 있습니다.
다중 회귀 분석은 종속 변수와 독립 변수 사이에 선형 관계가 있다고 가정합니다. 또한 독립 변수 사이에 큰 상관 관계가 없다고 가정합니다.