제곱의 합은 무엇입니까?
제곱합은 회귀 분석에서 데이터 점의 분산을 결정하는 데 사용되는 통계 기법입니다. 회귀 분석에서 목표는 데이터 계열이 생성 된 방법을 설명하는 데 도움이되는 함수에 데이터 계열을 얼마나 잘 적합시킬 수 있는지 결정하는 것입니다. 제곱합은 데이터에서 가장 적합한 (최소한) 함수를 찾는 수학적 방법으로 사용됩니다.
제곱합의 공식은
의 n 개 항목의 세트 X의 경우: 제곱의 합 = i = 0∑n (Xi−X) 2 여기서: Xi = 세트의 i 번째 항목 X = 세트에있는 모든 항목의 평균 (Xi−X) = 각 항목의 평균과의 편차
제곱합은 변형이라고도합니다.
제곱합은 무엇을 알려줍니까?
제곱의 합은 평균과의 편차를 측정 한 것입니다. 통계에서 평균은 숫자 집합의 평균이며 중앙 경향의 가장 일반적으로 사용되는 척도입니다. 산술 평균은 데이터 세트의 값을 합산하고 값의 수로 나눔으로써 간단히 계산됩니다.
지난 5 일 동안 Microsoft (MSFT)의 종가는 74.01, 74.77, 73.94, 73.61 및 73.40 (미국 달러)이라고 가정합니다. 총 가격의 합은 $ 369.73이며 교과서의 평균 또는 평균 가격은 $ 369.73 / 5 = $ 73.95입니다.
그러나 측정 세트의 평균을 아는 것만으로는 충분하지 않습니다. 때로는 일련의 측정에 얼마나 많은 변화가 있는지 아는 것이 도움이됩니다. 개별 값이 평균과 얼마나 떨어져 있는지는 관측 치나 값이 생성 된 회귀 모형에 얼마나 적합한 지에 대한 통찰력을 제공 할 수 있습니다.
예를 들어, 분석가가 MSFT의 주가가 Apple의 가격 (AAPL)과 함께 움직이는 지 알고 싶다면 1, 2와 같이 특정 기간 동안 두 주식의 프로세스에 대한 관측 세트를 나열 할 수 있습니다. 또는 10 년이고 각 관측치 또는 측정 값이 기록 된 선형 모형을 작성합니다. 두 변수 사이의 관계 (즉, AAPL 가격과 MSFT 가격)가 직선이 아닌 경우 조사해야하는 데이터 세트의 변형이 있습니다.
통계에 따르면, 생성 된 선형 모형의 선이 모든 가치 측정을 통과하지 못하면 주가에서 관찰 된 일부 변동성은 설명 할 수 없습니다. 제곱합은 두 변수 사이에 선형 관계가 존재하는지 여부를 계산하는 데 사용되며 설명 할 수없는 변동성은 잔차 제곱합이라고합니다.
제곱합은 변동 제곱의 합이며, 여기서 변동은 각 개별 값과 평균 간의 분산으로 정의됩니다. 제곱의 합을 결정하기 위해 각 데이터 점과 가장 잘 맞는 선 사이의 거리를 제곱 한 다음 합산합니다. 가장 적합한 선은이 값을 최소화합니다.
제곱의 합을 계산하는 방법
이제 측정이 왜 제곱 편차의 합 또는 짧은 제곱의 합이라고 불리는지를 알 수 있습니다. 위의 MSFT 예제를 사용하여 제곱의 합은 다음과 같이 계산할 수 있습니다.
- SS = (74.01-73.95) 2 + (74.77-73.95) 2 + (73.94-73.95) 2 + (73.61-73.95) 2 + (73.40-73.95) 2 SS = (0.06) 2 + (0.82) 2 + (- 0.01) 2 + (-0.34) 2 + (-0.55) 2 SS = 1.0942
제곱하지 않고 편차 합계 만 추가하면 음수 편차가 양수 편차를 거의 완벽하게 상쇄하기 때문에 숫자가 0에 가까워집니다. 보다 현실적인 숫자를 얻으려면 편차의 합을 제곱해야합니다. 양수이든 음수 든 숫자의 제곱은 항상 양수이므로 제곱의 합은 항상 양수입니다.
제곱합을 사용하는 방법의 예
MSFT 계산 결과를 기반으로, 높은 제곱합은 대부분의 값이 평균에서 멀어 지므로 데이터의 변동성이 크다는 것을 나타냅니다. 제곱합이 낮 으면 관측치 집합의 변동성이 낮습니다.
위의 예에서 1.0942는 지난 5 일 동안 MSFT의 주가 변동이 매우 낮으며 가격 안정성과 낮은 변동성이 특징 인 주식에 투자하려는 투자자가 MSFT를 선택할 수 있음을 보여줍니다.
주요 테이크 아웃
- 제곱합은 평균값에서 벗어난 데이터 포인트의 편차를 측정합니다. 제곱합이 높을수록 데이터 세트 내에서 변동성이 크며 낮은 결과는 데이터가 평균값과 상당히 다른 것을 나타냅니다..
제곱합 사용의 한계
구매할 주식에 대한 투자 결정을하려면 여기에 나열된 것보다 더 많은 관찰이 필요합니다. 분석가는 자산의 변동성이 얼마나 높거나 낮은 지 확실하게 알기 위해 수년간의 데이터로 작업해야 할 수도 있습니다. 더 많은 데이터 포인트가 세트에 추가됨에 따라 값이 더 분산 될수록 제곱합이 커집니다.
가장 널리 사용되는 변동 측정은 표준 편차 및 분산입니다. 그러나 두 메트릭 중 하나를 계산하려면 먼저 제곱합을 계산해야합니다. 분산은 제곱합의 평균 (즉, 제곱합을 관측치 수로 나눈 값)입니다. 표준 편차는 분산의 제곱근입니다.
제곱의 합을 사용하는 회귀 분석 방법에는 선형 최소 제곱 법과 비선형 최소 제곱 법이 있습니다. 최소 제곱 법은 회귀 함수가 실제 데이터 포인트에서 분산의 제곱의 합을 최소화한다는 사실을 나타냅니다. 이러한 방식으로, 데이터에 가장 적합한 통계를 제공하는 함수를 그릴 수 있습니다. 회귀 함수는 선형 (직선) 또는 비선형 (곡선) 일 수 있습니다.