분산은 데이터 세트의 숫자 간 산포의 측정입니다. 분산은 집합의 각 숫자가 평균에서 얼마나 떨어져 있는지 측정합니다.
데이터 세트 차트를 사용하여 다양한 데이터 포인트 또는 숫자의 선형 관계가 무엇인지 관찰 할 수 있습니다. 우리는 회귀 라인을 그려서 라인 자체에서 개별 데이터 포인트의 거리를 최소화하려고 시도합니다. 아래 차트에서 데이터 점은 파란색 점이고 주황색 선은 회귀선이며 빨간색 화살표는 관측 된 데이터와 회귀선으로부터의 거리입니다.
Julie Bang의 사진 © Investopedia 2020
분산을 계산할 때 이러한 모든 데이터 포인트의 관계를 고려하여 다음 데이터 포인트에서 얼마나 많은 거리를 기대합니까? 이 "거리"를 오차 항이라고하며, 분산이 측정하는 것입니다.
분산 자체는 단위가 없기 때문에 종종 유용하지 않으므로 측정 및 비교하기가 어렵습니다. 그러나 분산의 제곱근은 표준 편차이며 이는 측정에 실용적입니다.
Excel에서 분산 계산
데이터 세트가 소프트웨어에 이미 입력되어 있으면 Excel에서 분산을 쉽게 계산할 수 있습니다. 아래 예에서는 S & P 500에 투자하는 SPY라는 인기있는 ETF (exchange-traded fund)에서 일일 수익의 20 일 차이를 계산합니다.
- 공식은 = VAR.S (데이터 선택)입니다.
VAR.P (제공되는 또 다른 공식)가 아닌 VAR.S를 사용하려는 이유는 종종 측정 할 전체 데이터 집단이 없기 때문입니다. 예를 들어, 테이블에 SPY ETF 기록이 모두 반환 된 경우 모집단 측정 VAR.P를 사용할 수 있지만 개념을 설명하기 위해 지난 20 일만 측정하므로 VAR.S를 사용합니다.
보시다시피 계산 된 분산 값.000018674는 데이터 세트 자체에 대해서는 거의 알려주지 않습니다. 표준 수익률 편차를 얻기 위해 그 값을 제곱근으로 갔다면 더 유용 할 것입니다.