정규 분포 공식은 주어진 데이터 집합의 특성을 정량화하는 두 가지 간단한 매개 변수 (평균 및 표준 편차)를 기반으로합니다. 평균은 전체 데이터 세트의 "중앙"또는 평균값을 나타내지 만 표준 편차는 해당 평균값 주위의 데이터 포인트의 "확산"또는 변형을 나타냅니다.
다음 두 데이터 세트를 고려하십시오.
데이터 세트 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10, 10}
데이터 세트 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}
Dataset1의 경우 평균 = 10이고 표준 편차 (stddev) = 0
Dataset2의 경우 평균 = 10이고 표준 편차 (stddev) = 2.83
DataSet1에 대해 다음 값을 플로팅하겠습니다.
DataSet2와 유사하게:
위의 두 그래프에서 빨간색 가로 선은 각 데이터 집합의 "평균"또는 평균 값을 나타냅니다 (두 경우 모두 10). 두 번째 그래프의 분홍색 화살표는 평균값에서 데이터 값의 확산 또는 변동을 나타냅니다. 이는 DataSet2의 경우 표준 편차 값 2.83으로 표시됩니다. DataSet1의 값은 모두 같고 (각 10 개) 변형이 없으므로 stddev 값은 0이므로 분홍색 화살표가 적용되지 않습니다.
stddev 값은 데이터 분석에 매우 유용한 몇 가지 중요하고 유용한 특성을 가지고 있습니다. 정규 분포의 경우 데이터 값이 평균의 양쪽에 대칭 적으로 분포됩니다. 정규 분포 데이터 세트의 경우 가로 축에 stddev를 사용하여 그래프를 플로팅합니다. 세로축의 데이터 값을 다음과 같이 구합니다.
정규 분포의 속성
- 정규 곡선은 평균에 대해 대칭입니다. 평균은 중간에 있으며 면적을 두 개의 반으로 나눕니다. 곡선 아래의 총 면적은 평균 = 1 및 평균 = 1 인 경우 1과 같습니다. 분포는 평균에 의해 완전히 설명됩니다 그리고 stddev
위의 그래프에서 볼 수 있듯이 stddev는 다음을 나타냅니다.
- 데이터 값의 68.3 % 가 평균 (-1 ~ +1)의 1 표준 편차 내에 있음 데이터 값의 95.4 % 가 평균 (-2 ~ +2)의 2 표준 편차 내에 있음 데이터 값의 99.7 % 가 3 표준 편차 내에 있음 평균의 (-3 ~ +3)
종 모양 곡선 아래의 영역은 측정시 주어진 범위의 원하는 확률을 나타냅니다.
- X 미만: – 예를 들어 데이터 값의 확률 이 X 보다 70 보다 작음 – 예를 들어 X 1 과 X 2 사이 의 데이터 값이 95보다 클 확률 – 예를 들어 65와 85 사이의 데이터 값의 확률
여기서 X는 관심있는 값입니다 (아래 예).
다른 데이터 세트의 평균 및 stddev 값이 다르므로 면적을 플로팅하고 계산하는 것이 항상 편리한 것은 아닙니다. 실제 문제에 대한 쉬운 계산 및 적용을위한 균일 한 표준 방법을 용이하게하기 위해 정규 분포표 의 일부인 Z- 값으로의 표준 변환이 도입되었습니다.
Z = (X – 평균) / stddev. 여기서 X는 랜덤 변수입니다.
기본적으로이 변환은 평균 및 stddev가 각각 0과 1로 표준화되도록하여 정규 분포표 의 표준 정의 된 Z- 값 세트를 쉽게 계산할 수있게합니다. 확률 값을 포함하는 표준 z- 값 테이블의 스냅 샷은 다음과 같습니다.
지 |
0.00 |
0.01 |
0.02 |
0.03 |
0.04 |
0.05 |
0.06 |
0.0 |
0.00000 |
0.00399 |
0.00798 |
0.01197 |
0.01595 |
0.01994 |
… |
0.1 |
0.0398 |
0.04380 |
0.04776 |
0.05172 |
0.05567 |
0.05966 |
… |
0.2 |
0.0793 |
0.08317 |
0.08706 |
0.09095 |
0.09483 |
0.09871 |
… |
0.3 |
0.11791 |
0.12172 |
0.12552 |
0.12930 |
0.13307 |
0.13683 |
… |
0.4 |
0.15542 |
0.15910 |
0.16276 |
0.16640 |
0.17003 |
0.17364 |
… |
0.5 |
0.19146 |
0.19497 |
0.19847 |
0.20194 |
0.20540 |
0.20884 |
… |
0.6 |
0.22575 |
0.22907 |
0.23237 |
0.23565 |
0.23891 |
0.24215 |
… |
0.7 |
0.25804 |
0.26115 |
0.26424 |
0.26730 |
0.27035 |
0.27337 |
… |
… |
… |
… |
… |
… |
… |
… |
… |
z- 값 0.239865와 관련된 확률을 찾으려면 먼저 소수점 2 자리 (0.24)로 반올림하십시오. 그런 다음 행에서 처음 두 유효 숫자 (0.2)와 열에서 최소 유효 숫자 (남은 0.04)를 확인하십시오. 0.09483의 가치로 이어질 것입니다.
확률값에 대해 소수점 이하 5 자리까지의 정밀도 (음수 값에 대한 소수점 포함)까지 전체 정규 분포표를 찾을 수 있습니다.
실제 사례를 보자. 큰 그룹의 개인의 키는 정규 분포 패턴을 따릅니다. 키가 기록되고 평균과 표준 편차가 각각 66 인치와 6 인치로 계산되는 100 명의 개인 세트가 있다고 가정합니다.
다음은 z- 값 표를 사용하여 쉽게 대답 할 수있는 몇 가지 샘플 질문입니다.
- 그룹의 사람이 70 인치 이하일 확률은 얼마입니까?
문제는 P (X <= 70) 의 누적 값, 즉 100의 전체 데이터 세트에서 0과 70 사이의 값 수를 찾는 것입니다.
먼저 X- 값 70을 동등한 Z- 값으로 변환 해 봅시다.
Z = (X – 평균) / stddev = (70-66) / 6 = 4/6 = 0.66667 = 0.67 (소수점 이하 2 자리)
이제 P (Z <= 0.67) = 0을 찾아야합니다. 24857 (위의 z- 테이블에서)
즉, 그룹의 개인이 70 인치 이하일 확률은 24.857 %입니다.
그러나 잠깐만 – 위의 내용이 불완전합니다. 우리는 70까지의 모든 가능한 높이, 즉 0에서 70까지의 확률을 찾고 있음을 기억하십시오. 위의 내용은 평균에서 원하는 값까지의 부분을 제공합니다 (예: 66에서 70). 정답에 도달하려면 나머지 절반 (0에서 66까지)을 포함해야합니다.
0에서 66까지는 절반 부분 (즉, 1 개의 극단에서 중간 평균까지)을 나타내므로 확률은 단순히 0.5입니다.
따라서 사람이 70 인치 이하일 확률은 0.24857 + 0.5 = 0입니다. 74857 = 74.857 %
면적을 계산하여 그래픽으로 표시하면 솔루션을 나타내는 두 개의 합된 영역이 있습니다.
- 사람이 75 인치 이상일 확률은 얼마입니까?
즉, 보완 누적 P (X> = 75)를 찾습니다.
Z = (X – 평균) / stddev = (75-66) / 6 = 9/6 = 1.5
P (Z> = 1.5) = 1- P (Z <= 1.5) = 1 – (0.5 + 0.43319) = 0.06681 = 6.681 %
- 사람이 52 인치에서 67 인치 사이에있을 확률은 얼마입니까?
P (52 <= X <= 67)를 찾으십시오.
P (52 <= X <= 67) = P = P (-2.33 <= Z <= 0.17)
= P (Z <= 0.17) –P (Z <= -0.233) = (0.5 + 0.56749)-(.40905) =
이 정규 분포표 (및 z- 값)는 일반적으로 주식 및 지수에 대한 주식 시장의 예상 가격 변동에 대한 확률 계산에 사용됩니다. 범위 기반 거래, 상승 추세 또는 하락 추세, 지지 또는 저항 수준 및 평균 및 표준 편차의 정규 분포 개념을 기반으로하는 기타 기술 지표를 식별하는 데 사용됩니다.
투자 계정 비교 ×이 표에 표시되는 오퍼는 Investopedia가 보상을받는 파트너 관계에서 얻은 것입니다. 공급자 이름 설명관련 기사
거래 기본 교육
금융 가설 테스트: 개념 및 예
위기 관리
정규 분포를 사용하여 포트폴리오 최적화
기술 분석 기본 교육
시간과 가격의 선형 회귀
위기 관리
변동성의 사용과 한계
재무 분석
Excel에서 VaR (Value at Risk)을 계산하는 방법
기본 분석 도구