샘플링 분포 란?
샘플링 분포는 특정 모집단에서 추출한 많은 수의 샘플을 통해 얻은 통계량의 확률 분포입니다. 주어진 모집단의 샘플링 분포는 모집단 통계량에 대해 발생할 수있는 다양한 결과 범위의 빈도 분포입니다.
샘플링 분포 이해
학자, 통계 학자, 연구원, 마케팅 담당자, 분석가 등이 수집하고 사용하는 많은 데이터는 실제로 모집단이 아니라 표본입니다. 표본은 모집단의 부분 집합입니다. 예를 들어, 1995 년에서 2005 년까지 북미에서 태어난 모든 아기의 평균 체중을 같은 기간 내에 남아메리카에서 태어난 아기의 평균 체중을 비교하고자하는 의료 연구원은 합당한 시간 내에 전체 인구에 대한 데이터를 얻을 수 없습니다. 10 년 동안 발생한 백만 명 이상의 출산. 그는 대신 각 대륙에서 100 명의 아기 무게 만 사용하여 결론을 내릴 것입니다. 사용 된 200 명의 아기의 체중이 표본이고 계산 된 평균 체중이 표본 평균입니다.
이제 각 대륙에서 100 개의 신생아 체중으로 단 하나의 표본을 채취하는 대신에, 의료 연구원은 일반 모집단에서 반복 된 무작위 표본을 취하여 각 표본 그룹의 표본 평균을 계산한다고 가정합니다. 따라서 북미 지역의 경우 미국, 캐나다 및 멕시코에 기록 된 100 개의 신생아 체중에 대한 데이터를 다음과 같이 가져옵니다. 미국의 일부 병원에서 100 개의 샘플 4 개, 캐나다에서 70 개의 샘플 5 개, 멕시코에서 150 개의 레코드 총 3 개 12 개의 세트로 분류 된 1200 개의 체중의 신생아. 또한 남미의 12 개국에서 100 개의 출생 체중에 대한 표본 데이터를 수집합니다.
각 샘플에는 고유 한 샘플 평균이 있으며 샘플 평균의 분포를 샘플 분포라고합니다.
각 표본 집합에 대해 계산 된 평균 가중치는 평균의 표본 분포입니다. 표본에서 평균 만 계산할 수있는 것은 아닙니다. 표준 편차, 분산, 비율 및 범위와 같은 다른 통계는 샘플 데이터에서 계산할 수 있습니다. 표준 편차 및 분산은 샘플링 분포의 변동성을 측정합니다.
모집단의 관측치 수, 표본의 관측치 수 및 표본 집합을 그리는 데 사용되는 절차에 따라 표본 분포의 변동성이 결정됩니다. 샘플링 분포의 표준 편차를 표준 오차라고합니다. 표본 분포의 평균은 모집단의 평균과 같지만 표준 오차는 모집단의 표준 편차, 모집단의 크기 및 표본의 크기에 따라 다릅니다.
각 표본 집합의 평균이 서로 얼마나 떨어져 있고 모집단 평균에서 얼마나 멀리 퍼져 있는지 알면 표본 평균이 모집단 평균에 얼마나 가까운 지 알 수 있습니다. 표본 크기가 증가하면 표본 분포의 표준 오차가 줄어 듭니다.
특별 고려 사항
모집단 또는 하나의 표본 세트는 정규 분포를 갖습니다. 그러나 샘플링 분포에는 여러 세트의 관측치가 포함되므로 종 모양이 반드시 필요한 것은 아닙니다.
이 예에 따르면 북미와 남미의 아기의 평균 체중은 정규 분포를 갖습니다. 일부 아기는 저체중 (평균 이하) 또는 과체중 (평균 이상)이며 대부분의 아기는 중간에 있습니다 (평균 주위)). 북미에서 신생아의 평균 체중이 7 파운드 인 경우 북미에 대해 기록 된 12 개의 샘플 관측치 각각의 샘플 평균 중량은 7 파운드에 가깝습니다.
그러나 각 1, 200 개의 표본 그룹에서 계산 된 각 평균을 그래프로 표시하면 결과 모양이 균일하게 분포 될 수 있지만 실제 모양이 어떻게 될지 확실하게 예측하기는 어렵습니다. 연구원이 백만이 넘는 체중의 모집단에서 사용하는 표본이 많을수록 그래프가 정규 분포를 형성하기 시작합니다.
- 표본 분포는 특정 모집단에서 추출한 많은 수의 표본을 통해 얻은 통계량의 확률 분포입니다. 주어진 모집단의 표본 분포 분포는 통계량에 대해 발생할 수있는 다양한 결과 범위의 빈도 분포입니다. 학자, 통계 학자, 연구자, 마케팅 담당자 및 분석가가 수집하고 사용하는 많은 데이터는 실제로 인구가 아닌 표본입니다.
