계층화 무작위 샘플링은 모집단을 계층으로 알려진 더 작은 그룹으로 나누는 샘플링 방법입니다. 계층화 된 무작위 샘플링 또는 계층화에서 계층은 구성원의 공유 속성 또는 특성에 따라 형성됩니다. 계층화 된 랜덤 샘플링을 비례 랜덤 샘플링 또는 할당량 랜덤 샘플링이라고도합니다.
대조적으로, 단순 랜덤 샘플링은 모집단에 존재하는 개인의 샘플입니다. 개체는 개체군에서 무작위로 선택되어 샘플에 배치됩니다. 무작위로 개인을 선택하는이 방법은 모집단의 편견없는 표본 크기를 선택하려고합니다. 그러나 모집단의 표본이 광범위하게 변할 때는 유리하지 않습니다.
주요 테이크 아웃
- 계층화 무작위 표본 추출은 계층으로 알려진 더 작은 그룹으로 세분화 된 모집단의 표본을 채취하는 표본 추출 방법입니다. 계층화 무작위 표본 추출은 집단에 비례하여 계층화 된 그룹에서 무작위 표본을 채취하는 것입니다. 이러한 방식으로 계층화 된 랜덤 샘플링이보다 정확한 측정 항목입니다.
계층화 된 랜덤 샘플링 이해
계층화 된 무작위 표본 추출은 모집단을 하위 그룹 또는 계층으로 나누고, 생성 된 각 계층에서 모집단에 비례하여 무작위 표본을 채취합니다. 형성된 각 지층의 부재는 유사한 속성 및 특성을 갖는다. 이 표본 추출 방법은 대상 집단이 이질적인 경우 널리 사용되며 매우 유용합니다. 각 층에서 간단한 무작위 샘플을 채취해야합니다. 예를 들어, 계층화 된 무작위 표본 추출을 사용하여 전국의 학생들의 GPA (Grade Point Averages), 직장에서 초과 근무 시간을 보내는 사람들 및 전 세계의 평균 수명을 샘플링 할 수 있습니다.
계층화 된 랜덤 샘플링의 예
리서치 팀이 미국 전역의 대학생의 GPA를 결정하려고한다고 가정합니다. 리서치 팀은 2 천 1 백만 명의 대학생으로부터 데이터를 수집하는 데 어려움이 있습니다. 4, 000 명의 학생을 사용하여 무작위로 표본을 추출하기로 결정합니다.
이제 팀이 샘플 참가자의 다른 속성을보고 GPA와 학생 전공에 차이가 있는지 궁금해한다고 가정하십시오. 560 명의 학생들이 영어 전공, 1, 135 명이 과학 전공, 800이 컴퓨터 과학 전공, 1, 090이 공학 전공, 415 명이 수학 전공이라고 가정합니다. 팀은 표본의 계층이 모집단의 임의 표본에 비례하는 비례 계층화 된 무작위 표본을 사용하려고합니다.
팀이 미국 대학생의 인구 통계를 조사하고 영어 전공 12 %, 과학 전공 28 %, 컴퓨터 과학 전공 24 %, 공학 전공 21 %, 전공 15 %를 전공 한 학생의 비율을 찾는다고 가정합니다. 수학에서. 따라서 계층화 된 랜덤 샘플링 프로세스에서 5 개의 계층이 생성됩니다.
그런 다음 팀은 모집단의 지층이 표본의 지층에 비례하는지 확인해야합니다. 그러나 비율이 같지 않다는 것을 알게됩니다. 그런 다음 팀은 4, 000 명의 학생을 재 샘플링하고 480 명의 영어, 1, 120 명의 과학, 960 개의 컴퓨터 과학, 840 개의 공학 및 600 명의 수학 학생들을 무작위로 선택해야합니다. 이를 통해 미국에서 학생들의 대학 전공을보다 잘 표현할 수있는 비례 계층화 된 대학생 표본이 있습니다. 그런 다음 연구원들은 특정 지층을 강조 표시하고 미국 대학생의 다양한 연구를 관찰하며 다양한 학년 평균을 관찰 할 수 있습니다.
응용
위에서 사용한 것과 동일한 방법이 선거의 투표, 다양한 인구의 소득 및 전국의 다른 직업에 대한 소득에 적용될 수 있습니다.