체계적인 샘플링이란?
체계적인 샘플링은 확률이 높은 샘플링 방법으로, 더 큰 모집단의 표본 멤버가 임의의 시작점에 따라 고정 된주기 간격으로 선택됩니다. 샘플링 간격이라고하는이 간격은 모집단 크기를 원하는 샘플 크기로 나누어 계산합니다.
샘플 모집단이 미리 선택되어 있지만, 주기적인 간격이 미리 결정되고 시작점이 임의 인 경우, 체계적인 샘플링은 여전히 임의 인 것으로 생각됩니다.
통계적 추론을 위해 모집단을 샘플링하는 몇 가지 방법이 있습니다. 체계적인 샘플링은 무작위 샘플링의 한 형태입니다.
체계적인 샘플링
체계적인 샘플링 작동 방식
모집단의 간단한 무작위 표본 추출은 비효율적이고 시간 소모적 일 수 있으므로 통계학자는 체계적인 표본 추출과 같은 다른 방법을 사용합니다. 체계적인 접근 방식을 통해 샘플 크기를 신속하게 선택할 수 있습니다. 고정 된 시작점이 식별되면 참가자 선택을 용이하게하기 위해 일정한 간격이 선택됩니다.
데이터 조작의 위험이 낮은 경우 간단한 무작위 샘플링보다 체계적인 샘플링이 바람직합니다. 연구원이 원하는 결과를 얻기 위해 간격 길이를 조작 할 수있을 때 이러한 위험이 높으면 간단한 무작위 샘플링 기술이 더 적합합니다.
체계적인 샘플링은 단순성으로 인해 연구원 및 분석가에게 인기가 있습니다. 연구자들은 일반적으로 모든 " n 번째"데이터 샘플에 대해 임의의 특성이 불균형 적으로 존재하지 않는 한 그 결과가 대부분의 정규 모집단을 대표한다고 가정합니다. 다시 말해, 모집단은 선택한 측정 항목을 따라 자연스럽게 임의의 정도를 나타내야합니다. 모집단에 표준화 된 패턴 유형이있는 경우 실수로 매우 일반적인 사례를 선택할 위험이 더 분명합니다.
다른 샘플링 방법과 마찬가지로 체계적인 샘플링 내에서 참가자를 선택하기 전에 대상 모집단을 선택해야합니다. 모집단은 수행되는 연구의 목적에 적합한 원하는 수의 특성에 기초하여 식별 될 수 있습니다. 일부 선택 기준에는 연령, 성별, 인종, 위치, 교육 수준 및 / 또는 직업이 포함될 수 있습니다.
- 체계적인 샘플링은 확률이 높은 샘플링 방법으로, 임의의 시작 지점에 따라 일정주기 간격 (샘플링 간격)으로 고정 된 표본 모집단을 선택합니다. 단순성으로 인해 체계적인 샘플링이 연구원들에게 인기가 있습니다. 이 방법론의 다른 장점은 군집 선택 현상을 제거하고 데이터를 오염시킬 가능성이 낮다는 것입니다. 단점은 특정 패턴을 과도하거나 과소 표현하고 데이터 조작의 위험이 크다는 점입니다.
체계적인 샘플링의 예
체계적인 표본 추출의 가설 적 예로서, 통계학자는 10, 000 명의 인구에서 100 번째 사람마다 표본 추출을 선택한다고 가정합니다. 12 시간마다 채취 할 새 샘플을 선택하는 등 샘플링 간격도 체계적 일 수 있습니다.
또 다른 예로, 체계적인 샘플링을 사용하여 50, 000 명의 인구에서 1, 000 명의 무작위 그룹을 선택하려면 모든 잠재적 참가자를 목록에 배치하고 시작 지점을 선택해야합니다. 목록이 구성되면 50, 000 / 1, 000 = 50부터 목록의 모든 50 번째 사람 (선택한 시작 지점에서 시작)이 참가자로 선택됩니다.
예를 들어, 선택된 시작점이 20 인 경우 목록에서 70 번째 사람이 120 번째 등으로 선택됩니다. 목록의 끝에 도달하고 추가 참가자가 필요한 경우, 카운트는 목록의 시작 부분으로 반복되어 카운트를 완료합니다.
클러스터 샘플링과 체계적인 샘플링
체계적인 샘플링과 클러스터 샘플링은 샘플에 포함 된 모집단에서 샘플 포인트를 가져 오는 방식이 다릅니다. 군집 표본 추출은 모집단을 군집으로 분류하는 반면, 체계적 표본 추출은 대량 모집단의 고정 된 간격을 사용하여 표본을 생성합니다.
체계적인 표본 추출은 모집단에서 임의의 시작점을 선택한 다음 크기에 따라 모집단의 일정한 고정 간격에서 표본을 추출합니다. 군집 샘플링은 모집단을 군집으로 나누고 각 군집에서 간단한 무작위 표본을 가져옵니다.
클러스터 샘플링은 다른 샘플링 방법보다 정확도가 떨어집니다. 그러나 샘플을 얻는 데 드는 비용을 절약 할 수 있습니다. 클러스터 샘플링은 2 단계 샘플링 절차입니다. 전체 모집단 목록을 작성하는 것이 어려울 때 사용할 수 있습니다. 예를 들어, 식료품 점의 고객 전체를 인터뷰하기 위해 전체 인구를 구성하는 것은 어려울 수 있습니다.
그러나 프로세스의 첫 번째 단계 인 임의의 상점 서브 세트를 작성할 수 있습니다. 두 번째 단계는 해당 상점 고객의 무작위 샘플을 인터뷰하는 것입니다. 이것은 시간과 비용을 절약 할 수있는 간단한 수동 프로세스입니다.
체계적인 샘플링의 한계
체계적인 샘플링을 수행 할 때 통계학자가 고려해야 할 한 가지 위험은 샘플링 간격과 함께 사용 된 목록이 구성되는 방법과 관련이 있습니다. 목록에 배치 된 모집단이 샘플링 간격과 일치하는 주기적 패턴으로 구성된 경우 선택한 샘플이 바이어스 될 수 있습니다.
예를 들어, 회사의 인사 부서는 직원 샘플을 선택하여 회사 정책에 대한 느낌을 묻기를 원합니다. 직원은 20 명의 팀으로 그룹화되며 각 팀은 관리자가 이끈다. 표본 크기를 선택하는 데 사용 된 목록이 팀으로 묶여 구성된 경우 통계학자는 표본 추출 간격에 따라 관리자 만 (또는 전혀 관리자 없음) 선택하는 위험이 있습니다.