샘플이란 무엇입니까?
샘플은 더 큰 그룹의 작고 관리 가능한 버전을 나타냅니다. 더 많은 인구의 특성을 포함하는 하위 집합입니다. 모집단 크기가 너무 커서 검정에 가능한 모든 구성원 또는 관측치를 포함 할 수없는 경우 통계 검정에 표본이 사용됩니다. 표본은 모집단을 전체적으로 나타내야하며 특정 속성에 대한 편견을 반영하지 않아야합니다.
주요 테이크 아웃
- 표본은 더 큰 그룹 또는 더 많은 집단의 하위 집단을 관리 할 수있는 더 작고 관리 가능한 버전을 의미합니다. 샘플을 사용하면 연구자가 쉽고시기 적절하게 연구를 수행 할 수 있습니다. 단순 랜덤 샘플링에서는 모집단의 모든 개체가 동일하지만 계층화 된 랜덤 샘플링은 전체 모집단을 작은 그룹으로 나눕니다.
샘플 이해
표본은 모집단에서 가져온 편견없는 수의 관측치입니다. 기본적으로 모집단은 주어진 주제의 개인, 동물, 항목, 관찰, 데이터 등의 총 수입니다. 즉, 표본은 전체 그룹의 일부, 일부 또는 부분이며 모집단의 하위 집합으로 작용합니다. 샘플은 연구가 수행되는 다양한 환경에서 사용됩니다. 과학자, 마케팅 담당자, 정부 기관, 경제학자 및 연구 그룹은 연구 및 측정에 샘플을 사용하는 사람들 중 하나입니다.
연구에 전체 모집단을 사용하면 문제가 발생하기 때문에 샘플이 사용됩니다. 연구자들은 전체 인구에 즉시 접근하는 데 문제가있을 수 있습니다. 또한 일부 연구의 특성상 연구자들은 적시에 필요한 결과를 얻는 데 어려움을 겪을 수 있습니다. 이것이 연구를하는 사람들이 샘플을 사용하는 이유입니다. 전체 인구를 대표하는 소수의 사람들을 사용하면 시간과 자원을 줄이면서도 유효한 결과를 얻을 수 있습니다.
연구원들이 사용한 샘플은 인구와 매우 유사해야합니다. 샘플의 모든 참가자는 동일한 특성과 특성을 공유해야합니다. 따라서, 연구가 남성 대학 신입생에 관한 것이라면, 표본은이 설명에 맞는 남성의 비율이 적어야합니다. 마찬가지로, 연구 그룹이 50 세 이상의 미혼 여성의 수면 패턴에 대한 연구를 수행하는 경우, 표본에는이 인구 통계 내의 여성 만 포함되어야합니다.
CFA 시험을 위해 40 시간 미만 동안 공부 한 학생들이 몇 명인지 알고 싶어하는 학계 연구팀을 생각해보십시오. 매년 전 세계적으로 20 만 명이 넘는 사람들이 시험을 치르기 때문에 모든 시험 참가자에게 연락하는 것은 매우 지루하고 시간 소모적 일 수 있습니다. 실제로 모집단의 데이터가 수집 및 분석 될 때까지 2 년이 지났으므로 새로운 모집단이 등장한 이후 분석이 가치가 없게되었습니다. 연구원이 대신 할 수있는 일은 모집단 표본을 취하여이 표본에서 데이터를 얻는 것입니다.
편견이없는 표본을 얻으려면 모집단의 모든 사람이 그룹에 추가 될 수있는 동일한 기회를 갖도록 선택 항목이 무작위 여야합니다.
편견이없는 표본을 달성하기 위해서는 모집단의 모든 사람이 표본 그룹에 동등하게 추가 될 가능성이 있도록 선택이 무작위로 이루어져야합니다. 이것은 추첨 추첨과 유사하며 간단한 무작위 샘플링의 기초입니다.
샘플링의 종류
간단한 랜덤 샘플링
모집단의 모든 엔터티가 동일한 경우 간단한 랜덤 샘플링이 이상적입니다. 연구원이 표본 대상이 모두 남성인지 여성인지 또는 어떤 형태로든 남녀의 조합인지 상관하지 않으면 간단한 무작위 샘플링이 좋은 선택 기법이 될 수 있습니다.
2016 년에 CFA 시험에 응시 한 20 만 명의 시험 응시자가 있었는데 그 중 40 %가 여성이고 60 %가 남성이었습니다. 따라서 모집단에서 추출한 무작위 표본에는 400 명의 여성과 600 명의 남성이 총 1, 000 명의 시험 요원이 있어야합니다.
그러나 40 시간 미만 동안 공부 한 후 시험을 통과 한 남성 대 여성의 비율을 아는 것이 중요한 경우는 어떻습니까? 여기서, 계층화 된 랜덤 샘플이 단순한 랜덤 샘플보다 바람직 할 것이다.
계층화 된 무작위 샘플링
비례 랜덤 샘플링 또는 할당량 랜덤 샘플링이라고도하는이 유형의 샘플링은 전체 모집단을 더 작은 그룹으로 나눕니다. 이것을 지층이라고합니다. 지층 내의 사람들은 비슷한 특성을 공유합니다.
나이가 연구원들이 데이터에 포함시키고 자하는 중요한 요소라면 어떨까요? 계층화 된 랜덤 샘플링 기술을 사용하여 각 연령 그룹에 대한 계층 또는 계층을 만들 수 있습니다. 각 계층에서 선택은 무작위로 이루어져야 괄호 안의 모든 사람이 표본에 포함될 가능성이 있습니다. 예를 들어 Alex와 David의 두 참가자는 각각 22 세와 24 세입니다. 샘플 선택은 일부 우선 메커니즘에 따라 다른 것을 선택할 수 없습니다. 두 그룹 모두 연령대에서 선택 될 기회가 동일해야합니다. 지층은 다음과 같이 보일 수 있습니다.
스트라타 (나이) | 인구수 | 샘플에 포함되는 숫자 |
20-24 | 30, 000 | 150 |
25-29 | 70, 000 | 350 |
30-34 | 40, 000 | 200 |
35-39 | 30, 000 | 150 |
40-44 | 20, 000 | 100 |
> 44 | 10, 000 | 50 |
합계 | 200, 000 | 1, 000 |
표에서 인구는 연령 그룹으로 나뉩니다. 예를 들어, 20 세에서 24 세 사이의 30, 000 명이 2016 년에 CFA 시험에 응시했습니다. 동일한 비율을 사용하여 샘플 그룹은이 그룹에 속하는 (30, 000 ÷ 200, 000) x 1, 000 = 150 개의 테스트 타커를 갖게됩니다. 150 명의 무작위 시험 참가자 중에 Alex 또는 David 또는 둘 다 또는 둘 다 포함되지 않을 수 있습니다.
표본 크기를 결정할 때 컴파일 할 수있는 계층이 더 많습니다. 일부 연구자들은 샘플 작성 방법을 결정할 때 시험의 직무, 국가, 결혼 여부 등을 채울 수 있습니다.
샘플의 예
2017 년 현재 전 세계 인구는 75 억 명으로 이중 49.6 %가 여성, 50.4 %가 남성입니다. 특정 국가의 총 인원 수는 인구 규모 일 수도 있습니다. 도시의 총 학생 수는 인구로 간주 할 수 있으며 도시의 총 개 수는 인구 규모입니다. 연구 목적으로이 모집단에서 샘플을 채취 할 수 있습니다.
CFA 시험 사례에 따르면 연구원들은 총 20 만 명의 시험 응시자 (인구)로부터 1, 000 명의 CFA 참가자 샘플을 채취하여이 수치에 대한 필수 데이터를 실행할 수 있습니다. 이 샘플의 평균은 40 시간 미만 동안 만 공부했지만 통과 한 CFA 시험 응시자의 평균을 추정하기 위해 취해집니다.
채취 한 샘플 그룹은 치우 치지 않아야합니다. 즉, 1, 000 명의 CFA 시험 참가자의 표본 평균이 50 인 경우 200, 000 명의 시험 응시자의 모집단 평균도 약 50이어야합니다.
투자 계정 비교 ×이 표에 표시된 오퍼는 Investopedia가 보상을받는 파트너 관계에서 제공됩니다. 공급자 이름 설명관련 용어
계층화 된 랜덤 샘플링으로 읽기 계층화 된 랜덤 샘플링은 모집단을 계층으로 알려진 더 작은 그룹으로 나누는 샘플링 방법입니다. more 단순 랜덤 샘플의 작동 방식 단순 랜덤 샘플은 서브 세트의 각 멤버가 선택 될 확률이 동일한 통계 모집단의 서브 세트입니다. 간단한 무작위 표본은 그룹을 편견없이 표현하기위한 것입니다. more Sampling Definition (샘플링 정의) 샘플링 (Sampling)은 통계 분석에 사용되는 프로세스로, 많은 집단에서 관측치 그룹을 추출합니다. more 대표 표본은 종종 더 넓은 감정을 추정하는 데 사용됩니다. 대표 표본은 전체 모집단의 특성을 반영하는 모집단의 하위 집합입니다. Z- 검정 정의 z- 검정은 분산을 알고 표본 크기가 클 때 두 모집단 평균이 다른지 여부를 확인하는 데 사용되는 통계 검정입니다. 사망률이란 무엇입니까? 사망률 표는 선택된 시간 간격 동안 또는 출생에서 특정 연령으로 생존하는 동안 정해진 인구 집단에서 발생하는 사망률을 보여줍니다. 더 많은 파트너 링크관련 기사
재무 분석
계층화 된 랜덤 샘플링 작동 방식
마케팅 요점
단순 랜덤 대 계층화 된 랜덤 샘플: 차이점은 무엇입니까?
재무 분석
계층화 된 무작위 샘플링의 장단점
경제학
대표 표본과 무작위 표본: 차이점은 무엇입니까?
경제학
간단한 랜덤 샘플: 장점과 단점
경제학