사 분위수 란 무엇입니까?
사 분위수는 데이터 값과 전체 관측치 세트와 비교하는 방법에 따라 관측치를 4 개의 정의 된 간격으로 나누는 것을 나타내는 통계 용어입니다.
사분면 이해
사 분위를 이해하려면 중앙 경향의 척도 인 중앙값을 이해하는 것이 중요합니다. 통계의 중앙값은 숫자 집합의 중간 값입니다. 데이터의 정확히 절반이 중심 값 아래와 위에있는 지점입니다.
따라서 13 개의 숫자가 주어지면 중앙값은 7 번째 숫자가됩니다. 이 값 앞에있는 6 개의 숫자는 데이터에서 가장 낮은 숫자이고 중앙값 뒤의 6 개의 숫자는 주어진 데이터 세트에서 가장 높은 숫자입니다. 중앙값은 분포의 극단 값 또는 특이 치에 의해 영향을받지 않으므로 때로는 평균보다 선호됩니다.
중앙값은 강력한 위치 추정기이지만 값의 양쪽에있는 데이터가 어떻게 퍼지거나 분산되는지에 대해서는 아무 것도 말하지 않습니다. 그것이 사 분위가 들어가는 곳입니다. 사 분위는 분포를 4 개의 그룹으로 나누어 평균의 위와 아래에있는 값의 확산을 측정합니다.
주요 테이크 아웃
- 사 분위수는 분포를 4 개의 그룹으로 나누어 평균 위와 아래의 값 확산을 측정합니다. 사 분위수는 데이터를 3 개 지점 (하위 사 분위수, 중앙값 및 상위 사 분위수)으로 나누어 4 개의 데이터 세트 그룹을 형성합니다. 사 분위수 범위를 계산하기 위해, 중앙값 주위의 변동성의 척도입니다.
Quartiles 작동 방식
중앙값이 측정 값의 50 %가 중간 값 아래에 있고 50 %가 그 위에 놓 이도록 데이터를 반으로 나누는 것처럼, 사 분위수는 데이터를 1/4로 나누어 25 %의 측정 값이 하위 사 분위수보다 작습니다. %는 평균보다 작고 75 %는 상위 사 분위수보다 작습니다.
사 분위수는 데이터를 4 개의 그룹으로 구성하기 위해 하위 사 분위수, 중앙값 및 상위 사 분위수의 3 개 지점으로 데이터를 나눕니다. 하위 사 분위수 또는 첫 번째 사 분위수는 Q1으로 표시되며 데이터 세트의 가장 작은 값과 중간 값 사이의 중간 숫자입니다. 두 번째 사 분위수 인 Q2도 중앙값입니다. Q3으로 표시되는 상위 사 분위수 또는 제 3 사 분위수는 분포의 중앙값과 최대 수 사이에있는 중심점입니다.
이제 사 분위수로 구성된 4 개의 그룹을 매핑 할 수 있습니다. 첫 번째 값 그룹에는 Q1까지 가장 작은 숫자가 포함됩니다. 제 2 그룹은 중앙값에 대한 Q1을 포함하고; 세 번째 세트는 Q3의 중앙값입니다. 제 4 카테고리는 Q3 내지 전체 세트의 최고 데이터 포인트로 구성된다.
각 사 분위수에는 총 관측치의 25 %가 포함됩니다. 일반적으로 데이터는 최소에서 최대로 배열됩니다.
- 첫 번째 사 분위수: 숫자의 가장 낮은 25 % 두 번째 사 분위수: 25.1 %와 50 % 사이 (중위값까지) 세 번째 사 분위수: 51 % ~ 75 % (중위값 위) 네 번째 사 분위수: 숫자의 가장 높은 25 %
사 분위수 예
예를 들어 보자. 오름차순으로 19 명의 학생으로 구성된 수학 점수의 분포는 다음과 같습니다.
59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84, 87, 90, 95, 98
먼저, 중앙값 Q2를 표시하십시오 (이 경우 10 번째 값: 75).
Q1은 가장 작은 점수와 중앙값 사이의 중심점입니다. 이 경우 Q1은 첫 번째와 다섯 번째 점수 인 68 사이에 해당합니다.
Q3는 Q2와 최고 점수 84 사이의 중간 값입니다..
이제 사 분위수가 있으므로 숫자를 해석해 봅시다. 68 점 (Q1)은 첫 번째 사 분위수를 나타내며 25 번째 백분위 수입니다. 68은 사용 가능한 데이터에 설정된 점수의 하반부의 중간 값, 즉 59에서 75의 점수의 중간 값입니다.
Q1은 점수의 25 %가 68보다 작고 클래스 점수의 75 %가 더 크다고 말합니다. Q2 (중앙값)는 50 번째 백분위 수이며 점수의 50 %가 75보다 작고 점수의 50 %가 75를 넘습니다. 마지막으로 75 번째 백분위 수 인 Q3는 점수의 25 %가 보다 크고 75 %는 84보다 작습니다.
특별 고려 사항
Q1에 대한 데이터 포인트가 Q3이 중앙값보다 멀리있는 중앙값보다 먼 경우 더 큰 값보다 작은 데이터 세트 값 사이에 더 큰 분산이 있다고 말할 수 있습니다. Q1이 중앙값보다 Q2보다 Q2에서 더 멀면 동일한 논리가 적용됩니다.
또는 짝수 개의 데이터 포인트가있는 경우 중간 값은 중간 두 숫자의 평균이됩니다. 위의 예에서, 19 대신 20 명의 학생이있는 경우, 점수의 중앙값은 10 번째와 11 번째 숫자의 산술 평균이됩니다.
사 분위수는 사 분위수 범위를 계산하는 데 사용되며, 이는 중앙값 주위의 변동성의 척도입니다. 사 분위 간 범위는 단순히 1 사분 위와 3 사 분위의 차이 Q3 – Q1로 간단히 계산됩니다. 실제로, 데이터의 분산 정도를 나타내는 데이터의 중간 절반 범위입니다.
큰 데이터 세트의 경우 Microsoft Excel에는 사 분위수를 계산하는 QUARTILE 함수가 있습니다.