Winsorized 의미는 무엇입니까?
Winsorized 평균은 가장 작은 값과 가장 큰 값을 가장 가까운 관측 값으로 대체하는 평균화 방법입니다. 이는 계산에서 비정상 극값 또는 특이 치의 영향을 제한하기 위해 수행됩니다. 값을 교체 한 후 산술 평균 공식을 사용하여 winsorized 평균을 계산합니다.
Winsorized 평균의 공식은
의 Winsorized Mean = Nxn… xn + 1 + xn + 2… xn
Winsorized 평균은 두 가지 방식으로 표현됩니다. "k n "winsorized 평균은 'k'가 가장 작고 큰 관측치의 대체를 의미하며, 여기서 'k'는 정수입니다. "X %"winsorized 평균은 데이터의 양쪽 끝에서 주어진 백분율의 값을 바꾸는 것을 포함합니다.
Winsorized 평균을 계산하는 방법
winsorized 평균은 가장 작은 데이터 포인트와 가장 큰 데이터 포인트를 교체 한 다음 모든 데이터 포인트를 합산하고 합계를 총 데이터 포인트 수로 나누어 계산합니다.
Winsorized는 무엇을 의미합니까?
winsorized 평균은 덜 극단적 인 값으로 대체 할 수 있기 때문에 특이 치에 덜 민감합니다. 즉, 평균 대 윤곽선을 사용하는 것이 쉽지 않습니다. 그러나 분포에 팻 테일이있는 경우 분포에서 가장 높은 값과 가장 낮은 값을 제거하는 효과는 분포 수치의 변동성이 많기 때문에 거의 영향을 미치지 않습니다.
주요 테이크 아웃
- 가장 작은 값과 가장 큰 값을 가장 가까운 관측 값으로 대체하는 평균화 방법. 덜 극단적 인 값으로 대체 할 수 있기 때문에 특이 치에 민감하지 않습니다. 두 점의 결과에도 불구하고 데이터 포인트를 제거하는 트림 된 평균과는 다릅니다. 가까운 경향이 있습니다.
Winsorized Mean을 사용하는 방법의 예
1, 5, 7, 8, 9, 10, 14 데이터 세트에 대해 winsorized 평균을 계산할 수 있습니다.이 예에서는 winsorized 평균이 첫 번째 순서라고 가정하고 가장 작은 값과 가장 큰 값을 가장 가까운 관측치.
이제 데이터 세트가 5, 5, 7, 8, 9, 10, 10과 같이 나타납니다. 새 세트의 산술 평균을 취하면 평균 7.7 또는 (5 + 5 + 7 + 8 + 9 + 10 + 10)을 7로 나눈 값입니다.
또는 상위 10 %와 하위 10 %를 취하여 다음으로 가장 가까운 값으로 대체하는 20 %의 winsorized 평균을 고려하십시오. 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75 데이터 세트를 winsorize합니다. 가장 작고 가장 큰 데이터 포인트 인 10 %가 다음으로 가장 가까운 값으로 대체됩니다. 따라서 새 데이터 세트는 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61입니다. 평균은 33.9 또는 총 데이터 (678)를 총 데이터 포인트 수 (20)로 나눈 값입니다.
Winsorized 평균과 Trimed 평균의 차이점
winsorized 평균에는 데이터 포인트 수정이 포함되며, 트림 평균에는 데이터 포인트 제거가 포함됩니다. winsorized 평균과 trimed 평균이 가까운 것이 일반적입니다.
Winsorized Mean 사용의 한계
winsorized 방법의 한 가지 주요 단점은 데이터 세트에 편향이 있다는 것입니다. 물론, 데이터 세트는 이상 값이 남아있는 경우보다 수정 후 이상적으로 편향이 적습니다.
Winsorized Mean에 대해 더 알아보기
주요 평균 계산의 차이점에 대한 관련 정보를 제공합니다.
