샘플 선택 바이어스 란 무엇입니까?
샘플 선택 바이어스는 통계 분석을 위해 비 랜덤 데이터를 선택하여 발생하는 바이어스 유형입니다. 샘플 선택 프로세스의 결함으로 인해 바이어스가 존재합니다.이 경우 특정 속성으로 인해 데이터의 하위 집합이 체계적으로 제외됩니다. 부분 집합을 제외하면 검정의 통계적 유의성에 영향을 주거나 왜곡 된 결과가 생성 될 수 있습니다.
샘플 선택 바이어스 이해
생존 바이어스는 일반적인 유형의 샘플 선택 바이어스입니다. 예를 들어, 큰 주식 그룹에 대한 투자 전략을 백 테스트 할 때 전체 샘플 기간 동안 데이터가있는 유가 증권을 찾는 것이 편리 할 수 있습니다. 15 년 분량의 주식 데이터에 대해 전략을 테스트하려는 경우 전체 15 년 동안 완전한 정보를 보유한 주식을 찾는 경향이 있습니다. 그러나 거래를 중단했거나 곧 시장을 떠난 주식을 제거하면 데이터 샘플에 편차가 생길 수 있습니다. 우리는 15 년 동안 지속 된 주식 만 포함하기 때문에, 시장에서 생존하기에 충분히 성공한 최종 결과에는 결함이있을 것입니다.
헤지 펀드 성과 지표는 생존자 편견에 따른 표본 선택 편향의 한 예입니다. 살아남지 않는 헤지 펀드는 성과를 인덱스 어 그리 게이터에보고하는 것을 중단하기 때문에 결과 지수는 자연스럽게 유지되는 펀드 및 전략으로 기울어지게됩니다.
분석가는 이러한 편견을 고려하여 조정할 수 있지만이 과정에서 뉴스 편견이 발생할 수 있습니다.