스퓨리어스 상관이란?
통계에서 스퓨리어스 상관 또는 스퓨리어스는 인과적인 것처럼 보이지만 그렇지 않은 두 변수 간의 연결을 나타냅니다. 가짜 관계는 종종 한 변수가 다른 변수에 영향을 미치는 것처럼 보입니다. 이 가짜 상관 관계는 종종 검사 시점에 명확하지 않은 세 번째 요소, 때로는 혼란스러운 요소로 인해 발생합니다.
주요 테이크 아웃
- 스퓨리어스 상관 (Spurious Correlation) 또는 스퓨리어스 (Spuriousness)는 두 가지 요인이 우연히 관련이있는 것처럼 보이지만 그렇지 않은 경우입니다. 인과 관계의 모양은 종종 차트에서 유사한 움직임으로 인해 우연히 발생하거나 세 번째 "혼란"요인으로 인해 발생합니다. 샘플 크기가 작거나 임의의 엔드 포인트로 인해 종종 발생할 수 있습니다.
스퓨리어스 상관 관계 작동 방식
두 개의 임의 변수가 그래프에서 서로 밀접하게 추적되면 변경이 다른 요소에 영향을 미치는 상관 관계 또는 두 요소 간의 관계를 쉽게 예측할 수 있습니다. 또 다른 주제 인 "원인"을 제외하고, 이 관측치는 변수 A의 이동이 변수 B의 이동과 연관되어 있거나 그 반대 인 것으로 믿는 차트의 독자를 이끌 수 있습니다. 그러나 때로는 더 가까운 통계 조사에서 정렬 된 동작이 일치하거나 첫 번째 두 가지 요소에 영향을 미치는 세 번째 요인으로 인해 발생합니다. 이것은 가짜 상관 관계입니다. 작은 표본 크기 또는 임의의 종말점으로 수행 된 연구는 특이성에 취약합니다.
스퓨리어스 상관의 예
흥미로운 상관 관계를 발견하는 것은 그리 어렵지 않습니다. 그러나 많은 사람들이 가짜로 판명 될 것입니다. 월스트리트의 수컷 종의 경우 두 가지 인기있는 상관 관계는 여성과 스포츠와 관련이 있습니다. 1920 년대에 시작된 스커트 길이 이론은 스커트 길이와 주식 시장 방향이 서로 연관되어 있음을 유지합니다. 스커트 길이가 길면 주식 시장이 하락하고 있음을 의미합니다. 그들이 짧은 경우, 시장은 상승하고 있습니다. 1 월 말, 소위 슈퍼 볼 (Super Bowl) 지표에 대한 논의가 있는데, 이는 AFC 팀의 승리가 내년에 주식 시장이 하락할 것이라는 것을 의미하는 반면, NFC 팀의 승리는 시장. 1966 년 이래이 지표의 정확도는 80 %입니다. 재미있는 대화 작품이지만 고객을위한 투자 전략으로 심각한 재정 고문이 추천하지는 않을 것입니다.
일반적인 스퓨리어스 상관의 예는 다음과 같습니다.
- 아이스크림 판매가 증가하면 익사가 증가합니다. 아이스크림 판매가 증가하면 익사가 더 많이 생길 수 있지만 실제로 열이 증가하면 더 많은 사람들이 수영을하고 아이스크림을 더 많이 구매할 수 있습니다.2006-2011 년 미국 살인 비율은 Microsoft Internet Explorer와 동일한 비율로 떨어졌습니다. 오클랜드 레이더스 팀 장비를 착용 한 사람들은 범죄를 저지를 가능성이 더 높습니다.
스퓨리어스 상관을 발견하는 방법
데이터를 분석하는 통계 학자와 다른 과학자들은 항상 가짜 관계를 경계해야합니다. 그들이 사용하는 수많은 방법이 있습니다:
- 적절한 대표 표본 확보 적절한 표본 크기 확보 임의의 종말점에주의 가능 가능한 많은 외부 변수 제어 귀무 가설 사용 및 강력한 p- 값 확인