1. 개요
주로 통계학에서, 인과관계를 잘못 파악하여서 일어나는 오류를 일컫는 말. 이름은 서구권에서 아이가 어떻게 생기냐고 묻는 어린이 대상 완곡어법 겸 설화[1]에서 비롯되었다.2. 오류의 원인
다음과 같은 예시를 보자.독일에 사는 한 통계학자가 "황새가 아이들을 물어다준다"는 설화를 검증하기 위하여 실제로 여러 도시들의 황새 수와 신생아의 수를 조사해 보았다. 그 결과, 실제로 신생아의 규모가 황새의 수와 비례한다는 것을 알게 되었다. 결론적으로, 그 통계학자는 황새가 진짜로 아이들을 물어다준다고 결론내게 되었다.
물론 황새가 아이들을 물어다준다는 것은 명백한 거짓말이다. 그렇다면 왜 이런 일이 일어났는가? 이는 다음과 같다.
도시가 클수록 신생아의 수가 더 많아진다는 것은 몹시 자명한 것이다. 또한, 도시의 규모가 클수록 거기에서 나오는 음식물 등의 수도 많으므로 먹이를 찾아 황새가 더 많이 모여들 것이다. 즉, 황새의 수와 신생아의 수는 모두 도시의 규모라는 한 가지 원인을 기원으로 두고 있는 것이다. 즉, 황새와 신생아의 오류는 한 가지 원인으로부터 비롯되는 두 가지 결과를 서로가 인과관계라고 인지하여서 일어나는 오류이다. 변인 중 외생 변인[2]을 고려하지 못해 발생하는 오류라고도 볼 수 있다.
3. 예시
4. 관련 문서
[1] 이 설화에서 황새들은 요람과 포대기에 아이를 감싸안아 아이를 간절히 바라는 부부나 가족에게 데려다준다. 나아가서 아이가 산후출혈과 터진 양수에 대해 물으면 '손이 없는 황새가 긴 부리로 아이를 직접 전해주다가 무게를 못 버티고 엄마아빠를 실수로 찔러서 그랬다'라고 에둘러 이야기하는 것이 레퍼토리.[2] 서로 다른 두 관찰 결과에 공통적으로 영향을 끼치는 변인. 이를 고려하지 못하면 원인만 같고 서로 관련 없는 두 결과 사이에 마치 직접적 인과관계가 있는 것처럼 잘못 해석할 수 없다. 자세한 것은 변인 문서 참고.