Photo by rawpixel.com on Unsplash


경기를 끝낸 운동선수들을 대상으로 약물 검사를 할 때, 소변 또는 혈액 샘플에서 금지된 성분이 어느 기준 이상 검출된 선수는 금지 약물을 복용한 것으로 간주하여 부정 선수로 판정하고 실격시킨다. 그런데 기준을 어떻게 정하느냐에 따라 실제 약물을 복용하지 않았는데 약물 복용 혐의가 있는 것으로 판정하는 경우도 있고, 반대로 약물을 복용했는데도 약물 복용 혐의가 없는 것으로 판정하는 경우도 있다. 통계학에서는 전자를 채택의 오류(거짓 양성 반응)라고 하고, 후자를 기각의 오류(거짓 음성 반응)라고 한다.


그런데 전자의 경우에는 약물 검사관이 해당 선수로부터 명예 훼손 소송을 당하고 검사 기관은 신뢰를 잃게 되는 등의 심각한 대가를 치르게 되지만, 후자의 경우에는 자백하는 선수가 거의 없으므로 대가를 치를 일도 거의 없다.


이와는 반대로 채택의 오류에 의한 대가는 잘 드러나지 않고 기각의 오류에 의한 대가는 분명하게 드러나는 경우도 있다. 은행은 고객에 대한 대출 승인 여부를 결정할 때 고객들이 대출금을 미상환하는 일이 있을지 여부를 판정한다. 이때 승인 기준에 따라, 대출금을 상환할 사람인데 그렇지 않은(대출금을 미상환하는 일이 있을) 사람으로 판정하는 채택의 오류와 대출금을 상환하지 않을 사람인데 그렇지 않은(대출금을 미상환하는 일이 없을) 사람으로 판정하는 기각의 오류가 발생하게 된다. 이 경우 은행 입장에서는 대출해 주지 않아 영업 이익을 늘리지 못한 부분은 잘 드러나지 않고 대출해 준 후 대출금을 상환 받지 못해 손실을 입는 부분은 비교적 분명하게 드러난다.


약물 검사관이나 은행은 기준을 정할 때 ㉠비교적 분명하게 드러나는 오류의 대가를 줄이려 할 것이다. 그런데 동일한 대상들에 대한 이 두 오류는 서로 ㉡시소 관계에 있다. 즉, 채택의 오류를 줄이기 위해 기준을 옮기면 그만큼 기각의 오류가 늘어나고, 기각의 오류를 줄이기 위해 기준을 옮기면 그만큼 채택의 오류가 늘어나게 되므로 두 오류의 가능성을 함께 줄일 수는 없다. 그래서 통계학자들은 어떤 검출 시스템도 채택의 오류나 기각의 오류가 일어날 확률을 재분배하는 것에 불과할 뿐이므로, 한쪽 오류로 인해 드러나는 대가에만 주목해 그 오류를 줄이려 하면 다른 쪽 오류가 커진다는 것을 간과해서는 안 된다고 말한다.




― 카이저 펑,‘넘버스, 숫자가 당신을 지배한다.’