본문 바로가기

칼럼/책리뷰

통계의 함정을 읽고

 


언제나 절대적 수치와 절대적 리스크를 물어보라. 그래야 무슨 말인지 제대로 이해할 수 있을 것이다. 반대로 상대적 리스크에 대해서는 '잘 확인하고' 누가 무슨 목적과 의도로 당신을 이해시키려고 하는지 의문을 품어야 한다. 

어떤 것의 50%가 사라지고 다시 그것의 50%가 또 사라지면 전체적으로 없어진 것은 100%가 아니라 75%다. 

독성이 없는 것은 무엇일까? 만물에는 독성이 있으며 독성이 없는 물질은 없다. 독성이란 오직 그 복용량에 따라 결정된다. - 파라켈수스의 명제 

10-20년 전까지만 해도 이런 유해물질을 측정하는 단위는 킬로그램당 밀리그램(ppm=100)이었다. 당시는 돼지고기 1kg당 1mg의 제초제가 발견되면 '검출되지 않음'으로 표시했다. 실제로 발견되지 않아서가 아니라 유해성을 입증할 수 없었기 때문이다. 그러다가 80년대에 들어와서는 유해물질 농도를 10억분의 1까지 입증하게 되었고, 요즘에는 100경분의 1까지 밝혀내는 실정이다. 쉽게 예를 든다면 이는 슈탄베르크 호수에 각설탕 1개를 녹였을 때 분명하게 그 성분을 밝혀낼 수 있다는 의미다. 

미국의 유명한 생화학자 브루스 에임스 Bruce Ames의 연구에 따르면, 무게 기준으로 볼 때 우리가 먹는 음식물에 들어간 모든 유해물질의 99.99%는 처음부터 자연 상태로 포함된 것이라고 한다. 오로지 0.01%만이 생산 단계나 포장, 판매 과정에서 추가된다는 것이다. 

통계적 사고를 익히는 것은 어렵지 않으며 실제로 유용하기도 하다. 정보를 왜곡하는 사람을 쉽게 꿰뚫어볼 수 있고 정보 조작에 대처할 수도 있다. 

정보 왜곡과 조작에 성공적으로 대처할 수 있는 황금률

  1. 각각의 통계를 만드는 사람이 누구인지, 그가 거기서 노리는 목표가 무엇인지 항상 의문을 품어라. 단순히 어떤 사실을 밝히려는 것인가, 아니면 통계를 조작하여 특정 의견이나 결과를 팔려는 것인가?

  2. 상관광계와 인과관계를 절대 혼동하지 마라. 2개의 변수가 체계적으로 한 방향에 있을 때는 세 가지 결과가 나올 수 있다. 첫 번째 변수가 두 번째 변수의 원인이 되거나 두 번째 변수가 첫 번째의 원인이 되거나 아니면 둘 다 서로 원인이 되지 않는 경우, 이렇게 세 가지다. 우연히 상관관계가 성립되지 않는 한, 이 2개의 변수는 공통으로 제3의 변수에 종속된다. 

  3. 제로 리스크 환상을 피라하. 모든 리스크를 완전히 배제하려는 시도는 모두 실패할 수밖에 없다. '리스크가 있는가?'가 아니라 '리스크는 얼마나 있는가?'를 물어야한다.

  4. 끊임없이 리스크의 절댓값을 물어라. 상대적인 리스크는 증가든 감소든, 착오로 이어지기 마련이다. 리스크가 거의 없을 확률이 100%라는 것은 언제나 거의 불가능하다.

  5. 퍼센트의 바탕에 주목하라. 무엇에 대한 퍼센트인가?

  6. '과학적으로' 또는 '유의미한'이라는 형용사의 남용을 조심하라. 별표를 단 통계는 과학과 완전히 무관하며 그 결과는 흔히 중요하지 않을 때가 많다.

  7. 표본조사에서는 표본으로 누가 파악되는지, 특히 누가 파악되지 않는지 물어라. 쾰른 성당의 성탄절 자정미사에 참석한 사람 90가 낙태 합법화에 반대한다고 할 때, 그것은 전체 독일 국민의 의사가 아니다. 

  8. 증가율을 절대 산술적인 수치로 생각하지 마라. 60% 이상과 50% 이하의 평균은 5%이상이 아니다. 

  9. 통일된 기준에 주목하라. 누가 환자고 누가 실업자인가? 개념규정에 따라 결과는 전혀 달라진다. 

  10. 경제생활이나 사회생활은 물론이고 일상생활에서도 우연이 큰 역할을 한다는 것을 인정하라. 우리가 안다고 믿는 많은 기준은 전혀 기준이 되지 못한다. 전체를 반복하면 그 기준은 사라진다. 


통계의 함정
국내도서
저자 : 발터 크래머,토마스 바우어,게르트 기거렌처 (Gerd Gigerenzer) / 박병화역
출판 : 율리시즈 2017.05.18
상세보기


올해는 달걀 수난의 해였다. AI로 한동안 달걀 값이 금값이 되더니 곧이어 살충제 달걀 파동으로 전면 출하 금지가 내려졌다. 살충제 달걀 파동은 먹어도 안전하다는 보도로 끝이 났다. 며칠 사이 언론의 보도 내용이 달라졌다. 나는 화학물질이 건강에 끼치는 영향에 예민하게 반응하는 소비자는 아니었지만, 이같은 뉴스 보도를 신뢰할 수는 없었다. 

 이어서 생리대 파동이 일었다. 여성들이라면 민갑하게 받아들일 수 밖에 없는 생리대가 성분도 공개하지 않은 유해 화학물 덩어리였다니. 울분을 터뜨린다. 그런데 이덕환 서강대 화학과 교수가 밝힌 바에 의하면 문제가 됐던 부분은 VOCs(휘발성유기화합물)은 놀라울 정도고 측정값이 작은 나노그램 수준이라고 한다. "제일 많이 나온 게 6.5μg(마이크로그램)다. 이 양은 어느 정도인가 하면 사람들이 이용하는 실내 공기에 VOCs의 허용 기준이 있다. 건강한 성인이 (허용기준 상태에서) 1분 정도 호흡을 하면 이 생리대에 들어 있다고 하는 VOCs의 한 400배 정도 흡입하게 된다”고 했다. 

 두가지 파동을 겪어보니 책에서 소개된 리스크 편향에 대한 이야기가 생각난다. 우리가 먹는 식품에 들어간 모든 유독물질의 99.99퍼센트가 자연에서 나온다는 사실이다. 미국인은 1인당 하루에 약 1,500밀리그램에 해당하는 천연유독물질을 먹고있으며, 인체로 들어가는 합성살충제 0.09밀리그램에 비해 1만 배가 넘는 양이다. 

 이 기사를 보는 순간 뭔가 통계를 활용해 의도된 기획이 있었을 거라는 생각이 들었다. 두가지 파동으로 반사이익을 얻는 단체는 어디였을까? 혹 이들이 의도적으로 통계를 활용했던 것은 아니었을까? 일회용 생리대 파동으로 생리컵, 면생리대 제조업체는 반사이익을 얻었을까? 달걀 파동으로 이익을 얻을 달걀 대체 식품 산업은 어디일까? 괜히 음모론 시나리오도 펼쳐본다.
 뉴스에서 인용된 통계를 무조건 신뢰했었는데, 이제는 그 뒤에 숨겨진 의도된 기획을 살펴 볼 생각이다.