▲ 험프리 보가트 주연의 영화 '카사블랑카'(1942년)의 한 장면. 숫자나 통계를 잘못 이해하면 판단 오류에 빠질 수 있다.

요즘 문맹(文盲)은 거의 없다. 하지만 수맹(數盲)은 넘친다. 숫자에 두려움을 갖고 편히 다루지 못하는 사람들이다.

서울과학종합대학원 김진호 교수는 저서 ‘빅데이터가 만드는 제4차 산업혁명’(북카라반)에서 빅데이터 시대에 숫자와 통계를 기반으로 한 분석능력은 필수역량이라고 말한다. 또한 리더는 과거의 경험이나 감(感)이 아닌 데이터에 근거해 의사결정을 해야 한다고 강조한다.

책에는 숫자와 통계를 정확히 알아야 할 이유를 보여주는 다양한 사례가 나온다.

◇평균의 함정=100명의 군인이 강을 건너야 하는 상황에서 참모가 보고했다. ”군인들의 평균 키는 180cm, 강의 평균 깊이는 150cm입니다.” 이에 장군은 도강을 명령했다. 그런데, 강 중간쯤에 이르자 병사들이 하나 둘 빠져 죽기 시작했다.

겁이 난 병사들이 뒤를 쳐다봤지만, 장군은 ‘돌격 앞으로’만 외쳤다. 결국 병사 대다수가 익사했다. 강의 평균수심은 150cm였지만 최대수심은 2m나 됐다. 장군은 평균의 뜻을 제대로 알지 못했다.

◇도박사의 오류=룰렛은 0에서 36까지 숫자가 적힌 원판을 돌려 구슬이 어떤 숫자에서 멈추는 지 맞추는 게임이다. 룰렛게임의 아웃사이드 베팅 가운데 홀짝 베팅에 나서는 도박사들은 확률 계산을 한다. 예컨대 6번 연속으로 홀수가 나왔다면 다음 번에는 짝수일 확률이 2분의 1보다 높을 것으로 예상해 짝수에 큰 돈을 건다. 그러나 구슬을 던질 때마다 홀수나 짝수가 나올 확률은 매번 2분의 1이다. 동전던지기도 마찬가지다.

◇3할대 타자=야구에서 3할대 타자가 세 타석에서 모두 안타를 쳤다고 생각해보자. ‘도박사의 오류’에 빠진 해설자는 이렇게 말할 지 모른다. “3할대 타자라서 네번 째 타석에서는 범타로 물러날 겁니다.” 3할대란 매번 타석에 들어설 때마다 3할의 확률로 안타를 친다는 얘기다.

◇교통사고 발생률=경찰청이 발표한 ‘2015년판 통계’에 따르면, 한국의 2014년 교통사고 사망자 수는 10만명당 9.4명으로 OECD평균(6.5명)보다 높았다. 이 통계가 보도되자 우리나라 운전자들의 안전의식이 선진국들에 비해 크게 부족하다는 비판이 쏟아졌다.

하지만 2014년 한국 자가 운전자들의 평균 주행거리는 1만6000km나 됐다. 일본은 1만km였다. 국토가 넓은 미국도 주행거리가 한국보다 짧았다. 차를 많이 타고 다니면 사고발생 빈도가 그만큼 높아지게 마련이다. 게다가 한국의 도로 여건은 선진국보다 열악하다.

통계수치는 여러 조건을 감안하고 봐야 진정한 의미가 드러난다. 그래야만 적절한 대책을 세울 수 있다. 다양한 여건을 무시하고 오직 운전자 안전의식을 문제 삼는다면 교통사고 발생률을 낮추기 힘들다.

◇매맞는 남편들=과거 화제가 된 국내 가정폭력 통계가 있었다. 남편에게 상습 구타를 당하는 아내가 전체의 40% 이상이었다. 그런데, 아내에게 매 맞는 남편도 15%나 되는 것으로 나타났다. 하지만 당시 통계는 가정폭력의 ‘개념’이 남편 따로, 아내 따로 였다.

남편의 폭력은 ‘손·발·몽둥이 사용’ 45.3%, ‘닥치는 대로 때림’ 9.1%, ‘칼 등의 흉기 사용’ 4.7% 등으로 모두 정도가 심각했다. 반면 아내의 폭력은 대부분 ‘남편을 밀친다(11.3%)’ 정도였다. 나머지 4%가 ‘뺨을 때린다(2.6%)’, ‘발이나 주먹을 사용한다(1.4%)’였다.

◇유용성의 오류=사람들은 어떤 사건의 발생 확률을 말할 때 쉽게 기억나는 사건일수록 확률을 높게 평가하는 경향이 있다. 이 때문에 자동차 사고에 비해 현저하게 적은 비행기 사고가 오히려 더 자주 일어난다고 오해하고, 살인사건이 자살보다 더 많이 일어난다고 여긴다.

◇숫자 조작=16세기 후반 독일인 의사 바이루스는 지구상에 있는 악마의 숫자가 모두 740만 5926명이라고 발표했다. 마녀사냥이 한창일 때 나온 것인데, 역사상 가장 터무니없는 숫자조작으로 꼽힌다.