어느 날 모 반도체 대기업의 인재개발원으로부터 강의 요청을 받았다. “인재개발원 소속 HRD 분야 직원들의 데이터 분석 역량을 높이고 싶습니다. 교육과정을 수립하고 운영하면서 교육 니즈와 수요를 조사하고, HRD 관련 데이터도 있고, 엑셀로 분석도 하고 있습니다. 그런데 최근 들어 데이터를 기반으로 보고하라는 임원들의 요구가 높아지고 있습니다. 문제는 실무자들이 데이터 분석을 제대로 해본 적이 없다는 것입니다. 그렇다고 외주업체에 분석업무를 맡길 정도의 중요성이나 심각한 내용은 아닙니다. 그래서 실무 직원들이 직접 데이터 분석을 할 수 있도록 역량을 높이고 싶습니다. 빅데이터 전문가보다는 리서치 업무를 하면서 직접 실무에서 필요한 데이터를 분석하고 업무에 활용해봤던 강사를 찾고 있습니다.”

인재개발원을 방문해서 점검해본 결과 그 회사의 5년에서 10년 차 정도 되는 실무자들조차 분석 업무를 제대로 해본 적이 거의 없었다. 엑셀을 사용하고 있지만 주로 문서도구로 사용했지 데이터 분석을 위한 도구로 사용한 적은 거의 없다고 했다. 이는 비단 이 회사만의 문제는 아니라고 생각한다. 이 부서만의 문제도 아니다. 데이터를 기반으로 의사결정을 하고 싶은 모든 회사, 모든 직무분야는 기본적으로 이런 어려움을 겪고 있다. 이것이 바로 우리가 실무에서 가볍게 데이터를 분석하고 업무에 활용해야 하는 상황이다.

그렇다면 직업적으로 데이터를 전문적으로 분석하지도 않았고 데이터 과학자가 되고 싶어 하지도 않으면서 실무에서 데이터를 분석하고자 하는 실무자들에게 필요한 것은 무엇일까? 첫째, 데이터에 대한 이해다. 데이터가 무엇이고 데이터를 사용하기 위해 필요한 것이 무엇인지, 목적에 맞는 데이터를 어떻게 수집할 수 있는지에 대해 알아야 한다. 분석 이전에 데이터에 대한 마인드가 먼저 형성되어야 한다. 데이터 기획을 할 수 있어야 한다. 둘째, 통계 및 분석 방법을 알아야 한다. 통계에 대한 기초적인 이해는 분석 업무에 필수다. 대학에서 통계학 원론 과목을 필수로 개설하는 이유가 있다. 통계학과에서 배우는 통계학이 아니라 우리의 일상생활과 사회생활, 직장생활에서 다루는 기초적인 통계 정도는 이해를 해야 한다. 확률, 평균, 가설 검증, 인과관계, 상관관계 등 조금만 생각하면 이전에 공부했던 기억을 떠올릴 수 있는 정도의 기초적인 통계 지식이 필요하다. 분석 방법은 자기에게 필요한 것만 알면 된다. 예를 들어 집단 간의 차이를 알고 싶다면 분산분석을 알면 되고, 수요예측을 하고 싶다면 회귀분석이나 시계열 분석 같은 방법을 알면 된다.

셋째, 분석 도구를 알아야 한다. 데이터의 양이 많아지면서 컴퓨터를 활용하기 시작했다. SPSS, SAS 등과 같은 전문적인 통계 패키지가 등장한 배경이다. 그리고 빅데이터를 분석할 수 있는 R, Python 등과 같은 프로그래밍 언어들이 등장했다. 직장생활에서 가장 많이 접하고 있는 분석도구는 아마도 마이크로소프트의 엑셀(Excel)일 것이다. 엑셀로도 빅데이터를 분석할 수 있다. 전문 통계 패키지는 고가의 유료상품이고, 프로그래밍 언어는 오픈소스(무료)라는 이점에도 불구하고 코딩을 모르는 사람들이 배우기 어렵다. 중요한 것은 직장생활에서 쉽게 거의 비용을 추가로 들이지 않고 사용할 수 있는 분석 도구가 필요한데 지금으로 본다면 엑셀이 가장 좋은 대안이다. 기본적인 통계분석은 엑셀 기반으로 시작하여 필요한 경우에는 R과 같은 추가적인 분석 도구들을 활용할 수 있다. 만약 시각화를 하고 싶다면 마이크로소프트의 파워 BI나 R을 활용하고, 웹크롤링을 하고 싶다면 R이나 MS 파워 쿼리를 사용할 수 있다.

마지막으로 데이터 분석의 결과를 바탕으로 누군가와 의사소통을 해야 한다. 대체로 데이터 분석의 결과를 보고받고 의사결정을 하는 사람들은 임원이나 부서장들이다. 우리가 하는 데이터 분석은 바로 누군가의 의사결정을 도와줄 수 있어야 한다. 분석 결과를 시각화하거나 프레젠테이션을 통해 그들에게 통찰력을 제공할 수 있어야 한다. 비즈니스에 새로운 기회를 만들거나 가치를 높이기 위해서는 설득 커뮤니케이션이 절대적으로 필요하며 이를 이루지 못하면 분석한 결과는 쓰레기가 될 가능성이 높다.