[이코노믹리뷰=최진홍 기자] 한국판 뉴딜이 발표된 후 디지털 뉴딜과 그린뉴딜의 큰 그림이 가동되는 가운데, 한성숙 네이버 대표는 디지털 뉴딜을 설명하며 그 무엇보다 데이터의 중요성에 집중한 바 있다. 특히 한 대표는 정부의 데이터댐 정책이 미래로 나아가는 필수적 관문이라 강조하며 "데이터댐을 방류해 디지털 강국 건설에 힘을 보태겠다"는 의지까지 보였다.

윤성로 대통령 직속 4차산업혁명위원장도 지난 7월 부산에서 열린 BX 라이프 플랫폼 컨퍼런스 특별강의를 통해 "디지털 뉴딜은 디지털댐을 건설하는 것"이라며 초연결 및 인공지능, 디지털과 데이터가 촉발시키는 지능화 혁명에 주목했다.

문제는 디지털의 계량화 및 정의다. 구슬이 서말이어도 꿰어야 보배인 것처럼, 확보된 데이터를 유연하게 활용하려면 다양한 접근이 필수적이기 때문이다. 인공지능 학습에 필요한 데이터를 수집하고 가공하는 데이터 라벨링 작업을 전문으로 하는 데이터 라벨러라는 새로운 직업군이 각광받는 이유다.

그 연장선에서 크라우드소싱 기반 인공지능 데이터 수집×가공 플랫폼 기업 크라우드웍스가 국내 데이터 라벨러들의 활동 현황과 실태를 분석한 ‘2020 데이터 라벨러 현황 보고서’를 발간했다고 2일 밝혀 눈길을 끈다.

▲ 출처=크라우드웍스

국내에만 20만 명 이상이 종사 중인 것으로 추정하고 있는 데이터 라벨러에 대한 심층적인 접근이라 특히 의미가 있다. 

이번 보고서는 크라우드웍스의 15만 활성 회원 데이터와 지난 7월 31일부터 8월3일까지 나흘간 국내에서 활동 중인 데이터 라벨러 2611명을 대상으로 진행한 온라인 설문조사 결과를 토대로 작성됐다는 설명이다.

우선 직업과 관련해 데이터 라벨러의 절반 이상은 본업을 가지고 있는 다중 직업 종사자인 것으로 나타났다. 데이터 라벨러의 본업으로는 일반 회사에 다니는 직장인의 비중이 가장 높았으며 이어 자영업자, 공무원 순으로 조사됐다. 데이터 라벨링을 주요 결제활동으로 삼고 있는 데이터 라벨러 비율도 40%이상을 기록했다.

이들은 온라인 환경에 익숙하며, 최신 트렌드의 영향을 많이 받는 것으로 조사됐다. 데이터 라벨링에 대한 정보를 처음 알게 된 경로는 네이버와 구글, 유튜브, 인스타그램 등 온라인이 대부분을 차지했다. 지인의 추천을 받아 데이터 라벨링을 시작했다는 비율도 20% 이상으로 나타났다.  

아직 국내 데이터 라벨링 시장의 경우 공급 대비 수요가 우세한 것으로 분석됐다. 데이터 라벨러의 과반수는 데이터 라벨링 작업에 참여하기 위해 플랫폼에 상시 접속하고 있지만 일평균 작업 시간은 2시간 미만으로 집계됐다. 여기에 라벨링 작업 선택 기준으로는 수익과 직간접적으로 연관된 보상과 난이도, 시간 등을 고려하는 것으로 나타났다. 작업 데이터 역시 이미지와 텍스트 등 비교적 수집과 가공이 간편한 유형을 선호한다는 사실도 확인됐다.

박민우 크라우드웍스 대표는 “인공지능 기술의 고도화를 위해서는 사람의 개입이 필수 적이고 사람의 삶을 윤택하게 하기 위해서는 고도화된 인공지능 기술이 필요하다”라며 “크라우드웍스는 이런 선순환 구조의 초석을 다지는 데이터 라벨러를 위해 플랫폼 노동의 새로운 패러다임을 제시하도록 앞장서겠다”라고 말했다.