[이코노믹리뷰=최진홍 기자] 최근 ICT 기업의 사생활 침해 논란이 커지고 있다. 특히 초연결 시대가 열리며 사용자 경험을 정밀하게 구축하기 위해 기업들은 데이터를 강하게 원하고 있으며, 이 과정에서 무분별한 수집이 이뤄지는 패턴이 감지되고 있다. 특히 인공지능 스피커가 대중화 전철을 밟으며, 자사의 인공지능 기능 고도화를 위해 이용자의 음성 데이터를 수집하는 일이 많아지고 있다.

다만 같은 기업의 정보 수집이라도 사태의 경중은 다르다는 분석이 나온다. 모든 기업의 행태를 동일한 선상에서 분석하는 것은 그 전제부터 틀렸다는 반론이다.

애플, 구글, 페이스북, 아마존은?
기업의 개인정보 확보가 논란이 된 사례는 많다. 애플이 단적인 사례다.

애플은 최근까지 고객과 인공지능 비서 시리의 대화 일부를 녹음해 보관했다. 애플ID가 아닌 무작위로 고객의 목소리를 녹음해 저장했으며, 전체 대화내용의 0.2%가 애플의 서버로 흘러들어간 것으로 확인됐다. 논란이 커지자 애플은 사과했다. 애플은 지난달 29일 블로그를 통해 “시리와의 대화를 녹음하지 않을 것”이라면서 “그 대안으로 시리 개선 작업을 돕기 위해 컴퓨터로 처리된 녹취록을 사용할 것"이라고 밝혔다.

고객과 시리의 대화가 외부업체 계약직원이 아닌 자사 직원들만 들을 수 있었다는 해명도 나왔다.

애플만 논란에 휘말린 것이 아니다. 페이스북도 비슷한 논란에 휘말렸다. 지난달 14일(현지시간) 블룸버그는 페이스북의 수백명의 외주직원을 고용, 확보되는 고객의 목소리를 받아 적게 했다고 보도했다. 지난해 초유의 개인정보유출 파문을 일으킨 페이스북이라 특히 비판의 목소리가 컸으며, 역시 페이스북은 사과했다.

구글도 지난 7월 인공지능 구글 어시스턴트를 통해 녹음된 고객의 녹취파일 1000여개가 유출되며 상당한 논란에 휘말렸으며 아마존 알렉사도 고객의 음성 데이터를 확보해 큰 파장을 일으킨 바 있다.

네이버와 카카오도 논란
네이버도 비슷한 논란에서 자유롭지 못하다. 자사 인공지능 스피커를 통해 이용자 음성 데이터를 수집해온 것으로 알려졌다. 전사 작업 자회사 직원이 별도 보안계약서를 작성하고 음성 내용을 쪼개서 전체를 볼 수 없는 방식으로 데이터를 확보했다는 후문이다.

네이버는 이용자들의 음성 데이터를 녹취한 것은 사실이지만, 사생활 침해는 없다고 밝혔다. 자사의 네이버 다이어리를 통해 "네이버는 클로바 이용약관에 명시한 바와 같이 이용자가 호출어를 통해 입력하는 데이터를 저장하고 이후 비식별 처리 및 파기, 삭제하고 있다"면서 이용자 데이터 녹취는 1% 미만이라고 강조했다.

다만 논란을 잠재우기 위해 앞으로 이용자들이 음성 명령어의 저장 허용 여부를 직접 결정할 수 있는 옵트아웃 기능을 적용하기 위해 준비하고 있다고 밝혔다.

카카오도 상황이 비슷하다. 업계 등에 따르면 카카오는 카카오미니를 이용해 이용자들의 음성을 일부 입수한 것으로 확인됐다.

실제로 카카오 개인정보방침을 살펴보면 '서비스에서 별도로 수집하는 개인정보 항목'이 있다. 여기에서 헤이카카오와 카카오i의 수집하는 항목에 필수정보로 음성명령정보(텍스트) 및 음성정보가 기입되어 있다. 카카오미니에 음성명령을 내릴 경우 해당 정보가 일부 수집된다는 뜻이다. 선택정보로는 음성 정보 및 자녀정보가 기재되어 있다.

▲ 카카오 이용약관. 출처=갈무리

필수정보는 해당 서비스의 본질적 기능을 수행하기 위해 수집되는 정보며 선택정보는 특화된 서비스를 제공하기 위해 추가 수집하는 정보를 말한다.

카카오 관계자는 "음성인식 개선과 서비스 품질 향상을 목적으로 음성명령 데이터를 0.2% 미만의 비중으로 추출된다"면서 "개인정보는 자동 마스킹 되며 음성 또한 변조되어 철저히 비식별처리 되고 있다.  향후 이용자가 음성명령어 저장 허용 여부를 직접 선택할 수 있는 추가기능을 도입할 예정"이라고 말했다. 

이 외에도 통신사들의 인공지능 스피커도 비슷한 수준의 데이터 취합에 나서는 것으로 확인됐다.

무엇이 다른가?
일정정도의 데이터를 활용해 자사 인공지능 서비스를 고도화시키는 것은 많은 기업들이 고객약관동의를 통해 진행하고 있다. 인공지능은 데이터를 학습하며 고도화되기 때문이다.

문제는 식별 및 비식별 여부, 나아가 유출 여부다. 애플은 이 지점에서 무작위로 고객 음성을 녹음했으며 심지어 이 사실이 외부에 유출됐다. 네이버와 카카오는 사정이 약간 다르다는 설명이다. 두 회사는 모두 고객약관이 존재하며, 비식별 데이터를 입수해 활용했다고 밝혔다.

글로벌 ICT 기업의 행보와 국내 네이버와 카카오가 보여준 행보는 분명 온도 차이가 있다. 다만 일각에서는 초연결 시대가 열리며 사생활 침해 논란이 커지는 가운데, 두 회사가 더욱 적극적으로 이러한 사실을 알려 정당한 정보 수집에 나서야 한다는 지적도 나오고 있다