[이코노믹리뷰=최진홍 기자] 인공지능 시대가 열리며 음성을 기반으로 하는 인공지능 스피커들이 대거 출시되고 있다. 미국에서는 2011년 스마트폰에 탑재되어 인공지능 비서로 활동하던 시리의 점유율을 최근 아마존의 인공지능 스피커 중심으로 지원되는 알렉사가 따라잡았다는 분석도 나오고 있다. 현재의 인공지능 스피커는 음성 인터페이스를 중심으로 자연스럽게 스마트홈에 녹아들고 있다.

최근 업계에 음성을 넘어 시각 전반을 아우르는 인공지능 스피커들이 대거 등장해 눈길을 끈다. 글로벌 시장에서는 이미 아마존이 에코쇼 등 관련 제품을 공개하며 다양한 가능성을 타진하고 있다. 아마존은 에코쇼를 통해 음성이 아닌 시각 인터페이스까지 차용하며 스마트 헬스부터 쇼핑 등 많은 영역을 빠짐없이 공략하고 있다. 이러한 분위기는 국내에서도 비슷하게 감지되고 있다.

▲ KT의 기가지니 테이블이 소개되고 있다. 출처=KT

"귀와 눈이 열리다"
KT는 IPTV 1위 사업자로 활동하며 일찍부터 음성은 물론 시각 인터페이스를 인공지능 스피커에 담아내고 있다. 그 연장선에서 기가지니는 다양한 파생 플랫폼을 가동하며 새로운 사용자 경험을 제공하고 있다는 평가다.

4월29일 공개된 기가지니 TV 테이블은 아예 인공지능 스피커가 아닌, 인공지능 TV로의 전환을 꾀하고 있다. 셋톱박스에 화면(디스플레이)을 결합시켜 개인용 인공지능 TV로 다양한 활용이 예상된다. 스마트패드와 비슷한 11.6인치 디스플레이에 유선랜 없이 와이파이(Wi-Fi) 연결만으로 이용이 가능하다. 전원만 연결할 수 있으면 침실, 주방, 서재 등 집안 어디서나 TV를 즐길 수 있어 일반적인 인공지능 스피커의 파생 플랫폼과 동일한 역할도 수행할 수 있다.

올레 tv의 모든 실시간 채널과 주문형 비디오(VOD)를 즐길 수 있으며, 홈IoT 제어와 지니뮤직 음악감상이 가능하다. 날씨 확인, 스케줄 관리 등 홈비서 기능과 함께 어린이, 교육, 요리, 쇼핑 등 다양한 분야에서 특화 서비스를 제공한다. 이를 통해 올레 tv를 시청하기 위해서는 IPTV 이용료를 부담해야 하기 때문에 금전적인 고려는 있어야 한다.

KT는 개인화 사용자 경험 구축을 위해 기가지니 TV 테이블을 선택한 분위기다. 개인화 음성합성(P-TTS, Personalized-Text To Speech) 기술에 기반해 기가지니가 부모의 목소리로 아이에게 책을 읽어주는 ‘내 목소리 동화’를 선보이는 이유다. 지난해 5월 KT가 상용화한 P-TTS는 약 30분에 걸쳐 300개의 샘플 문장을 녹음하면 발화 패턴과 억양을 학습해 자연스러운 목소리를 구현해준다. KT는 P-TTS를 통해 개그맨 박명수 목소리를 구현했으며, 올해 3월에는 지상파 3.1절 특집 다큐멘터리에 독립운동가 고 정재용, 이갑성 선생의 목소리를 재현해 화제를 모았다.

내 목소리 동화는 총 300문장을 녹음하면 P-TTS 기술을 통해 세상에 하나뿐인 오디오 동화책을 만들 수 있다. 한번 녹음하면 추가로 녹음할 필요가 없어 동화책을 추가할 때마다 새로운 동화를 부모 목소리로 들려줄 수 있다. KT는 5월 한달 동안 신청을 받아 300명의 고객에게 서비스를 제공한다. 이후 이용자 반응을 토대로 서비스를 확대할 계획이다. 여기에 KT는 기가지니 인사이드를 통해 일종의 협업 생태계까지 구축, 개인화 사용자 경험 고도화에 집중한다는 방침이다.

KT AI사업단장 김채희 상무는 “가족이 함께 인공지능을 즐기는 셋톱형 기가지니가 인공지능에 대한 친밀도를 높였다면 이번에 선보인 일체형 기가지니 테이블TV와 인공지능 개인화 서비스는 취향과 개성에 맞춰 인공지능을 즐기는 트렌드를 만들 것으로 예상한다”며, “범용 인공지능 모듈이라고 할 수 있는 기가지니 인사이드같은 차별화 기술을 선보여 대한민국 인공지능 생태계 활성화를 선도하겠다”고 말했다.

▲ KT의 기가지니 테이블이 소개되고 있다. 출처=KT

SK텔레콤은 누구 네모가 있다. 역시 누구를 중심으로 누구 미니와 같은 파생 플랫폼을 출시한 상태에서 시청각 인터페이스를 모두 잡겠다는 각오다.

SK텔레콤은 4월18일 누구 네모를 전격 공개했다. 디스플레이를 통해 ▲음악 감상 시 가사 확인 ▲실시간 환율정보 ▲증권정보 ▲운세 ▲지식백과 사전 ▲한영사전 등 다양한 정보 확인이 가능하다. 이를 통해 소비자들은 기존의 AI 스피커가 음성으로만 제공하던 정보를 보다 정확하고 빠르게 확인할 수 있다. 기존 누구에서 제공하던 음악 감상, 날씨 확인, 일정관리 등 30여 가지 생활밀착형 기능들도 동일하게 이용할 수 있다는 설명이다.

SK텔레콤 박명순 AI사업유닛장은 “인공지능 스피커를 통해 듣는 정보를, 화면으로 보다 정확하게 확인하고 싶은 소비자들을 위해 디스플레이 탑재형 스피커 ‘누구 네모’를 출시했다”며 “앞으로 중소기업 등과의 협업을 통해 관련 생태계를 키워서, 소비자들이 5G 초시대에 걸맞은 다양한 인공지능 서비스를 누리실 수 있게 하겠다”고 밝혔다.

▲ 누구 네모가 보인다. 출처=SKT

SK텔레콤도 KT와 동일하게 시각으로 채울 콘텐츠로 키즈 콘텐츠를 낙점했다. 당장 콘텐츠 비즈니스에서 수익을 올리기 편한 지점을 낙점한 셈이다. SK텔레콤은 누구 네모를 통해 인기 어린이 콘텐츠인 핑크퐁 놀이학습 5종을 무료로 제공한다. ‘상어가족’ 노래로 유명한 스마트스터디사의 핑크퐁은 어린이들이 애니메이션, 동요, 게임 등을 통해 한글, 영어, 수학 등을 배울 수 있는 콘텐츠 브랜드다. 다만 IPTV 시청은 불가능하다.

LG유플러스는 인공지능 스피커 시장에서 네이버와 협력하고 있다. 그 연장선에서 지난해 12월 화면일체형 무선 셋톱박스를 통해 선없이 IPTV 서비스를 이용할 수 있는 포터블 IPTV ‘U+tv 프리’를 출시한 바 있다. KT의 기가지니 테이블 TV가 IPTV와 연동되기 때문에 이에 대한 LG유플러스의 대항마로 볼 수 있다. IPTV를 볼 수 없다는 기준으로 누구 네모의 LG유플러스 대항마는 마블과 협력한 U+AI_어벤져스로 볼 수 있다. 다만 이러한 구분은 IPTV 시청 여부에 따라 나눈 것이다.

한편 네이버도 일본에서 클로바 웨이브의 디스플레이 버전을 준비하고 있다. 디스플레이가 탑재된 인공지능 스피커 시장 타진에 네이버도 이름을 올리고 있다는 뜻이다.

▲ LG유플러스의 U+tv 프리가 보인다. 출처=LG유플러스

눈이 떠지면, 새로운 세계가 펼쳐진다
인공지능 시대에서 인공지능 스피커들이 최초 음성 인터페이스를 낙점한 이유는 간단하다. 시장 진입이 상대적으로 낮은데다 음성 인터페이스, 즉 목소리 기반의 명령이 이용자 입장에서 상당히 간편하기 때문이다. 여기에 스트리밍 시장이 커지며 소리에 대한 대중의 기대기차 높아진 대목도 큰 영향을 미쳤다.

다만 음성에 시각이 동시에 지원될 경우 다양한 비즈니스 기회가 생길 수 있다. 인공지능 기술력을 증폭시키며 의사가 원격으로 환자를 진단하거나, 기타 엔터테인먼트를 아우르는 이색적인 사용자 경험을 확보할 수 있다. 쇼핑 등 이커머스 플랫폼에서도 추후 가상 및 증강현실과 맞물려 강력한 존재감을 과시할 수 있다. 최근 인공지능 스피커의 TV 변신에 주목해야 할 이유다.