현재 글로벌 ICT 기업들은 춘추전국시대를 방불케 하는 인공지능 스피커 각축전을 벌이고 있다. 단기간에 이렇게 많은 관심을 받은 시장도 드물다. 당장 시장의 성장 속도가 남다르다. 인공지능 스피커 시장 규모는 오는 2020년 약 21억달러(약 2조4000억원)에 이를 것으로 전망되며 이를 수반하는 초연결 기기의 숫자도 향후 5년 내 1000억대를 돌파할 것으로 예상된다. 시장조사업체 스트래티지 애널리틱스에 따르면 2016년 4분기 기준 인공지능 스피커 출하대수는 전년 대비 무려 600%가 증가해 420만대를 기록했다.

시장의 주요 플레이어는 누가 있을까?

▲ 아마존 에코. 출처=아마존

아마존부터 샤오미까지

포문은 아마존이 제일 먼저 열었다. 인공지능 알렉사가 탑재된 에코가 그 주인공이다. 2014년 11월 전격적으로 출시된 아마존 에코는 현재 미국 인공지능 스피커 시장을 사실상 독식하고 있다. 시장선점효과를 톡톡하게 누리는 셈이다. 시장조사업체 이마케터에 따르면 현재 에코의 미국 시장 점유율은 70.1%에 달하며 업계 1위다.

CNBC는 미국 투자은행 RBC 캐피탈 마켓은행 보고서를 인용, 알렉사가 담긴 스마트 스피커 에코가 2020년까지 100억달러(약 11조3000억원)의 수익을 올릴 것이라고 보도하기도 했다. 이런 추세라면 2020년 알렉사 활성 이용자는 5억명에 달할 전망이며 활성 이용자 40%는 미국 내 사용자로 예상된다. 2020년에는 총 6000만대의 알렉사 탑재 기기가 팔릴 것이며, 알렉사 탑재 기기는 약 1억2800만대를 돌파할 것이라는 분석도 나오고 있다. 현재 에코쇼(Echo Show)와 같은 파생 라인업도 속속 등장하고 있다.

▲ 출처=이코노믹리뷰 DB.

에코의 강점은 알렉사 자체의 인공지능 기술력에서 시작된다. 전자상거래 시장의 폐쇄형 생태계를 지향하는 알렉사는 현재 다양한 온디맨드 기업과 협력하며 다양한 가능성을 타진하고 있다. 이미 지난 2015년 아마존은 소프트웨어개발자도구(SDK) 알렉사스킬키트(ASK)를 공개했으며 지난 3월 기준 알렉사 스킬은 1만개를 넘긴 것으로 확인된다. 현재 알렉사 스킬 키트를 에코에 추가하면 다양한 인공지능 기술력을 서비스받을 수 있다. ‘알렉사 스킬 마켓플레이스’(Alexa Skills Marketplace)를 통한 접근 용의성도 탁월하다는 평가다.

RBC는 알렉사를 통해 우버나 스포티파이 같은 인기 애플리케이션(앱)을 이용할 수 있다면서 “알렉사 스킬이 늘어날 때마다 알렉사를 통해 돈을 벌 기회가 늘어나는 것”이라고 강조했다. 최근 아마존 내부의 1492팀이 헬스케어 프로젝트를 시작하며 에코쇼를 매개로 삼은 ‘스마트 주치의 솔루션’을 추구하는 것도 그 연장선에 있다.

▲ 출처=이코노믹리뷰 DB.

에코는 직경 84㎜, 높이는 235㎜로 구성되어 있다. 원통형 인공지능 음성인식 스피커를 표방하며 최근에는 보급형 스피커인 에코닷과, 스크린이 탑재된 아마존탭도 출시된 상태다.

현재 아마존은 알렉사 고도화를 위해 파격적인 개발자 우대 전략까지 펴고 있다. <야후파이낸스>는 지난 3월 아마존 관계자의 말을 인용해 아마존이 알렉사 개발자들에게 월 100달러의 클라우드 컴퓨팅 서비스를 제공한다고 보도했다. 이미 혜택을 받았어도 발행된 알렉사 스킬을 가지고 있는 개발자는 또 지원받을 수 있다. 프로모션 덕분에 개발자들은 예전보다 부담 없이 알렉사 개발에 매달릴 수 있을 것으로 보인다. 모두 생태계 강화를 위해서다.

▲ 출처=이코노믹리뷰 DB.

아마존에 대항해 구글도 칼을 빼들었다. 인공지능 구글어시스턴트가 탑재된 구글홈이 그 주인공이다. 아마존의 유일한 대항마로 불리며 현재 미국 인공지능 스피커 시장에서 알렉사를 제외하고 그나마 소기의 성과를 거두는 제품으로 분류된다. 지난해 5월 구글I/O에서 처음 공개된 후 11월 예약판매에 돌입한 구글홈은 세계 최대 검색엔진인 구글 검색과 연동되어 강력한 존재감을 자랑한다.

미국 시장조사업체 CB 인사이츠의 통계를 보면 구글은 최근 6년간 무려 11곳의 인공지능 스타트업을 인수하며 인공지능 퍼스트의 기조를 따라간 바 있다. 그 연장선에서 구글 어시스턴트는 안드로이드 스마트 단말기에 빠르게 침투하고 있으며 자체적인 생태계 강화 전략도 병행하고 있다.

개발자용 플랫폼 ‘액션 온 구글(Action on Google)’ 플랫폼이 대표적인 사례다. 액션 온 구글 플랫폼은 구글 어시스턴트를 통제하는 제어장치로 이해할 수 있다. 이를 통해 구글 어시스턴트를 제어하는 방법은 크게 세 가지다. 음성 액션(Conversation Actions)과 다이렉트 액션(Direct Actions) 그리고 임베디드 구글 어시스턴트 SDK다. 최근에는 무려 6개의 음성을 구분할 수 있다는 점이 알려져 눈길을 끌기도 했다.

▲ 구글홈. 출처=위키미디어

최근 구글홈, 정확하게 말해 구글 어시스턴트가 한국어를 공부하기 시작했다는 주장도 나왔다. 이미 7월 14일 구글은 일부 테스터를 대상으로 구글 어시스턴트의 한국어 베타 서비스 참여 초대장을 발송한 상태다. 스콧 허프만(Scott Huffman) 구글 엔지니어링 어시스턴트 부사장이 구글I/O 당시 구글 어시스턴트 아이폰 서비스 시작을 공개하며 한국어를 연말까지 지원하겠다고 밝혔다는 점을 고려하면 당연한 수순이라는 말도 나온다.

현재 구글은 안드로이드 생태계에 포함된 하드웨어 동맹군을 기점으로 인공지능 기술력을 키우는 한편, 관련 생태계의 연결을 추구하고 있다.

애플도 뒤늦게 인공지능 스피커 시장에 뛰어들었다. 지난 6월 애플은 WWDC 2017 현장에서 인공지능 스피커 홈팟(HomePod)을 전격 공개했다. 팀 쿡 CEO는 “아이폰이 스마트폰 시장을 평정한 것처럼, 홈팟은 집에서 음악을 즐기는 방식을 재정의할 것”이라며 “인공지능 스피커로 애플의 혁신적인 기술력을 더욱 확실하게 체감할 수 있을 것”이라는 자신감을 보였다. 인공지능의 원조격인 시리를 활용해 알렉사와 구글홈이 차지한 인공지능 스피커 시장의 재편을 노린다는 각오다.

7개 스피커와 4인치 서브 우퍼를 장착한 홈팟은 애플뮤직과 같은 콘텐츠 생태계와 강력한 연결성을 자랑한다. 홈킷이라는 자체 스마트홈 시스템과의 연동과 iOS 생태계의 시너지를 노린다는 뜻이다. 인공지능의 기술력을 음성인식 스피커 홈팟에 집중해 애플뮤직을 비롯한 자체 콘텐츠를 매력 포인트로 활용하는 방식이며, 이는 온전히 애플이 보유한 아이폰 단말기 플랫폼 경쟁력으로 전이될 수 있다.

▲ 애플 홈팟. 출처=위키미디어

마이크로소프트는 삼성전자가 인수한 하만카돈과 협력해 인공지능 스피커 인보크(Invoke)를 개발하고 있다. 핵심은 인공지능 코타나다. 소프트웨어적 측면에서 장기간 위력을 발휘했던 코타나가 인공지능 스피커에 연결되어 본격적인 행보를 시작하는 분위기다.

일본의 소프트뱅크도 인공지능 스피커 시장에 관심이 많다. 인공지능 로봇인 페퍼를 통해 교감형 로봇 서비스 시대를 선도하는 상황에서 올해 플렌큐브 공개를 선언하고 나섰다. 다른 기업처럼 인공지능 스피커에 저돌적으로 개입하는 분위기는 아니지만 4차 산업혁명에 따른 스마트홈 전략의 중요한 지향점으로 삼는 분위기다. 추후 소프트뱅크는 자국의 스타트업인 플렌고어 로보틱스와 협력해 휴대용 인공지능 스피커인 플렌 큐브를 출시할 계획이며, 일본을 비롯해 한국 및 싱가포르 등에서 판매할 계획이다. 플렌고어 로보틱스가 하드웨어를 맡으면 소프트뱅크가 언어적 측면의 소프트웨어 경쟁력을 더하는 방식이며 한국어, 중국어, 영어를 지원하는 것으로 알려졌다.

중국의 알리바바도 7월 5일 엔마오 징링 X1(티몰 지니 X1)을 전격적으로 공개하며 인공지능 스피커 시장에 진출했다. 인터넷 연결을 통해 스마트홈 디바이스 제어는 물론 스트리밍 서비스와 기본적인 정보검색 기능도 탑재했다는 설명이다. 다만 언어는 중국어만 지원한다. 스마트폰 시장의 다크호스로 불렸으나 최근 위세가 주춤하고 있는 샤오미도 총 6개의 내장 마이크를 탑재한 미 AI 스피커를 공개하기도 했다. 이 외에도 삼성전자의 인공지능 스피커 출시 임박 소식도 들리며, 최근에는 페이스북이 인공지능 스피커 출시를 준비하고 있다는 주장도 나온다.

한국은 인공지능 스피커 시장의 성지?

글로벌 ICT 업계의 인공지능 스피커 시장이 각축전을 벌이고 있는 상황에서, 국내 시장도 후끈 달아오르고 있다. 먼저 통신사다. 4차 산업혁명에 대비하기 위해 ‘탈 통신’을 선언한 상태에서 시장 1위 사업자인 SK텔레콤의 행보에 시선이 집중되고 있다.

SK텔레콤은 지난해 인공지능 스피커 ‘누구’를 출시하며 기세를 올렸다. 네이버, 카카오와 같은 ICT 플랫폼 사업자보다 빠르며 삼성전자와 같은 거대 전자기업의 행보에도 앞서는 속도전이다. 지난 2012년부터 인공지능과 음성인식, 자연어 처리 엔진 등 선행 기술 개발에 집중한 결과라는 것이 SK텔레콤의 설명이다.

▲ SK텔레콤 누구. 출처=SK텔레콤

누구는 다양한 디바이스에 탑재할 수 있는 비서형 인공지능 서비스며 성장형 딥러닝 플랫폼을 표방하고 있다. 클라우드 기반 소프트웨어와 인공지능 플랫폼의 업그레이드만으로 새로운 기능을 추가할 수 있으며 다양한 콘텐츠 인프라와 빠른 연동이 가능한 것도 장점이다. 박일환 SK텔레콤 디바이스지원단장은 “과거 키보드에서 마우스로, 이후 터치로 입력방식이 진화하며 우리의 일상이 크게 변해 왔다”며 “누구를 시작으로 음성인식과 인공지능이 생활 전반을 획기적으로 바꿔가는 ‘인공지능 대중화 시대’를 열어가겠다”고 말했다.

KT는 기가지니로 맞불을 놓았다. IPTV 시장 1위의 명성답게 멀티미디어 인공지능 플랫폼의 방식을 음성인식 스피커로 끌어낸 지점이 새롭다는 평가다. 셋톱박스 형태의 인공지능 기기며 IPTV와 인공지능의 융합으로 TV와 연계해 홈 비서 기능을 제공하는 게 특징이다. TV와 음악 감상, 일정 관리, 교통 안내 등의 다양한 기능을 갖추고 있다. 임헌문 KT Mass총괄 사장은 “KT의 네트워크, 인공지능 기술, 빅데이터 역량이 집약된 기가지니는 가정의 모습을 혁신적으로 변화시킬 것으로 기대한다”며 “기가지니를 시작으로 고객들에게 차별화된 인공지능 서비스를 제공하기 위해 지속적으로 노력하겠다”고 말했다.

AI Tech Center(AI 테크센터) 등을 통한 연구개발을 통해 단순한 인공지능 스피커 이상의 경쟁력을 보여주겠다는 것이 KT의 포부다. 기가지니사업단도 출범하며 완전한 플랫폼 전략을 구비했다는 평가도 나온다. 실제로 KT는 AI 분야에서 전략 수립, 기술 개발 및 사업모델 발굴, 생태계 조성, 전문인력 양성 등 모든 프로세스를 장악할 수 있다는 설명이다. 현재 KT는 AI와 관련해 130여명의 전문인력을 보유하고 있으며 연내 50여명을 추가 채용해 인력 확충도 계획하고 있다.

▲ KT 기가지니. 출처=KT

KT 기가지니사업단장 이필재 전무는 “KT는 인공지능 분야에서 20년 가까이 기술 및 노하우를 축적했다”며, “인공지능 역량을 보다 구체화하기 위해 올해 초 AI테크센터를 출범한 데 이어 이번에 신설한 기가지니사업단을 중심으로 보다 다채로운 인공지능 서비스를 제공하겠다”고 말했다.

네이버는 라인을 바탕으로 인공지능 스피커 시장에 합류했다. 클로바 인공지능을 중심으로 삼아 인공지능 스피커 웨이브를 전격 공개했다. 이미 일본에서 초판에 돌입했으며 정식 출시는 가을로 잡혔다. 라인주식회사 마스다 준 CSMO는 “웨이브를 시작으로 인공지능 플랫폼 클로바를 일상생활 곳곳에서 체험할 수 있도록 할 것”이라면서 “고정된 기능만을 우선 선보이게 되었지만, 웨이브를 통해 음성 인식을 활용한 새로운 체험을 할 수 있을 것”이라 밝혔다.

네이버의 인공지능 기술력은 기술기반 플랫폼 전략의 핵심이다. 지난 6월 세계적인 인공지능 연구소인 ‘제록스리서치센터유럽(XRCE)’을 인수한 장면이 극적이다. 1993년 설립된 XRCE는 인공지능과 머신러닝을 비롯해 세계 최고 수준의 기술력을 보유한 곳으로 정평이 났다. 컴퓨터 비전과 자연어 처리 등 다양한 기술력을 보유하고 있는 것으로도 잘 알려졌다. 프랑스 그르노블 지역의 외곽에 위치했으며 대형 ICT 기업들이 탐내는 세계적인 인공지능 인재 80명이 포진해 있는 첨단기술연구센터다.

▲ 네이버 웨이브. 출처=네이버

네이버 송창현 CTO는 “XRCE는 세계적으로 주목받는 연구진들이 대거 포진한 제록스의 주요 연구소 중 한 곳으로 네이버의 미래기술 연구 방향과 동일한 방향성을 가지고 있다”며 “특히 컴퓨터 비전, 머신러닝, 자연어처리 등 인공지능 기술에 대한 XRCE의 연구 성과들이 네이버랩스가 주력하는 생활환경지능 기술 연구에 더해질 것”이라고 밝혔다.

카카오는 카카오미니 카드를 준비했다. 카카오의 인공지능 음성 인터페이스가 적용된 첫 기기다. 아직 정식으로 출시되지 않아 정확한 스펙을 유추하기 어렵지만 대체적인 그림은 나왔다는 평가다. 크기는 다른 기기들과 비교해 상대적으로 작지만 다양한 기술과 편의 기능을 갖춘 카카오 인공지능 스피커의 특징을 이름에 담았다는 설명이다.

카카오미니의 등장은 음성과 인공지능의 결합을 장기간 고민한 카카오의 인사이트가 주효했다는 평가가 나온다. 현재 카카오는 김범수 의장이 이끄는 카카오브레인과 사내 단독 인공지능 부서를 투톱으로 삼아 관련 스타트업을 대거 인수하는 상황이다.

여기에서 ‘뉴톤’에 집중할 필요가 있다. 카카오는 입력된 목소리를 문자로 변환해 음성 검색 서비스를 가능케 하는 음성 인식 엔진 뉴톤을 자체 개발하고 2014년 무료 API로 공개했기 때문이다. 같은 해 6월에는 입력된 문자를 음성으로 변환해 사람이 읽어주는 것처럼 자연스럽게 들려주는 음성 합성 엔진 ‘뉴톤 톡’을 개발하는 데 성공하기도 했다. 이러한 연구개발을 바탕으로 카카오미니가 등장을 예고했다는 것이 중론이다.

▲ 카카오미니. 출처=카카오

연예기획사로 유명한 SM엔터테인먼트도 인공지능 스피커 시장에 출사표를 던졌다. 올해 초 CES 2017에서 SK C&C와 협력해 ‘위드’를 공개했기 때문이다. ICT 기술력에 SM엔터테인먼트 소속 연예인들의 ‘콘텐츠’를 담아내는 방식이다.

이러한 전략은 SK텔레콤과 SM엔터테인먼트의 전격적인 협력으로 이어지기도 했다. 지난 7월17일 양사는 전략적 제휴와 상호 계열사에 대한 대규모 출자를 결정하며 사실상 몸을 섞었다. SK텔레콤은 음향기기 제조사인 아이리버와 드라마 예능 콘텐츠 제작사 SM C&C에 각각 250억원과 650억원 유상증자를 결정했으며 SM엔터테인먼트도 계열회사와 함께 아이리버와 SM C&C에 각각 400억원과 73억원 유상 증자를 결정했다.

이번 협약으로 SK텔레콤은 SM C&C의 2대 주주가 되고 SM도 아이리버의 2대 주주가 된다. 나아가 아이리버는 SM 계열회사인 SM모바일커뮤니케이션즈(SM MC)와 SM Life Design Co.(SM LDC)를 흡수해 콘텐츠 기반의 신규 사업을 추진한다는 계획이다. SM C&C는 SK플래닛의 광고 사업을 인수해 안정적인 수익기반을 강화하게 됐다. ICT 플랫폼과 콘텐츠의 만남이라는 측면에서 의미 있다는 평가다.