▲ 출처=이코노믹리뷰 DB.

인공지능과 스피커의 만남은 어떤 의미를 가질까? 나아가 인공지능 스피커가 각 사업자에게 어떤 영향을 미칠 수 있을까? 실제 개발에 참여한 국내 인공지능 스피커 전문가들을 만나보자.

 

[SK텔레콤 누구(NUGU) 팀]

-누구에 대한 소개 : 친구와 연인, 가족과 비서 등 고객이 원하는 ‘누구’라도 될 수 있다는 의미를 가진 누구(NUGU)는 고객이 전용기기에 대화하듯 말하면 음성인식 기술을 통해 원하는 바를 파악해 수행하는 음성인식 인공지능 기기라고 보면 된다. 2016년 9월 출시 초기에는 음악 감상(멜론)과 스마트홈, 스케줄 등 생활 편의형 서비스를 중심으로 시작했으나 지금은 꾸준한 업그레이드를 통해 커머스(11번가)와 IPTV(B tv), 교통정보(T맵) 등 25여 가지의 생활밀착형 서비스를 제공하고 있다.

-강점은 무엇인가 : 국내 기준으로 보면 상대적으로 빠르게 인공지능 스피커 시장에 진출했다. 덕분에 저변이 넓다. 누구는 6월 기준 14만대의 판매고를 올리며 스마트폰과 스마트워치에 이어 국내 통신 시장에서 가장 많이 팔리는 3대 스마트 디바이스로 자리매김했다.

-SK텔레콤과의 협업 시너지는 무엇인가 : 누구는 단순한 스피커가 아니다. 독자 개발한 인공지능 엔진과 이를 처리할 수 있는 클라우드 서버까지 포함하는 토털 인공지능 서비스다. 앞으로 SK텔레콤은 누구를 통해 금융, 건설과 유통 등 이종산업 간의 융합을 비롯해 API 개방을 통한 중소벤처 협업 시스템을 구축해 ‘국내 1위 인공지능 기반 통합 서비스 허브(Hub)’의 위상을 노릴 계획이다. 나아가 계열사 간 인공지능 역량 결집을 위한 노력도 하고 있다. SK그룹 차원의 역량 모으기다. SK C&C, SK플래닛 등 SK 계열사의 역량을 결집해 누구를 진화시키고 있으며 2월에는 MWC 2017에서 음성인식 인공지능 서비스 누구와 왓슨 기반의 SK C&C 에이브릴을 연동, 일상적 영어 대화 기능을 시연하기도 했다. SK텔레콤은 인공지능 사업의 시너지를 내기 위해 기술 확보와 서비스 기획 및 개발, 사업 확대 담당 조직을 하나로 합친 ‘AI 사업단’을 4월 발족했다. 여기에 다양한 사업 확장 가능성도 고려하고 있다.

-누구 개발 과정에서 가장 공을 들인 부분은? : 지난 2012년부터 인공지능과 음성인식, 자연어 처리 엔진 등 선행 기술 개발에 집중했다. 이를 통해 누구의 한국어 특화 음성 인식 기술은 목소리 톤, 억양, 사투리까지 알아들을 수 있는 국내 최고 수준의 음성 인식률을 자랑한다. 또 SK텔레콤이 독자 개발한 ‘자연어 처리 엔진’을 적용, 일상에서 대화하듯 편하게 얘기해도 ‘누구’의 인공지능이 맥락을 빠르게 파악해 기능을 수행할 수 있다. 클라우드 기반 소프트웨어 및 인공지능 플랫폼의 업그레이드만으로 새로운 기능을 추가할 수 있다는 점도 중요하다.

-앞으로 누구로 보여줄 수 있는 미래는? : SK텔레콤은 고객 생활 가치 제고를 목표로 인공지능 서비스 생태계를 조성하는 데 매진할 계획이다. 또 품질 경쟁력과 제공 서비스 확대를 통해 진정한 ‘삶의 동반자(Life Companion)’가 되도록 지속 노력할 것이다. 현재 누구와 고객 간 대화 내용은 출시 초기에는 음악 감상에 집중돼 있었지만, 분기마다 시행된 서비스 확대와 맞물려 다양한 생활편의 서비스 이용 비중이 늘어가는 추세다. 이 같은 추세는 더욱 확대될 전망이다. 물론 음악 감상에 있어서도 단순한 스피커 기능이 아닌 고객의 취향이나 분위기에 맞는 음악을 선곡하고 구연동화 등 어린이 콘텐츠는 아이의 학습능력을 길러주는 새로운 육아 도우미로 각광받고 있다. 다양한 서비스를 고민하는 중이다.

[KT 융합기술원 AI 서비스개발 프로젝트 권순종 팀장]

 

-기가지니에 대한 소개 : 기가지니는 가정에서 이용하는 다양한 통신 및 방송 서비스에 인공지능 기술을 접목한 홈 비서 서비스다. 쉽게 말하자면 기가지니는 IPTV, 음성 및 영상통화, 홈캠, 스피커 등이 하나의 단말에서 제공되는 홈 융합형 서비스로 볼 수 있다. 가족생활의 중심인 TV와 연계해 시청각 기반의 인공지능 홈 비서 기능을 제공한다.

-기가지니가 가장 잘할 수 있는 것은? : 기가지니에는 KT의 주력 서비스들이 모두 결합되어 있다. 비단 스피커를 넘어 카메라 내장 및 TV 연동으로 시청각 기반의 인공지능 서비스를 제공할 수 있다. 이러한 기능들이 TV와 연동되어 많은 기능을 지원한다. 예를 들어 음성으로 명령을 하면 TV 화면으로 실행 여부를 확인할 수 있어 보다 직관적으로 이용할 수 있다는 뜻이다. 또 이용자의 대화에 따라 TV 화면에 캐릭터의 표정과 동작 등이 달라지도록 했으며, 이용자의 얼굴을 따라가면서 인물을 중심으로 영상을 담아 통화할 수 있는 선명한 화질의 영상통화 기능도 제공하고 있다. 디테일한 부분도 신경을 썼다. TV 이용을 위해 리모컨을 찾는 경우가 많은데, 리모컨 없이도 음성을 통해서 원하는 방송을 볼 수 있고 보고 싶은 영화를 검색할 수 있는 장점이 있다. 그뿐만 아니라 감상 중인 음악에 대한 가수 정보, 곡 정보 및 노래 가사를 TV를 통해 볼 수 있기 때문에 이용자들의 만족도가 매우 높은 편이다. 오디오 분야에서 세계적 수준을 인정받고 있는 ‘하만카돈’과 협력해 총 35W의 고출력 사운드를 제공하며, 풍부하고 선명한 음질도 자랑거리다.

-기가지니의 등장으로 KT의 인공지능 전략이 달라질 것 같다 : 인공지능은 집에서뿐만 아니라 사무실, 차량, 아파트, 상점 등 다양한 분야에 인공지능 기술과 서비스를 접목한 영역 확장을 해 고객의 모든 생활에 적용될 것으로 예상한다. 이를 위해 전방위적으로 인공지능 기술의 개발 및 사업제휴를 통해 인공지능 생태계 조성을 위해 노력하고 있다.

-기가지니 개발 당시 가장 큰 공을 들인 부분은? : 진정한 홈 비서로서의 역할을 하기 위해 가정에서 이용하는 다양한 서비스를 기가지니에 담는 것에 집중했다. 기존에는 IPTV 시청을 위해 셋톱박스가 필요하고 통화를 위해서는 유선전화기 또는 인터넷 전화기가 필요하며, 가정에서 음악을 들으려면 음향 기기가 필요했다. 또 외출한다거나 장시간 집을 비울 때 아무도 없는 집이 걱정될 때 집안의 상황을 실시간으로 체크하기 위해서는 홈캠을 별도로 설치해야 했다. 하지만 기가지니는 이러한 다양한 기능을 종합적으로 하나의 기기에 자연스럽게 녹아들게 만들면서도 자연스러운 대화명령을 통해서 이용할 수 있도록 개발했다. 지구상의 현존하는 어느 인공지능 기기도 기가지니와 같은 기능과 서비스를 보유한 것은 없다고 자부한다.

-기가지니로 뭘 하고 싶은가? : 금융, 아파트, 커머스 등 다양한 영역에 인공지능 서비스를 적용해 제공할 예정이다. 예를 들어보겠다. 금융 서비스로 음성인식을 이용해 주가 및 지수 조회, 국내외 시황정보 등 주식정보 서비스는 제공하고 있다. 여기에 금융, 증권사와 협력을 통해 비대면 계좌 개설, 계좌조회, 간편송금 등을 음성으로 처리할 수 있는 서비스를 계획 중이다. 나아가 아파트 주거 환경에 인공지능 서비스인 기가지니와 홈 사물인터넷 기술을 접목한 ‘기가지니 아파트’도 제공할 예정이다. 음성명령을 통해 집안 곳곳의 상태를 한눈에 살펴보고 제어할 수 있으며 외출 시에도 집의 안전을 지켜준다. 집 미세먼지, 유해가스, 공기오염을 감지해 집을 깨끗하게 관리할 수 있을 뿐 아니라 효율적인 집안 에너지 관리도 가능하게 된다.

-기가지니 하면 역시 멀티미디어가 강점 아닌가? : 기가지니는 음성 기반의 인공지능 서비스다. 여기에 TV 화면을 사용할 수 있다는 장점을 가지고 있다. 기가지니는 앞에서 언급한 바와 같이 셋톱박스의 기능도 제공하고 있어 IPTV를 이용할 수 있다. 이용자가 영상 속에 들어가는 가상 출연 기술인 하이퍼 가상현실 서비스 ‘TV쏙’과 같이 기존 IPTV에서의 모든 서비스를 기가지니에서 이용할 수 있다. 음악 감상은 물론 라디오 청취 및 뉴스 속보 등도 시청할 수 있다. 나아가 음성을 통해 선호하는 음악을 들을 수 있고, 재생 중인 음악에 대한 정보를 TV를 통해 확인할 수 있다.

 

 

[네이버 라인 웨이브 팀]

-웨이브에 대한 소개 : 웨이브는 네이버와 라인이 공동으로 개발 중인 인공지능 플랫폼 ‘클로바’를 탑재한 인공지능 스피커다. 국내에서도 올해 여름 출시될 예정이다. 일본에서는 지난 7월 14일, 예약판매를 시작한 이후 5일 만에 준비한 물량 예약이 모두 완료될 정도로 인기가 높은 편이다.

-웨이브를 포함한 네이버, 라인의 전체 인공지능 그림이 궁금하다 : 네이버의 기반 기술 차원에서 인공지능 관련 연구 및 인력 확보에 적극적으로 나서고 있다. 네이버는 인공지능을 검색, 쇼핑과 같은 별도의 사업분야로 규정하는 것은 아니다. 네이버가 인공지능 인력을 확보하고 기술을 고도화하는 것이 네이버 기술 플랫폼 자체의 경쟁력이 될 것이라 믿고 있다. 다른 측면에서의 그림도 있다. 네이버는 인공지능 기술을 네이버 키보드를 만들고 이미지 검색 기술을 개선하거나, 스피커를 통해 상품 예약 주문의 편의성을 제공하는 등 지금까지 하고 있던 사업의 방식에 덧대는 한편 사용자의 사용 편의성을 적극 개선하는 데 사용하고 있다. 인공지능은 핵심 키워드다. 글로벌 기업과의 경쟁이나 네이버 이후의 발전을 위해서도 상당히 중요한 기반기술이라 생각하고 있다.

-클로바 말고 웨이브에 한정해서, 개발 당시 가장 공을 들인 지점은? : 더욱 나은 음질을 제공하기 위해 저음용 20W 우퍼 1개, 고음용 5W 트위터 2개를 탑재하고 전체 범위의 스테레오 사운드를 즐길 수 있게 했다. 음성 인식에 관해서도 고품질 마이크를 탑재, 높은 노이즈 캔슬링 기술을 구현함으로써 5m 정도 떨어진 거리에서도 음성을 인식할 수 있도록 했다. 그리고 배터리도 탑재하고 있기 때문에 거실이나 침실 등 다양한 장소에서 이동할 수 있게 만든다. 블루투스 지원으로 연동성도 신경을 썼다.

-웨이브로 뭘 하고 싶은가? : 네이버의 인공지능은 클로바며, 웨이브가 네이버 인공지능 전략의 모든 것은 아니다. 다만 인공지능이 네이버의 다양한 서비스와 결합되면, 생활환경에 밀접하고 특히 개인별 특수 상황에도 가장 적합한 정보를 더욱 편리하게 전달할 수 있게 될 것으로 생각한다.

[카카오 이석영 AI TF장]

 

-카카오미니에 대한 소개 : 카카오의 최신 인공지능 기술 플랫폼인 ‘카카오 I(아이)’가 적용된 전용기기다. 멜론을 통한 음악감상이나 카카오톡, 다음 등 카카오의 여러 서비스를 음성대화를 통해 이용할 수 있는 비서 같은 스마트 스피커를 표방한다.

-카카오미니가 집중한 곳은 어디인가? : 먼저 강력한 콘텐츠 기능이다. 멜론, 다음 등 카카오가 가진 강력한 콘텐츠를 시각이나 터치에 의존하지 않고도 음성 인터페이스를 통해 매우 편하고 빠르게 접근해 이용할 수가 있다. 여기에 생활 편의 서비스가 추가된다. 카카오톡, 카카오택시 등 카카오의 독보적이고 편리한 서비스와 기능을 비롯해 카카오톡과 연계된 장보기, 선물하기, 주문하기, 예약하기 등 다양한 서비스를 제공할 예정이다. 마지막으로 확장성이다. 카카오가 가진 플랫폼 노하우를 발휘해 수많은 파트너들과 인공지능 생태계를 구축해 활용할 수 있는 서비스를 더욱 확대해나갈 예정이다. 또한 다른 기기에서도 카카오 인공지능 서비스들을 만날 수 있도록 협업해나갈 생각이다.

-카카오미니와 카카오 생태계의 시너지가 궁금하다 : PC나 스마트폰에 더해 카카오 서비스들에 접근할 수 있는 새로운 디바이스가 생겨나는 것으로 이해하면 편하다. 여기에 음성 인터페이스의 편리함까지 결합되면서 이용자의 편의성을 더 높일 수 있을 것이다.

-카카오미니 개발 당시 어디에 공을 들였나? : 누구나 쉽고 저렴하게 이용할 수 있어야 하면서도 가정과 사무실은 물론 어떠한 환경에도 잘 어울리는 모습을 갖춰야 하는 점을 고려했다. 그 결과 디자인 설계에도 집중했다. 나아가 카카오가 가진 서비스와 콘텐츠 자산들을 카카오미니를 통해 잘 전달될 수 있도록 하고 향후 수많은 파트너사가 가진 역량들을 묶어줄 수 있는 통합된 기반플랫폼을 만드는 데 보이지 않는 투자를 많이 하고 있다.

-카카오미니가 보여줄 미래는? : 카카오미니는 물론 카카오의 플랫폼인 카카오 I가 탑재되는 모든 기기에서 모든 콘텐츠나 서비스를 소비하고 이용할 수 있도록 만들 것이다. 사람과의 다양한 대화가 매우 자연스럽게 구현되는 시대가 수년 내 가능할 것으로 보고 있다. 새로운 연결을 통해 이용자들에게 편리함을 제공한다는 카카오의 가치는 미래에도 바뀌지 않을 것이라고 확신한다.