KT가 지난 17일 기가 지니를 출시했습니다. TV 연동, 카메라 내장으로 ‘시청각’ 기반의 인공지능 서비스를 제공하며 인공지능 TV를 표방합니다. 색상은 ‘블랙’, ‘레드’, ‘화이트’ 3가지며 올레TV 가입자는 기존 셋톱박스를 기가 지니로 교체 가입해 사용할 수 있다고 합니다. 다만 비용은 약간 더 들어갑니다.서비스는 크게 4가지 분야입니다. 올레TV, 지니뮤직 등과 연동되는 미디어 서비스와 일정관리와 일상생활을 돕는 AI 홈 비서 서비스, 각종 홈 IoT 기기를 제어하는 홈 IoT 허브 서비스,  음성 및 영상통화 기능을 제공하는 커뮤니케이션 서비스로 분류됩니다.

 

기가 지니의 등장은 KT가 생각하는 스마트홈의 미래와, 원하는 것과, 미래 방향성을 잘 보여줍니다. 결론부터 말하자면 스마트홈의 중심을 TV로 설정하고 쉬운 길을 갔어요. 물론 KT는 '쉽지만 승산이 높다'는 생각을 했을 것으로 보입니다.

음성인식 기반 인공지능 스피커의 등장이 파도처럼 밀려오는 상황에서 IPTV 기반의 기가 지니를 런칭한 배경부터 보겠습니다. 스피커는 음성을 인식해 작동하는 피드백 전개 방법론인데, 기가 지니는 디스플레이적 측면의 시각적 요소가 강하게 들어갑니다. 왜 대세를 따르지 않았을까요?

먼저 음성인식 기반 인공지능 스피커의 강점을 살펴야 합니다. 아마존의 알렉사, 구글홈 등이 나오는 이유는 무엇일까? 일단 인공지능에 유리하기 때문입니다. 아주 간단한겁니다. 스피커는 대부분 거실이나 방에 배치됩니다. 그리고 우리의 삶을 효과적으로 엿보고 있어요. 정확히 말하면 엿듣는 겁니다.

무슨 말이냐면, 인공지능 스피커는 생활속에서 발생하는 다양한 음성 데이터를 무리없이 소화할 수 있는 최적의 조건을 가지고 있으며, 빠르게 빅데이터로 수렴할 수 있다는 겁니다. 비정형 데이터의 가치를 구분하는 기술이 고도화될수록 이러한 강점은 더욱 선명해집니다. 인공지능 스피커는 인간의 기본적인 피드백 방식인 음성을 활용해 빠르게 똑똑해질 수 있습니다.

스마트홈 시장이 나름의 비즈니스 모델을 구축할 정도로 발전하고 있으나 아직 확실한 킬러 플랫폼이 없는 상태에서, 음성인식 스피커는 자연스럽게 메인으로 부상할 수 있는 여지도 있어요. 기본적으로 음성은 인간의 기본적인 피드백 방식. 생활밀착형에 가장 가까운 수단을 이용합니다. 나아가 포스트 스마트폰을 찾으며 팔아치울 상품이 필요한 기업 입장에서는 스피커만큼 유용한 것이 없어요. 

기존 텍스트 중심의 피드백과 비교해도 인공지능 스피커는 편리합니다. 이 또한 음성이라는 원초적인 수단을 활용하기 때문이에요.

자, 여기에서 기가 지니를 보겠습니다. 기가 지니는 인공지능 스피커와 다르게, 아니 정확하게 말하면 한 가지 기능이 더 추가된 방식입니다. 바로 시각적 강점을 잡았죠. 왜 그랬을까요? 단순하게 생각하면 IPTV 1위 사업자인 KT의 당연한 사업논리를 들 수 있습니다. 깔려있는 셋톱이 몇 개 입니까. 저변확대에 있어 바닥부터 시작해야 하는 스피커 시장보다 유리합니다.

▲ 출처=KT

이런 전제에 '음성+시각을 더하면 더 좋아지지 않을까?'가 KT의 복안으로 보입니다. 자연스럽게 KT의 스마트홈 허브는 TV가 되며, 강점을 가진 미디어 플랫폼에 콘텐츠 서드파티를 다수 빨아들여 비즈니스 고도화에 나설 전망입니다. 그러니까 음성인식 기반 인공지능 스피커의 강점을 체화하면서도 그 이상의 시너지를 내세우고, 나아가 미디어 산업의 강자임을 적절하게 활용한 '쉬운 길'입니다.

어떨까요. 뭐 고무적입니다. 음성인식 및 기술적 부분은 모두 차치해도 리스크가 다소 보입니다. 먼저 음성에 이어 시각적 방식을 더하는 스마트홈 전략은 아직 음성기반 시장도 시장의 선택을 받지 못한 상태에서 아이러니하게 위험해 보입니다. 이러한 위험은 타격을 고민하는 것이 아니라, 마케팅적 수사에 그칠 위기를 말하는 겁니다. 거듭 강조하지만 KT는 TV를 선택하며 일종의 안전판을 깔았거든요.

하지만 제일 걱정은 '그래서, 뭐가 더 좋은데?'라는 질문입니다. 기가 지니의 방식은 스마트홈과 맞물리며 기능을 더욱 늘리겠지만, 이를 관통하는 비즈니스 모델이 부족해 보입니다. TV까지 왔으면 이를 관통하는 인공지능 생태계의 단서도 달려야 하거든요. 최초의 인공지능 스피커가 왜 전자상거래 기업의 아마존이겠습니까? 습관적이고 원초적인 목소리야말로 스키너의 상자를 방불케하는 아마존 전자상거래 락인 효과를 담보한다고 봤기 때문입니다.

기가 지니는 이러한 락인을 보여줄 수 있을까요? 오히려 TV라는 패러다임이 붙어버려 그 이상의 가치를 보여주기 어렵지 않을까요? 음성과 시각의 만남은 오히려 음성 본연의 가치에 족쇄가 될 수 있습니다. 최악의 경우 기가 지니가 역사속으로 사라진 '음성 명령 기능이 탑재된 TV 리모컨'의 역사를 밟을 가능성도 있습니다.

▲ 출처=KT

만약 그렇게 되면 대안이 있나요? 아마존은 자사 전자상거래 시장의 진입을 꾀하는 방식으로 쓰이고, 구글홈은 방대한 구글월드의 초입으로 빨아들이는 매개체입니다. 기가 지니는요? IPTV 편하게 보고 다양한 생활정보를 음성과 시각으로 피드백 받는다? KT라는 생태계 중심이 잘 보이지 않습니다.

인공지능 스피커들이 음성에 기반을 두는 것은 편리하고 익숙하며, 기업 중심의 생태계를 빠르게 구축할 수 있기 때문입니다. 기가 지니는 여기에 시각을 더했습니다. 기술적 고도화와는 별개로 시각을 더해 TV를 스마트홈의 허브로 삼는 전략을 천천히 돌아보는 한편, 왜 음성이었는지도 따져볼 필요가 있어 보입니다.