[이코노믹리뷰=최진홍 기자] 구글은 '왜' 바둑을 잘하는 인공지능 알파고를 만들었을까? 인공지능 스마트 스피커는 '왜' 사람 목소리를 닮으려 노력할까? 국내에서 챗봇은 '왜' 확실한 성공을 거두지 못하고 있을까? 영상 제작 유통 환경에서 인공지능은 '왜' 편집을 마지막 남은 엘도라도로 보고 있을까? 인공지능을 둘러싼 다양한 담론이 동시다발적으로 제기되며 다양한 궁금증도 커지는 가운데, 여기에 대한 재미있는 답변들이 나와 눈길을 끈다.

▲ SKT 누구 인공지능 밋업이 열리고 있다. 사진=최진홍 기자

구글은 왜 바둑을 잘 두는 인공지능 만들었을까?
SK텔레콤 트루이노베이션이 주최 및 주관한 '세상을 깨우는 AI, 누구입니까' 인공지능 누구 밋업이 19일 서울 역삼동 팁스홀에서 열린 가운데 정지훈 경희 사이버대학교 미디어영상홍보전공 교수는 구글 알파고 쇼크를 재조명했다.

정 교수는 구글 알파고의 등장을 마케팅적 측면으로 이해했다. 정 교수는 "구글이 왜 바둑을 잘 두는 인공지능 알파고를 공개했을까 생각해볼 필요가 있다"면서 "바둑을 잘 두는 인공지능은 일상생활에서 별 쓸모가 없다. 그럼에도 구글이 바둑 인공지능인 알파고를 공개한 것은 브랜드 마케팅을 한 것"이라고 말했다. 정 교수에 따르면 알파고가 등장했을 당시 많은 사람들은 인공지능이 '무한의 수'를 자랑하는 바둑에서 인간을 이길 수 없다고 봤다. 그러나 알파고는 보란듯이 승리했고, 이 자체로 엄청난 마케팅 효과를 누렸다.

정 교수는 "시대는 기술을 수용하는 주기가 있으며, 많은 기술들이 이 주기를 넘지 못하고 사라진다"면서 "반면 알파고는 일상생활의 바둑이라는 아이템을 바탕으로 많은 사람들의 예상을 뒤엎는 장면을 연출했고 강렬한 충격을 주는 것에 성공했다. 구글 딥마인드가 바둑이라는 키워드를 선택한 이유"라고 진단했다.

구글의 마케팅 전략은 여기서 멈추지 않는다. 정 교수는 "알파고 쇼크가 시작된 후 구글은 기다렸다는듯 자체 머신러닝 텐서플로우를 오픈소스로 풀었다. 알파고 쇼크를 목격한 기존 개발자들은 자연스럽게 텐서플로우에 합류했고 현재 세계 개발자 중 70%는 텐서플로우를 사용하는 것으로 추정된다"고 말했다. 결국 구글은 알파고의 강점을 어필할 무대로 바둑이라는 생활밀착형 키워드를 선택한 상태에서 '인간에게 열세일 것'이라는 대중의 예측을 부수며 신선함을 줬고, 이를 자사의 인공지능 생태계 강화로 끌어왔다는 뜻이다.

정 교수는 인공지능의 흐름을 키워드로 분류하기도 했다. 이미지와 번역 등으로 약간의 발전을 거듭하던 인공지능은 알파고 쇼크 후 급격한 관심을 받았고 현재 자연어 처리와 분석, 창조, 해석의 영역에서 활발한 행보를 보이고 있다.

정 교수는 자연어 처리와 분석에 있어 "솔직히 자연어 처리는 사람도 어렵다. 두 사람이 매끄럽게 대화를 나누는 것이 생각보다 쉬운 일이 아니다"면서 "인공지능이 이를 제대로 처리할 수 있다고 생각하는 것이 더 이상하다"고 말했다. 다만 최근 인공지능 업계에서 자연어 처리와 관련된 새로운 트렌드가 감지되고 있다는 평가다. 정 교수는 "지난해부터 인공지능 자연어 처리에 대한 판도가 변하고 있다"면서 "더 트랜스포머, 엘모 등 자연어 처리에 능숙함을 보여주는 사례들이 속속 등장하고 있다"고 말했다.

일론 머스크 테슬라 최고경영자(CEO) 등이 주도하는 오픈AI에도 주목했다. 정 교수는 "오픈AI의 벌트(BERT)는 인간 이상의 자연어 처리 능력을 보여주는 것으로 확인됐다"면서 "새로운 기술이라고 보기는 어렵고, 기존 기술의 업그레이드로 볼 수 있는데 수준 이상의 자연어 처리 기술을 보여줬다"고 평가했다. 정 교수는 이어 "벌트는 연구개발의 산물이라고 보기는 어렵고 방대한 데이터를 통해 구현한 것"이라면서 "이제 인공지능 역량은 엄청난 데이터를 가진 대기업이 주도하는 것이 아닐까라는 생각도 한다"고 부연했다. 벌트 이후에도 마이크로소프트의 빅버드 등 새로운 자연어 처리 기술은 지금 이 시간에도 속속 등장하고 있다.

인공지능의 창조 영역에서도 정 교수는 흥미로운 분석을 내놨다. 정 교수는 "사람들이 인공지능이 일자리를 빼앗을 것이라 우려하지만, 일각에서는 크리에이티브한 업무는 인공지능이 할 수 없다고 본다"면서 "그런데 최근 인공지능이 그림을 그리거나 소설을 쓰는 등 크리에이티브의 영역으로 빠르게 넘어오는 사례가 속속 발견된다"고 말했다. 모네의 화풍으로 모나리자를 재해석하거나, 인공지능 소설작가의 등장이 단적인 사례다.

이와 관련해서는 흥미로운 사례들이 많다.

글로벌 차량 온디맨드 플랫폼 우버의 소프트웨어 엔지니어인 필립 왕은 지난  2월 13일(현지시간) 인공지능 사진 사이트인 Thispersondoesnotexist(이사람은존재하지않는다)를 개설했다. 해당 사이트에 접속하면 인물 사진이 무작위로 등장하는데, 모두 인공지능이 생성한 가짜 이미지다. 구동 방식은 스타일 GAN(Style GAN, Generative Adversarial Network)로 가능하다. 가짜 이미지를 만드는 쪽과 이를 검증하는 쪽이 연속적으로 데이터를 제출, 검증하며 특정 이미지를 만들어내는 방식이다. 이를 바탕으로 현실세계에는 존재하지 않는 사람의 사진을 창조하는 셈이다. 인공지능의 창작 역량이다.

오픈AI의 GPT-2도 눈길을 끈다. GPT-2는 약간의 콘텐츠가 있으면 순식간에 이와 관련된 새로운 창작물을 만들어낸다. 소설은 물론 과제, 심지어 신문기사도 만든다는 후문이다. 창작자의 고민을 덜어주는 인공지능이지만, 해당 인공지능의 API가 공개라도 될 경우 소위 가짜뉴스 공장이 설립될 수 있다. 오픈AI는 이를 우려해 GPT-2의 API를 공개하지 않기로 했다. 물론 이러한 결과물들에 대한 이견은 있다. 정 교수는 "다소 과대포장된 감도 있다"면서 "아직은 인공지능과 인간의 콜라보에 더 관심을 기울여야 한다"고 말했다.

정 교수는 인공지능 해석에 대해서도 충분한 기능을 보여주고 있다고 설명했다. 다만 이를 현실 비즈니스로 풀어내는 일은 다양한 난관이 있다는 점도 부연했다. 정 교수는 로보틱스 연구자들이 실제 현장에서 의미있는 데이터를 얻기 어렵고, 실제와 가까운 실험환경을 구축하기도 어렵다면서 "이를 극복하기 위한 다양한 노력들이 이어지고 있다"고 설명했다.

정 교수의 인공지능 발전 로드맵도 재미있다. 정 교수는 크게 4단계로 인공지능 발전 단계를 설명했다. 그는 "딥러닝이 처음 발표됐으나 아무도 믿지 않았고, 소수의 연구자들만 연구해 이를 발전시킨 것이 1단계라면 기술이 증명되고 연구자들이 많아진 것이 2단계다. 여기까지가 알파고 쇼크"라고 설명했다. 그는 이어 "기업들이 인공지능에 투자를 하고 다양한 연구개발이 벌어지는 것이 3단계라면, 투자를 단행한 기업이 인공지능을 실제 비즈니스를 원하는 것이 4단계"라고 말했다. 이러한 과정을 통해 인공지능을 인터넷처럼 누구나 쉽게 활용할 수 있는 시대가 올 것이며, 우리는 인공지능 자체를 개발하는 것이 아니라 인공지능을 어떻게 활용해야 하는가에 집중해야 한다고 역설했다.

▲ Thispersondoesnotexist(이사람은존재하지않는다) 이미지. 출처=갈무리

인공지능 스피커 목소리는 왜 사람과 닮으려 할까?
SK텔레콤의 누구를 비롯해 KT의 기가지니, 카카오의 카카오미니와 네이버의 웨이브 등 인공지능 스피커는 모두 사람의 목소리와 닮은 음성 인터페이스를 제공한다. 유명 연예인의 목소리가 탑재되거나, 심지어 카카오미니는 업데이트를 통해 반말을 하기도 한다. 모두 거부감없는 서비스를 위한 포석이라는 평가가 나온다.

여기서 한 발 더 나아갈 필요가 있다. 신윤호 SK텔레콤 AI사업 유닛 셀 리더는 밋업 현장에서 아이들의 인공지능 스피커 명령어 패턴 일부를 공개했다. 많은 아이들이 누구를 통해 쉽게 인공지능 음성 인터페이스 서비스를 즐기는 가운데, 아이들이 인공지능을 의인화시키는 장면이 새롭다. 마치 말을 걸듯이, 친구에게 말하듯 "너 미워 할거야' '착하네' 등등의 말을 건다는 뜻이다.

인공지능 스피커의 음성이 인간과 기기의 친밀성을 담보하고, 이를 통해 거부감없는 서비스 구현 이상의 가치를 보여줄 수 있다는 평가다. 신 리더는 이를 설명하기 위해 EBS의 프로그램 일부를 공유했다. 해당 프로그램에는 인공지능 스피커를 일정기간 사용한 사람이 전기 충격을 통해 인공지능에 '아픔'을 주는 실험에 참여한다. 그리고 많은 이들은 인공지능에 아픔을 주는 것을 포기한다. 심지어 인공지능이 무엇인지 확고하게 인식하고 있는 개발자도 동일하게 인공지능에 대한 연민을 느낀다.

신 리더는 "각 인공지능 스피커들이 사람과 닮은 목소리를 내는 것은 기기의 연결성과 큰 관련이 있다"면서 "기업은 이에 착안해 데이터를 꾸준히 추구하며 인간이 인공지능에 애착을 느끼게 만들고, 그 뒤로 실생활에 필요한 서비스를 제공하는 방식으로 나가야 한다"고 말했다.

신 리더는 국내 최고 인공지능 스피커로 자리매김한 누구의 성과를 설명하면서도 나름의 고민도 토로했다. 바로 연결성이다. 신 리더는 "인공지능은 스마트홈을 거치며 생활플랫폼으로 발전할 것"이라면서 "문제는 현재 고객들이 다른 기업의 기기들을 사용함에 따라 서로 호환이 어렵다는 점에 있다. 통신사들은 이 문제에서 다소 자유롭지만 고객이 일일히 계정을 따로 만들어야 하는 것은 피할 수 없기 때문에 이 문제를 해결하기 위한 고민이 있다"고 말했다.

냉장고는 LG전자를 사용하고 세탁기는 위니아 등을 사용한다고 가정하면, 이들을 하나의 사용자 경험으로 묶어내는 것은 불가능하다. 통신사들은 이 과정에서 네트워크로 느슨한 연대를 만들 수 있으나, 이 역시 고객이 번거러운 작업을 해야 하기 때문에 문제가 발생한다는 뜻이다.

신 리더는 통신사의 스마트홈이 비전을 가질 수 밖에 없는 이유도 강조했다. 신 리더는 "통신사들은 전화기나 IPTV 등 고객과 직접 만날 수 있는 창구가 있으며, 고객을 직접 찾아갈 수 있다"면서 "포털은 인터넷 콘텐츠가 강하지만 이들의 플랫폼은 고객을 찾아가는 것이 아니라 찾아오게 만드는 것이다. 이 과정에서 약점이 있다"고 진단했다.

▲ 인공지능 스피커 누구가 가동되고 있다. 사진=임형택 기자

국내 챗봇은 왜 성공하지 못할까?
조원규 스켈터랩스 대표는 챗봇이라는 키워드를 꺼냈다.

그가 이끄는 스켈터랩스는 총 인원 60여명 중 45명 이상이 엔지니어와 리서치에서 활약하는 등 작지만 강한 인공지능 기술 기업으로 평가된다. 새롬기술 CTO와 다이얼패드 CTO, 구글코리아 연구개발 총괄 사장을 역임한 조원규 대표를 중심으로 역시 새롬기술과 다이얼패드에서 일했던 안현덕 COO를 비롯해 구글코리아에서 시니어 소프트웨어 엔지니어로 활동했던 조성진 CTO가 주축을 맡고 있다. 여기에 포스트닥 연구원, 연세대학교 컴퓨터 공학 교수인 조성배 CRO와 구글 코리아, 롯데쇼핑에서 일했던 최원준 CPO도 활동하고 있다.

스켈터랩스는 2015년 11월 설립되어 카카오, 스톤브릿지 벤처스, 롯데홈쇼핑 등으로부터 다수의 투자를 받았으며 SK텔레콤 5G 스마트팩토리 얼라이언스에도 참여하고 있다. 대화엔진과 결함 검출엔진 개발을 완료했고 그 외 대화, 비전, 딥러닝 등 다양한 인공지능 기술을 개발하고 있다.

국내 ICT 업계에서 차지하는 비중이 큰 조 대표는 밋업을 통해 국내에서 챗봇으로 제대로 된 성공을 거둔 사례가 없다고 단언했다.

그는 "대화형 인공지능의 대명사는 챗봇"이라면서 "아직 국내 챗봇 시장은 초기임에도 벌써부터 가격 경쟁이 치열하다"고 말했다. 시장이 맴도는 이유로는 홍보 효과를 노린 무리한 챗봇 도입을 지적했다. 그는 "기업들이 챗봇을 한다고 말하지만 실제 성공한 사례는 없고, 결국 홍보 효과를 노리려는 것 아닌지 의심이 된다"고 말했다.

그는 진짜 시장을 열어야 한다고 역설했다. 조 대표는 "가치를 만드는 일이 중요하다"면서 "애플의 초기 아이폰이 신기술이 아닌, 새로운 사용자 경험 창출을 통해 성공한 사례처럼 진짜 시장을 여는 노력이 필요하다"고 역설했다. 그는 마지막으로 "대기업은 방대한 데이터와 비즈니스 노하우를 가지고 있고 스타트업 테크 기업은 기술을 가지고 있다"면서 "양측 모두 완벽하지 않기 때문에 조화로운 협업을 바탕으로 새로운 가능성을 타진하는 방향성이 중요하다고 본다"고 말했다.

▲ 인공지능의 비전에 시선이 집중된다. 출처=갈무리

인공지능은 왜 동영상 편집에 뛰어들었나
보이저엑스는 기존 타임라인 방식의 동영상 편집이 아닌, 인공지능을 통해 음성을 텍스트로 변경해 보여주는 한편 자동으로 문단을 설정해주는 툴을 제공한다. 여기에 집중한 특별한 이유가 있을까?

장재화 보이저엑스 리더는 "영상과 방송 인프라는 엄청난 비용이 들어가는 사업이었지만 최근은 스마트폰과 유튜브의 등장으로 진입장벽이 낮아지고 있다"면서 "촬영은 스마트폰으로, 유통은 유튜브로 가능한 시대"라고 말했다.

마지막으로 남은 것이 동영상 편집이다. 장 리더는 "100년전 24개의 프레임을 자르거나 붙이는 방식으로 편집했고, 50년이 흘러야 비선형 등 편집이 가능해진 것이 현 상황"이라면서 "영상과 방송 인프라 영역에서 촬영과 유통에 대한 비용 절감은 획기적으로 이뤄졌으나 편집은 아직도 타임라인 방식에 매몰되어 있다. 보이저엑스가 여기에 주목한 이유"라고 말했다.

보이저엑스의 등장으로 동영상 편집의 단순반복작업 80%가 사라졌다는 설명이다. 그는 "지금까지는 기술이 발전하지 않아 사람이 도구에 다가갔으나, 이제는 좋은 기술을 바탕으로 도구가 사람에게 오는 시대"라고 말했다. 추후 보이저엑스는 사운드 변경과 진화된 크로마키 기술 등으로 영역을 확장할 방침이다.

한편 이번 밋업을 통해 SK텔레콤의 트루이노베이션과 누구 플레이 개발 공모전에도 시선이 집중되고 있다. 트루이노베이션은 SK텔레콤의 오픈콜라보센터가 지난해 2월 시작한 스타트업 지원 육성 프로그램이며, 누구 플레이 개발 공모전은 인공지능 누구 플랫폼과 관련된 다양한 아이디어를 공유하는 자리다. 최대 1000만원의 상금이 마련됐다.