영화 <아이언맨>에 등장하는 인공지능 쟈비스(JAVIS)는 주인공 토니 스탁이 가는 곳마다 동행하여 토니의 명령에 따라서 문제를 해결해 준다. 홀로그램으로 나타나기도 하고 컴퓨터이기도 하며 아이언맨이 입고 있는 로봇이기도 하다. 앞으로 누구나 이와 비슷한 인공지능을 가상 도우미로 채용할 날이 머지않았다. 개인적으로 휴대하며 크고 작은 일들을 상의하고 잔일을 시킬 수 있는 일종의 가상 개인비서 역할이다.

인공지능의 초창기 모델은 웹에서 컴퓨터와 문장 대화를 나누는 챗봇(Chatbot)이다. 지금도 많은 기업들이 웹을 방문하는 고객들에게 제공하는 서비스다. 인텔리레스폰스(Intelliresponse)나 버츄오즈(Virtuoz) 등이 제공하는 자연어 대화 모델을 웹에 설치하면 컴퓨터와 채팅이 가능하고 물품 검색과 구매 그리고 각종 정보 검색을 서비스할 수 있다. 이보다 한 단계 더 발전된 형식은 대화체 음성 입력 방식이다. 모바일 장비가 등장하면서 이는 매우 중요한 기술이 되었다. 가장 중요한 점은 조금 애매하게 말한다 해도 컴퓨터가 알아듣고 적절하게 대응하는 기술이다. 문장의 앞뒤 문맥을 살펴서 단어의 의미를 정확하게 포착하는 능력이 필요하다. 이런 능력을 ‘문장의 맥락을 이해한다’고 말한다. 단어보다 문장의 맥락을 이해해서 상대방의 말을 이해할 수 있어야 제대로 대응할 수 있기 때문이다.

초기 모델로 스마트폰에서 가상비서 검색 서비스를 제공하는 애플의 시리(Siri), 마이크로소프트의 코타나(Cortana), 구글의 구글 나우(Google Now) 등이 있다. 최근에는 비즈니스 업무를 대상으로 시맨틱(Semantic) 즉, 문장의 의미를 검색하여 다양한 가상 도우미 서비스를 제공하는 인공지능 플랫폼으로 인벤타(Inbenta)가 있다.

 

가정용 가상 도우미가 인기를 끌고 있다

홈오토메이션 관점에서 주목을 받고 있는 대화형 인공지능 도우미로 아마존의 에코(Echo)가 있다. 2015년 6월에 출시하여 일 년도 채 안 되는 기간 동안에 300만대 이상이 팔릴 정도로 시장에서 인정받고 있다. 작은 원통형 스피커 모양의 에코는 내부에 알렉사(Alexa)라는 인공지능이 삽입되어 있어서 가정용 도우미 역할을 한다. 알렉사는 음성을 문서로 전환해 주는 클라우드 기반의 얍(Yap) 소프트웨어, 문장으로 된 질문의 맥락을 이해하고 지식을 검색해주는 검색엔진 에비(Evi), 그리고 에비가 찾아낸 답을 다국적 음성언어로 읽어주는 아이보나(Ivona)가 결합된 인공지능이다. 아마존 클라우드에 있는 모든 정보를 검색해서 질문에 답해준다. 뉴스, 날씨, 시간 등은 물론이고 상품 구매 정보, 간단한 단어나 의미 검색도 가능하다. 홈 네트워크와 연결하면 가전기기들을 자유롭게 말로 제어할 수 있다. 손재주가 있으면 아마존 홈페이지에서 알렉사 API를 무료로 다운받아서 라즈베리 파이(Raspberry Pi)에 이식하면 DIY형 알렉사가 된다. 구글도 이와 비슷한 인공지능 도우미 상품으로 첩(Chirp)을 개발하여 시장에 내놓을 예정이다.

 

데이터 해석이나 학습기술만으로는 부족하다

일반적으로 인공지능은 빅 데이터를 고속 처리하여 해석하며 인지하는 기술이라고 인식하고 있지만 데이터 해석을 위한 인공지능은 빙산의 일각이다. 인공지능은 크게 세 가지 영역으로 구분할 수 있다.

첫째 빅 데이터를 처리하는 도구로서 정형화되지 않은 데이터 속에서 가용할 수 있는 정보를 추출하여 인지하는 기능이다. 예를 들면 아무리 전문가라고 해도 매일 쏟아져 나오는 엄청난 양의 새로운 정보 속에서 자신에게 꼭 필요한 지식을 다 흡수할 수는 없다. 인공지능이 사람을 대신해서 모든 데이터를 고속으로 스캐닝하여 핵심 지식을 간추려서 알려주는 서비스가 필요해졌다.

그렇게 되면 지금까지 사람의 두뇌만으로는 처리하지 못했던 정보까지도 인식의 범위 안으로 들어오게 된다. 데이터의 의미가 숨겨져 있어서 사람의 힘으론 인식하지 못하는 깜깜한 데이터도 있다. 이 경우 데이터의 속성을 분석해 보기 전에는 알아채지 못하는 지식이다. 그런 무의미해 보이는 데이터 속에서 의미 있는 속성을 찾아내 주면 미처 알지 못했던 통찰력도 얻을 수 있다. 빅 데이터 속에서 필요한 지식을 간추리고 미처 몰랐던 통찰력을 찾아내는 인지능력 중심의 인공지능으로는 아이비엠(IBM)이 개발한 인공지능 왓슨(Watson)이 대표적이다. 자연어 입출력 서비스를 제공하기 위해서 코그니아(Cognea)라는 벤처기업을 인수한 바 있다.

째는 기계학습기능으로 무슨 일이 벌어지고 있는지를 컴퓨터가 학습을 해서 스스로 터득하는 기능이다. 컴퓨터는 데이터를 고속 처리하지만 이미지나 동영상 속에 들어 있는 의미나 정보를 이해하는 수준은 아직은 벌레의 두뇌 정도다. 동물은 시각, 청각, 촉각, 후각, 미각 등 오감을 이용해서 3차원 공간 속에서 벌어지는 현상의 변화를 쉽게 인지하고 추리하지만 컴퓨터는 그런 능력이 없다.

하지만 최근 뇌세포의 신경망을 모방한 신경망 학습이론을 발전시킨 딥러닝(Deep Learning) 기술이 부각되고 있다. 신경망은 문장이나 이미지 또는 음성 정보를 통과시키면서 조건에 맞는 데이터만을 추려낸다. 딥러닝은 데이터를 걸러내는 다양한 조건의 신경망을 여러 층이 겹쳐지도록 설계하여 데이터가 축약되고 의미가 뚜렷해지도록 유도하는 학습방식이다. 데이터의 의미나 패턴이 뚜렷해지면 가치판단의 신뢰도가 높아진다. 딥러닝 기술은 컴퓨터의 학습능력을 높이는 데 상당한 기여를 하고 있다. 구글이 개발한 구글 브레인(Google Brain)이나 구글 딥마인드가 개발한 알파고(AlphaGo)가 대표적인 사례다. 딥러닝 기술은 외국어 번역기술이나 이미지 해석 분야의 인공지능 발달에 상당한 기여를 하고 있다.

셋째로 인공지능이 가장 취약한 부문으로 왜 이런 일이 벌어지고 있는지를 판단하는 상식적인 인지능력이다. 이를 캐주얼(Casual) 인공지능이라고도 부른다. 상식적인 인지능력이란 사람들이 세상을 바라보고 관찰하고 이해하듯이 여러 가지 가정들을 추정해서 결론을 도출하는 일이다. 사람들이 대화를 나눌 때는 보통 대화 속에 모든 정보를 상세히 담지 않는다. 그래도 상대방은 세상을 살아 온 상식적인 기준을 가지고 전체적인 대화의 윤곽을 이해한다. 예를 들면 ‘거시기가 좀 거시기하다’라고 말해도 상대는 전후 맥락을 동원해서 대략적으로 말뜻을 추정한다. 그래서 짧은 대화만으로도 의사소통이 가능하다.

하지만 컴퓨터처럼 정해준 법칙이나 알고리즘을 적용해서 모든 대화 내용을 하나씩 분석해서 대화 내용을 판단하려면 매번 엄청난 양의 정보를 서로 교환하지 않으면 안 된다. 상식을 가진 인공지능이라면 그럴 필요가 없다. 마치 사람들끼리 대화하듯이 정보를 제공해도 바로 의미를 알아차릴 수 있다.

 

데이터의 빈 공간을 상식으로 채워줘야 한다

흔히 시리에게 모호한 질문을 하면 엉뚱한 대답을 하고, 구글 나우는 연관성이 없는 정보들을 나열해 주고는 모른 체한다. 이런 현상이 발생하는 이유는 인공지능이 대화나 문장의 의미를 제대로 이해하지 못하기 때문이다. 이는 왓슨도 마찬가지다. 그저 많은 데이터만을 처리할 뿐이지 데이터들 간의 연관성이나 이미 알고 있는 다른 상식들과의 연결 처리가 부족하다. 질문하는 내용이 모호하면 그 의미를 추정할 만한 상식이 컴퓨터에겐 없기 때문이다. 만약 컴퓨터에게 인간이 성장하면서 터득하게 되는 상식과 비슷한 지식을 미리 터득하게 해준다면 인공지능이 처리할 수 있는 비즈니스 영역이 무섭게 확장될 수 있다. 그런 일을 해낸 사람이 있다.

한때 카네기 멜론과 스탠포드 대학 교수였던 도그 레나(Doug Lenat)는 지난 31년 동안 방대한 양의 일반적인 지식을 모아서 인공지능 엔진으로 만드는 작업을 해왔다. 그 결과로 만든 인공지능 ‘싸익(Cyc)’은 상식적인 추론능력을 발휘한다. 방대한 양의 데이터를 통계 처리해도 알 수 없는 감춰진 상식을 이해하는 인공지능이다. 마치 마음속을 더듬어 내듯이 데이터의 내면을 이해하는 능력을 갖고 있다고 할 수 있다. 사람들은 상대와 대화를 나눌 때 상대의 미세한 표정변화와 함께 꺼내는 말머리만 들어도 곧 무슨 말이 이어질지 짐작하는 능력이 있다. 구체적인 데이터가 없어도 그리고 구체적으로 말해주지 않아도 어떤 일이 벌어질지 짐작하는 능력이다. 질문에 답하고, 문제를 풀고, 목표를 달성하려면 전문 지식도 있어야 하지만 이런 눈치에 해당하는 상식적인 추론 능력이 필요하다.

상식이란 구체적으로 설명해 주지 않아도 사전에 경험으로 알고 있는 기반 지식이다. 예를 들면 물은 위에서 아래로 흐르고, 후에 발생한 일은 전에 발생한 일의 결과에 영향을 미치지 못한다는 것과 같은 평범한 상식이다. 추론이란 이미 알고 있는 기억들을 불러내는 것과는 다른 성격의 일이다. 엄청난 경험적 지식 배경을 가지고 데이터를 효과적으로 추론해서 가상의 결론을 이끌어 내는 능력이다. 결국 인공지능이 데이터의 인지능력을 높이려면 빅 데이터의 속성을 인지하는 능력, 빅 데이터를 학습해서 핵심을 간추리는 능력 그리고 데이터의 빈 공간을 상식으로 채워주는 능력이 결합되어야 한다.

클라우드 슈퍼컴퓨터를 활용한 인공지능 서비스를 비즈니스나 개인이 가상 도우미로 활용하는 소프트웨어들은 이미 상당 수준으로 발달해 있다. 구글, 아이비엠, 마이크로소프트 같은 다국적 기술기업들은 비즈니스 영역 별 가상지능 도우미 개발에 지금 한창이다. 이들은 동시통역 기술을 활용한 한국어 서비스도 서두르고 있다. 한국말로 가상지능 서비스를 쉽게 활용할 수 있는 시점이 급속히 다가오고 있다.