캐글(Kaggle)은 세계에서 가장 규모가 큰 데이터 과학자 커뮤니티이다. 세계 각지의 데이터 과학자들이 모여서 데이터를 이용해서 예측모델을 만들고 데이터 분석 경쟁을 하는 플랫폼으로 과학자들이 서로 배우고 공동으로 일을 처리하고 게임도 하는 웹사이트이다. 컴퓨터 과학, 생물학, 의학, 에너지 등 다양한 전공자들이 데이터를 활용한 기술개발에 몰두하는 곳이다. 최근 구글 클라우드에 편입된 캐글은 세계 194개국에서 약 80만명이 회원으로 가입해 활동하고 있으며, 아이비엠 왓슨을 개발한 기술자들이나 구글의 알파고를 개발한 기술자들도 활발히 아이디어를 교류하는 곳이다. 이곳에서는 수많은 포럼과 토론이 이루어질 뿐만 아니라 수백 종의 각종 데이터 세트가 공개되고 또한 수천 건의 문제 해결법들이 공개되어 교류되고 있다.

특히 흥미로운 점은 상금을 내걸고 문제를 해결하기 위한 여러 가지 기술개발 경진대회를 개최한다는 것이다. 최근 내걸린 2017년 데이터과학 경진대회에서는 폐암을 검진하는 알고리즘을 개발하는 목표로 100만달러의 상금이 걸렸다. 미국에서는 매년 폐암 환자가 22만5000명에 이르고 의료비가 120억달러를 지출하는데, 환자를 조기에 발견만 하면 생존 가능성이 20% 정도 더 높아진다고 한다. 그런데 현재 사용하는 저선량 CT 이미지 평가방법으로는 폐암일 가능성을 보이더라도 후에 암이 아닌 것으로 밝혀지는 경우가 25% 정도로 많다고 한다. 이 경진대회는 좀 더 정확한 폐암 진단 알고리즘을 찾아내는 것이 목적이다. 이 대회를 위해서 미국 국립암연구소가 수천 건의 고해상도 폐 CT 사진을 데이터로 제공하고 상금은 ‘로라와 죤 아놀드 재단’이 제공한다. 이밖에도 현재 구글 클라우드에 저장된 800만 비디오물을 분류하기 위한 표시자(Tag)를 붙이는 경진대회 등 11종의 경진대회가 진행되고 있으며 수백 또는 수천 개 팀들이 각 경진대회에 참가하고 있다.

 

미래는 인공지능 세상이다

기술의 미래를 전망해 보면 모든 면에서 인공지능이라는 개념을 벗어날 수가 없다. 우리는 개인의 일정관리에서부터 병원의 질병 진단에 이르기까지 컴퓨터 인공지능에 의존하는 비중이 점차 커지고 있다는 점에서 두려움을 느낀다. 사회가 복잡해질수록 해결해야 할 문제들은 더욱 어려워지고 그 해결 방법을 컴퓨터에 의존해야만 할 상황으로 치닫고 있다. 인간의 두뇌는 지금처럼 엄청난 양의 정보를 모두 처리할 만한 두뇌용량을 갖고 있지 못하다. 핵심이 되는 정보를 이해한다 해도 숨어 있는 정보의 위력을 무시할 수 없는 세상이다. 인간의 이런 한계를 극복하고자 우리는 컴퓨터를 이용한다. 세상의 흐름을 좀 더 빠르게 잘 감지하고자 컴퓨터를 이용한다. 인간의 한계를 극복하기 위한 수단으로 우리는 인공지능을 고려하지 않을 수 없다. 인공지능은 게임을 통해 인간의 역량을 초월하기 위해서 개발한 게 아니라 모든 사람들이 더 많은 지식과 정보를 빠르게 습득하고 활용할 수 있도록 만드는 수단으로 개발되고 있다. 인간과 기계가 함께 문제를 해결하고 더 나은 세상을 만들어 가는 수단으로 인공지능이 필요한 것이다.

세계는 지금 데이터를 이용한 인공지능 기술을 개발하는 데 모든 노력을 다하고 있으며 캐글에서 보듯 전 세계 전문가들이 서로 데이터를 공개하고 기법도 공개하면서 인류의 문제들을 함께 해결하는 데 노력을 다하고 있다. 서로 원천기술을 공유하면서 독자적인 문제해결 비법을 발굴해내는 기술개발 전략을 사용하고 있다. 미래의 판단력과 경쟁력은 물론 개인의 뛰어난 지혜나 역량에 의해서 달라지겠지만 더 중요한 경쟁 요소는 어떤 인공지능을 활용하고 있으며 어떻게 활용하고 있느냐에 따라 크게 달라질 수 있다고 생각한다. 따라서 누구나 평등하게 교육받을 권리가 있듯이 앞으로는 누구나 인공지능을 자유롭게 활용할 수 있도록 사회 기반을 구축해야 한다는 점이 미래를 준비하는 사회와 국가가 해야 할 가장 중요한 과제이다.

 

인공지능 사회를 구축해야 한다

마이크로소프트는 인공지능을 기업과 학계에서만 다루는 도구가 아니라 모든 일반 대중이 이용할 수 있는 도구로 전환해야 한다고 주장한다. 마이크로소프트 CEO인 사티아 나델라(Satya Nadella)는 지난 1월에 독일에서 개최된 유럽혁신컨퍼런스(DLD 17)에서 이렇게 말했다. “인공지능이 가능한 많은 사람들에게 도움이 되는지 확인하기 위해서라도 전 세계에 채택할 필요가 있다.” 모든 사람이 인공지능을 자유롭게 사용할 수 있도록 인공지능을 민주화해야 한다고 주장한다. 즉, 건강관리, 교육, 제조, 소매 및 일상생활에서 누구나 인공지능을 도구로 사용할 수 있도록 인공지능을 대중화해야 한다고 주장했다. 궁극적인 목표는 인공지능의 강력한 힘을 대중에게 나눠주어서 모든 사람들이 필요한 인공지능 시스템을 만들 수 있도록 하는 게 목표라고 한다. 그는 “인공지능을 사용해 사람들이 하고자 노력하는 일들을 도와주면 생산성이 올라가고 성장을 이끌어낸다”면서 마이크로소프트가 제공하는 API는 사용자가 취급하는 모든 제품, 응용프로그램, 서비스 그리고 경험에 인공지능을 주입시키는 방법을 제공한다고 선전하고 있다. 예를 들면 마이크로소프트의 지능형 비서인 코타나(Cortana)가 나에 대해서 알고 세상 돌아가는 내용을 알고 있으므로 내가 특별히 하고 싶어 하는 일을 더 잘할 수 있도록 도와준다고 한다.

▲ 이미지투데이

대부분의 경우, 독자적인 인공지능을 개발하려면 엄청난 시간과 데이터 그리고 경험이 필요할 뿐만 아니라 첨단기계학습모델을 돌릴만한 컴퓨팅 설비를 확보해야만 한다. 하지만 기계학습에 전혀 경험이 없는 개발자라도 자신이 개발한 응용프로그램에 마이크로소프트가 개발한 25종의 인지기능 서비스, 예를 들면 감정과 정서 탐지, 시각 및 음성 인식, 언어 이해와 같은 기능을 추가할 수 있도록 해줌으로써 인공 지능의 대중화가 시작되고 있다. 모든 기계학습과 인공지능 기능을 쉽게 사용할 수 있도록 API로 공개하므로 사용자가 기술을 자체적으로 개발할 필요가 없게 해준다. 예를 들면 음성인식 기능은 소란스런 환경에서도 굳건하게 작동하고 특정 사용자 그룹의 특수 용어나 사투리 악센트 등을 모두 인식할 수 있는 알고리즘을 갖추고 있다고 한다. 물론 이런 음성인식기술을 제3자 응용프로그램에서 사용할 수 있다. ‘빙(Bing) 음성 API’는 음성데이터를 문장으로 바꿔주고 문장의 의도를 이해해서 문장을 다시 음성으로 바꿔주는 기능이다. ‘콘텐츠 중재자(Content Moderator)’는 사용자가 이미지, 텍스트나 비디오를 점검해 필요 없는 부분, 예를 들면 불쾌감을 주는 언어나 그림들을 걸러내는 작업을 한다. ‘인지서비스(Cognitive Service)’는 개발자들이 사진이나 비디오 같은 시각적 데이터에 지능을 적용해 서비스를 향상시켜 준다. 예를 들면, 프리즘 스카이랩이라는 비즈니스지능기업은 컴퓨터 비전 API를 자신들의 프리즘용용프로그램에 사용했는데 이 방법으로 기관들이 폐쇄회로나 비밀카메라에서 특정 사건이나 사람을 검색하는 게 가능해졌다고 한다.

이제는 사람들이 주변을 둘러싼 현실세계를 소프트웨어를 이용해서 관찰하고, 귀 기울이고, 이해하게 되고, 반응할 수 있게 됨으로써 접하는 것마다 더욱 인간적이고, 더욱 자연스럽고, 그리고 더욱 쉽게 이해하므로 훨씬 더 다양한 상황에 처한다 해도 제대로 영향력을 미칠 수 있게 된다. 우리가 살아갈 이 시대는 더 많은 사람들에게 더 재미있는 방법으로 더 많은 컴퓨터 기능을 향상시켜 제공해주고 삶을 더 풍요롭게 해주는 시대가 되고 있다.

 

이젠 데이터를 학습해서 원리를 만드는 시대다

구글도 인공지능의 민주화를 외치고 있다. 구글 클라우드 플랫폼에 새롭게 향상된 기계학습 기반의 API들을 제공하기 시작했다. 지난 3월 초 샌프란시스코에서 개최된 ‘구글 클라우드 넥스트 2017’에서 기조연설을 한 구글의 인공지능 수석과학자인 페이페이 리(Fei-Fei Li)는 “인공지능이 많은 사람들에게 도달되고 민주화된다는 의미는 구글 클라우드 플랫폼이 인공지능의 힘과 결합되어서 모든 사람들에게 제공된다는 의미로서 역사상 다른 어느 때보다도 삶의 질이 엄청나게 향상되는 걸 목격하게 된다는 의미이다. 이것이 바로 구글 클라우드를 통해 기계학습 및 인공지능을 제공하는 이유이다”라고 말했다. 리 박사 다음에 등단한 구글의 모회사인 알파벳 회장인 슈미트는 기업들이 구글의 기계학습 API를 적극 활용할 것을 촉구하면서 “앞으로는 결과물을 만드는 프로그램을 작성하는 대신 드러난 결과물들을 학습하는 프로그램을 작성해야 한다. 기계학습과 인공지능은 프로그램 작성하는 방법을 바꿔버렸다”고 일갈했다. 구글이 제공하는 기계학습 API는 비디오 분석 API, 이미지 분석 API, 음성인식(80개 언어) API, 문서분석 API, 자연어 번역 API, 그리고 대규모 기계학습 API 등이다. 마이크로소프트와 마찬가지로 사용료를 지불하면 제공되는 API를 사용자 프로그램에서 활용할 수 있다.

사실 맨 먼저 사용자 프로그램에 인공지능 API를 삽입할 수 있도록 기술을 제공하기 시작한건 아이비엠(IBM)이다. 2016년도부터 이미 블루믹스(Bluemix) 서비스를 제공하고 있는데 광범위한 인지컴퓨팅 기능을 활용해서 스마트 응용프로그램을 빠르게 작성할 수 있다. 이미지‧비디오 분석은 물론이고 문장 속의 감성‧키워드‧독립요소 이해에 이르기까지 폭넓은 기능을 제공하는 왓슨 서비스를 사용자 응용프로그램에서 구현할 수 있다.

인공지능은 제4차 산업혁명의 디딤돌기술이다. 미래 산업의 원료가 데이터라면, 미래 산업설비는 소프트웨어이다. 그리고 인공지능이 제공하는 창의적인 서비스가 바로 제4차 산업혁명을 일으킬 미래상품이다.