▲ 인공지능 신경망. 출처=위키피디아

우리는 매일 머신러닝(Machine Learning)을 마주한다. 검색 엔진에 검색어를 입력하면 이미 머신러닝 기능이 적용돼 있는 포털 사이트는 그중 알맞은 검색 결과를 보여준다. 내가 그동안 클릭했던 사이트들을 기반으로 '광고'를 추천해주며, 페이스북에 접속하면 자연스럽게 페이스북이 나를 위한 최신 정보를 띄워놓고 기다리고 있다.

전통적으로 컴퓨터에 입력하고 엑셀을 활용해 해결하던 일들을 이제는 머신러닝이 모두 도맡아 한다. 머신러닝이란 인공지능의 한 분야로 데이터를 분석해 특정 패턴을 찾아내어 미래를 예측하는 기술을 말한다. 대규모의 데이터를 처리하는 기술인 빅데이터에서 머신러닝은 어떻게 효율적으로 정보를 이용할 수 있을까 하는 고민 끝에 등장했다고 볼 수 있다.

대형 기업들이 머신러닝을 이용하는 이유는 '광고'에 활용하기에 제격이기 때문이다. 머신러닝을 이용해 예상 클릭수를 파악해 광고를 볼 확률을 측정하고 투자비용을 측정한다. 구글의 연 매출을 500억 달러(약 55조 원)라고 했을 때 예상 클릭수가 향상하면 매년 5억 달러(약 5500억 원)를 더 벌 수 있다.

또한 생산자와 소비자가 연결되는 중간 단계에서 머신러닝은 ‘중개인’ 역할로 크게 기여할 수 있다. 페르도 도밍고스는 '미스터 알고리즘'이라는 책에서 "기업은 성장하면서 3단계를 거친다. 1단계는 모든 일을 손으로 하는 단계, 2단계는 회사가 성장해 컴퓨터가 필요한 단계, 마지막 3단계는 규모가 커져 '중개인'이 필요한 경우"라며 머신러닝은 회사에서 '중개인' 역할을 할 수 있다고 설명했다.

▲ 출처=픽사베이

소비자 한 명 한 명을 분석해 세심하게 보살 필 수 있는 머신러닝 서비스는 회사 자체에서 놓치기 쉬운 정보를 처리할 수 있다. 기업과 소비자가 최선의 결정을 내릴 수 있도록 도울 수 있는 최고의 조력자인 셈이다. 도밍고스는 "머신러닝은 단순히 고객을 잘 이해하는데서 끝나지 않는다. 기업은 머신러닝을 이용해 성장 전략을 도모하고 자사의 데이터를 정제해 좀 더 효율적으로 활용할 수 있다"라고 강조했다.

그는 "기업들은 머신러닝을 신기술이라 채택하는 게 아니라 채택하지 않을 시 더 이상 경쟁할 수 없고 생존할 수 없기에 택한다"라고 밝혔다. 래리 페이지 구글 CEO는 지난 2014년 테드(TED) 강연에서 머신러닝을 두고 '살면서 만난 가장 흥미로운 기술'이라고 칭했다.

이미 대형 IT 기업들은 사물인터넷(IoT) 기반의 센서 데이터, 인터넷 로그 데이터 등을 기반으로 머신러닝을 이용해 적극적으로 사업에 활용하고 있다. 머신러닝은 데이터가 풍부한 IT 사업의 기반이 될 도구다. 주관적 판단을 멀리하기 위해 데이터 기반 의사결정이 늘어갈 것으로 보인다. 특히 구글이나 넷플릭스 등 데이터 기반 의사 결정이 필요한 곳에는 요긴할 전망이다.

머신러닝을 기반으로 사업모델을 구축한 '넷플릭스'는 15가지의 알고리즘을 기반으로 콘텐츠를 추천하는 머신러닝 기능을 기반으로 탄생했다. 소비자 맞춤형 추천 시스템을 보유하고 있다. 넷플릭스는 서비스를 이용하는 지역의 사용자 들이 즐겨 보는 프로그램을 분석한 빅데이터를 바탕으로 사용자들에게 ‘추천 서비스’를 제공한다. 고객들이 실제 무엇을 보고, 검색하고 클릭하는지 머신러닝을 활용해 분석한다. 그리고 행별로 적용해 페이지를 구성할 최우선의 콘텐츠를 설정하는 방식이다.

▲ 출처=넷플릭스

넷플릭스는 이 같은 빅데이터와 머신러닝 기술을 바탕으로 광고효과 덕도 보고 있다는 후문이다. 사용자의 관심사를 꿰뚫고 있는 넷플릭스가 소비자 맞춤 형 광고를 제공할 수 있는 건 당연하다. 넷플릭스는 사용자 들의 성향을 파악해 자체 제작 시리즈인 '오리지널 콘텐츠' 제작 시 기본 자료로 이용한다고 알려졌다. 어떤 배우를 선택하고, 어떤 시리즈에 몰입하는지 알 수 있기에 좋은 기초 자료가 된다. 그렇게 해서 탄생한 '하우스 오브 카드'는 넷플릭스의 킬러 콘텐츠로 자리매김하고 있다.

마이크로소프트(MS)는 머신러닝 기반의 '실시간 통역' 서비스를 제공한다. MS는 언어 관련 데이터를 분석한 번역 데이터를 바탕으로 영상통화 시 영어, 스페인어, 중국어, 이탈리아어 간 실시간 통역 서비스를 제공하고 있다. 현재는 스카이브(Skype) 번역 서비스를 통해 영상, 음성 통화는 7개의 언어로 번역 가능하다. 채팅은 한국어를 포함해 50개까지 번역할 수 있다. MS는 "더 많은 사람들이 사용할수록 번역 학습을 통해 번역의 질이 향상될 것이다"라고 설명했다.

구글은 데이터 센터에서 성능 최적화와 에너지 사용 최소화를 목적으로 머신러닝을 활용한다. 데이터센터 에너지 효율성 모델을 구축하기 위해 '신경망 네트워크'라는 머신러닝 알고리즘 중 하나를 사용한다. 모델에서 자동 생성되는 특징들 간의 패턴을 파악하는 방식으로, 학습 데이터를 기반으로 정확성이 올라간다는 장점이 있다.

한편 구글은 최근 머신러닝을 적용한 메신저 앱(애플리케이션) '알로'를 선보였다. 알로는 스마트 응답 기능과 디지털 비서 역할을 담당하는데, 사용자 간의 대화를 분석하는 머신러닝을 이용해 가장 잘 어울리는 대답을 한다. 일주일 만에 500만 건의 다운로드가 이루어지는 등 순항하고 있다.