"어이가 없다. GPT-4 이후로 오랜만에 할 말을 잃었다"

국내 AI 스타트업 대표가 구글이 6일(현지시간) 발표한 제미나이(Gemini) 1.0을 보고 남긴 소회다. 도대체 무슨 일이 벌어지고 있는 것일까.

참가자들이 구글 개발자 회의 당시 바드를 체험하고 있다. 사진=연합뉴스
참가자들이 구글 개발자 회의 당시 바드를 체험하고 있다. 사진=연합뉴스

구글의 대반격
오픈AI가 지난해 말 챗GPT를 공개하며 빅테크 시장의 판도를 완전히 바꿔버렸으나 구글은 상대적으로 허둥지둥하는 분위기를 연출했다.

딥마인드 알파고 이슈를 통해 글로벌 AI 업계를 선도했지만 AI 윤리와 관련된 내외부의 저항에 부딪치며 기술 개발 속도전에 거리를 둔 가운데, 오픈AI의 챗GPT가 단숨에 판도를 바꾸며 허를 찔렸기 때문이다.

뒤늦게 코드레드를 발령하며 조직 재편성에 나섰으나 당분간은 '끌려다닐 것'이라는 전망이 우세했다.

예상은 빗나갔다. 구글은 람다 기반의 바드를 출격시킨 후 포털에 AI를 탑재하는 방식을 택해 빙에 챗GPT를 넣는 마이크로소프트(MS)-오픈AI 동맹군에 대응하기 시작했다. 라마2를 준비하는 페이스북 메타와 IBM 등이 뭉친 AI 동맹과도 거리를 두며 자체 기초체력 강화에 나섰다.

구글은 여세를 몰아 제미니아까지 등판시켰다. 

알파고의 구글 딥마인드와 구글 리서치(Google Research)를 통합한 후 대규모 협업에 나선 결과 탄생한 제미나이는 텍스트, 이미지, 오디오, 동영상, 코드 등 다양한 유형의 정보를 여러 정보를 동시에 조합하여 활용할 수 있는 멀티모달 기반 AI 모델이다. 데이터센터부터 모바일 기기까지 모든 환경에서 범용적으로 유연하게 활용될 수 있다는 설명이다.

지금까지의 멀티모달 모델은 서로 다른 모달리티에 대해 별도의 구성 요소를 학습시킨 다음, 이를 서로 연결하여 일부 기능을 비슷하게 모방하는 방식이 일반적이었다. 그러나 제미니아는 개발 단계 초기부터 다양한 모달리티로 사전 학습시켜 ‘태생적으로 멀티모달’(natively multimodal)이 되도록 설계, 개발됐다. 덕분에 기반 인프라 자체가 이미 멀티모달의 연결성을 전제하기 때문에 이미지를 넘어 더 복잡한 추론이 가능하다.

제미니아 울트라와 GPT-4 벤치마크 결과. 사진=구글
제미니아 울트라와 GPT-4 벤치마크 결과. 사진=구글

GPT-4 눌렀다
제미니아는 총 3개의 라인업으로 구성됐다. 제미나이 울트라(Gemini Ultra)는 방대하고 복잡한 작업에 적합한 가장 유용하고 규모가 큰 모델(Most capable and largest model for highly complex tasks)이며 제미나이 프로(Gemini Pro)는 다양한 작업에서 확장하기에 가장 적합한 모델 (Best model for scaling across a wide range of tasks)이라는 설명이다. 또 가장 하위 라인업인 제미나이 나노(Gemini Nano)는 온디바이스 작업에 가장 효율적인 모델 (most efficient model for on-device tasks)이다. 

각각의 컴퓨팅 파워가 세분화되어 있으며, 무엇보다 온디바이스 AI에 특화된 제미나이 나노는 기존 클라우드 기반의 ICT 컴퓨팅에 특화된 구글 입장에서는 다소 파격적인 카드다. 최근 퀄컴 등 주요 하드웨어 플랫폼 기업들이 강력한 컴퓨팅 파워로 무장해 초개인화 AI 등에서 큰 성과를 거둔 가운데, 구글 제미니아는 스펙트럼을 넓혀 관련 수요까지 빨아들인다는 각오다.

제미니아의 성능은 산술적으로 오픈AI의 GPT-4를 능가한다. 일반적인 AI 측정 모델인 32개의 벤치마크 중 30개에서 오픈AI를 포함한 기존의 최신 기술을 압도했기 때문이다.

실제로 수학, 물리학, 역사, 법률, 의학, 윤리 등 총 57개의 주제를 복합적으로 활용해 세계 지식과 문제 해결 능력을 평가하는 MMLU(massive multitask language understanding/대규모 멀티태스크 언어 이해) 테스트에서 90.04%의 점수를 기록했다. 전문가 인력보다 높은 결과를 기록한 최초의 모델이다. GPT-4는 86.4%에 그쳤다.

고도의 추론 능력이 요구되는 다양한 영역에 걸친 멀티모달 작업으로 구성된 새로운 MMMU 벤치마크에서도 59.4%의 최상위 점수를 기록했다. 총 32개의 벤치마크 중 무려 30개 분야에서 GPT-4를 눌렀다.

구글은 제미나이 1.0을 다양한 플랫폼으로 뿌린다는 설명이다. 바드에 제미나이를 지원시켜 170개 나라에서 동시 업데이트하며 픽셀8 프로에 최초 탑재시킨다.

구글 AI Studio 또는 버텍스 AI에 제미나이 API도 공유된다. 완전 관리형 AI 플랫폼이 필요한 경우 버텍스 AI를 사용해 데이터를 완벽하게 제어할 수 있는 제미나이를 맞춤 설정하고 기업 보안, 안전, 개인정보 보호, 데이터 거버넌스 및 규정 준수를 위한 구글 클라우드(Google Cloud)의 추가 기능도 체감할 수 있다.

구글 개발자 회의 당시 바드 지원되는 언어(일본어, 한국어)가 공개되고 있다. 사진=연합뉴스
구글 개발자 회의 당시 바드 지원되는 언어(일본어, 한국어)가 공개되고 있다. 사진=연합뉴스

글로벌 AI 삼파전, 한국형 AI에 대한 고민은?
생성형 AI를 중심으로 하는 글로벌 AI 진영은 크게 삼파전으로 굳어지는 분위기다. 

먼저 샘 올트먼 CEO가 축출당한 후 복귀하는 과정을 거친 오픈AI가 MS와의 연대를 강화하며 AGI(일반인공지능) 속도전에 나선 가운데 메타와 IBM, 인텔, 오라클을 비롯해 사일로 AI, 스태빌리티 AI 등 스타트업은 물론 예일대, 코넬대 등 대학과 항공우주국(NASA), 국립과학재단(NSF) 등 미국 정부 기관까지 연대한 AI 동맹이 반대편에 섰다. 이들은 오픈AI의 존재감이 지나치게 강해지며 전체 판을 흔들기 시작하자 적극 대응하기 위해 새로운 동맹을 맺었다는 분석이 나오고 있다.  

다리오 길 IBM 수석 부사장도 "지난 1년간 AI에 생태계의 다양성에 대한 논의는 거의 없었다"면서 "올해 8월부터 오픈AI만큼 주목을 받지 못한 기업을 모으기 위해 노력했고, 그 결과 AI 동맹이 출범한 것"이라 말했다.   

구글은 AI 동맹에 참여하지 않고 '마이웨이'를 걸을 전망이다. 생성형 AI 시장 경쟁 초기 오픈AI에 주도권을 빼앗기기는 했으나 빠르게 바드를 출범시킨 후 제미니아 승부수까지 걸며 다양한 가능성을 타진한다는 방침이다.

방식은 오픈소스를 전면에 세운 AI 동맹과는 달리 포털과 AI의 결합을 꾀하는 한편 원천기술로 승부를 보는 MS-오픈AI 방식과 비슷하지만, AI 모델 라인업을 세부화시키고 생태계 자체를 공격적으로 넓히는 것은 AI 동맹과 비슷한 구석이 있다. 그 연장선에서 치열한 전투가 벌어질 전망이다.

멀티모발 기반 이미지. 사잔=구글
멀티모발 기반 이미지. 사잔=구글

한편 한국형 AI 기업들의 고민도 깊어지고 있다. 

네이버를 필두로 하는 한국 기업들은 글로벌 빅테크와의 직접적인 경쟁을 지양하고 우선은 한국 시장을 지킨다는 방침이다. 다만 글로벌 빅테크의 공습이 지나치게 매서운데다 그 기세가 심상치 않다는 것이 문제다.

무엇보다 AI 자체가 언어의 장벽을 뛰어넘는 기술력을 전제로 하기에 한글이라는 특수성에 집중해 포털 시장을 지켰던 네이버의 '좋은 기억'이 AI 시대에 반복되기는 어렵다는 말도 나온다. 심지어 구글은 바드를 공개하며 한국어 학습에 대한 강력한 의지를 보이기도 했다. 새로운 국면이 필요하다는 이야기가 나오는 배경이다.