오픈AI의 챗GPT가 글로벌 빅테크 업계를 강타하며 생성형 AI 시대를 연 가운데, 다수의 생성형 AI 서비스가 연이어 쏟아지며 경쟁 레이스도 후끈 달아오르고 있다.

넷플릭스를 필두로 다수의 OTT들이 출현하며 OTT 구독 비용이 크게 늘어났던 사례가 생성형 AI 시대에도 재연될 정도다. 산업 현장이 아닌, 일상생활에서 흔히 만날 수 있는 생성형 AI 기술들을 모아봤다.

사진=연합뉴스
사진=연합뉴스

챗GPT부터 클로드3까지
오픈AI의 챗GPT는 생성형 AI 시대의 간판이다. 혜성처럼 등장해 단숨에 판을 흔들었기 때문이다. 

오픈AI의 GPT는 2018년 GPT-1으로 등장, AI가 문장의 의미를 제대로 이해하고 판단하며 분류할 수 있다는 것을 증명하며 큰 인기를 끌었다. 이어 2019년에는 매개변수 15억개의 GPT-2가 등장했고 2020년 GPT-3은 무려 1750억개의 매개변수로 무장해 시장을 들썩이게 만들었다. 나아가 2022년 GPT-3.5는 센세이션한 반응을 끌어냈다.

팬데믹에서 리오프닝이 열리며 온택트 ICT 트렌드가 시들하던 순간 AI가 빅테크 업계의 구원투수로 등판해 엄청난 화제를 일으켰기 때문이다. 그 연장선에서 오픈AI는 챗GPT라는 AI 챗봇을 출시해 사실상 AI 시대를 선도하는 곳으로 거듭났다.

여세를 몰아 GPT-4도 나왔다. 미국 모의 변호사 시험에서 90번째의 백분위수를 기록했으며 대학 입학 자격시험인 SAT 읽기와 수학시험에서는 각각 93번째와 89번째의 백분위수를 기록했다. 오픈AI는 GPT-4에 대해 "인간의 수준을 가졌다"고 자평했다. 일반 대화에서도 인간과 큰 차이를 느끼지 못한다는 뜻이다.

샘 올트먼의 축출에 이은 복귀 정국을 통해 강력한 파트너인 마이크로소프트(MS)와의 연대를 중심으로 영역을 확장하고 있다. 조만간 GPT-5가 등장할 것으로 예상되는 가운데 판을 움직이는 '큰 손'으로 성장할 전망이다.

다만 AGI 측면에서 챗GPT의 공격적인 AI 로드맵이 불안하다는 주장도 있다. 자연스럽게 AI 규제 가능성이 나오는 가운데 오픈AI가 AI의 윤리적 활용에 있어 각 국의 '타깃'이 될 것이라는 말까지 나온다. 

업계에서는 생성형 AI 서비스에 있어 무난하고 축적된 노하우를 활용하려면 챗 GPT가 유리하다고 본다. 가격은 월 20달러다.

한편 구글도 반격하고 있지만 최근 분위기는 어수선하다. 오픈AI 진격에 기술 주도권을 빼앗기는 한편 생성형 AI가 구글의 캐시카우인 검색광고 시장을 장악할 것이라는 공포가 커지는 가운데, 다소 성급하게 AI 전략을 추구하고 있기 때문이다.

원래 오픈AI는 초기 일론 머스크, 고 스티븐 호킹 등이 참여한 AI 비영리 기구였으나 산하에 영리회사를 두고 몇 번의 변신을 시도하더니 MS의 천문학적 투자를 통해 AI 게임 체인저로 변신했다. 나아가 이들은 AI가 검색이나 식별을 넘어 무언가를 창조할 수 있음을 재차 어필하는데 성공했다.

이에 반해 구글은 주춤거렸다. 팬데믹, 엔데믹, 우크라이나 전쟁 등에 따른 글로벌 인플레이션, 빅테크 이슈를 몰아내기 시작한 다양한 산업군의 부상(FAANG 2.0) 등으로 허덕이던 가운데 챗GPT로 열린 생성형 AI 시대에서 어필 타이밍을 완전히 놓쳤기 때문이다. 여러가지 이유가 있으나 2018년 프로젝트 메이븐 사태 후 구글 내부에서 AI 윤리를 강화하려는 목소리가 커졌던 것이 주효했다. 반드시 필요한 일이었지만 기술 발전에 있어서는 악재기 때문이다.

다만 큰 그림은 그려지고 있다. 챗GPT의 오픈AI가 글로벌 생성형 AI 시대의 모든 이슈를 블랙홀처럼 빨아들이자 2023년 3월 내부적으로 코드레드를 발령, 바드를 중심으로 전격전을 펼쳤다. 이어 챗GPT가 MS의 오피스365 및 빙, 애저 등 기업 생산성 서비스로 파고들며 엔터프라이즈적 측면서 생성형 AI 존재감을 키우자 구글은 바드의 포털 적용을 중심으로 하는 '뉴타입' 카드를 꺼내는 등 신속하게 움직였다기 때문이다.

사진=구글
사진=구글

이후 바드를 리브랜딩해  ‘제미나이 울트라(Ultra)’를 적용한 ‘제미나이 어드밴스드(Gemini Advanced)’를 가동하는 중이다. 바드에서 제미니아로의 브랜딩 변경을 기점으로 탄탄하 기초체력을 쌓아올리는 중이다. 제미나이 어드밴스드는 150개 이상의 국가에서 지원되며, 구글의 AI는 구글 원 AI 프리미엄(Google One AI Premium) 요금제에 포함되면서 구글 어시스턴트에 이어 단독앱으로도 출시된다는 설명이다. 

업계에서는 포털 검색 등과 관련된 자료 정리나 기타 데이터 통계 등의 작업에 있어 제미나이 어드밴스가 가격은 탁월하다는 평가가 나온다. 가격은 월 20달러다.

엔트로픽의 클로드3도 있다. 비용·성능·속도에 따라 ‘하이쿠’, ‘소네트’, ‘오푸스’로 구분되며 성능 차원에서는 GPT-4를 능가한다는 말도 나온다. 멀티모달은 제공되지 않지만 명령어 입력으로 최대 20개 이미지를 분석할 수 있다는 강점이다.

업계에서는 클로드3를 두고 생성형 AI 기술 중에서는 '최고'에 가깝다는 평가가 나온다. 멀티모달이 불가능한 것은 아쉽지만 처리 속도가 빠르다는 것도 매력적이다. 다만 GPT-5가 조만간 등장할 것이라는 말이 나오기에 '지켜봐야 한다'는 의견도 있다. 가격은 월 20달러다.

사진=엔트로피
사진=엔트로피

네이버 클로바X도 잘 나가네...바이두 어니봇도 '시선집중'
'한국형 AI' 전략의 선봉인 네이버도 하이퍼클로바X 기반의 클로바X를 키우고 있다. AI 소버린 전략을 중심에 두고 '한국 맞춤형 AI'를 가동한다는 설명이다.

하이퍼클로바X는 최근 한국어 다중 과제 언어 이해 측정(KMMLU) 시스템에서 오픈AI와 구글의 AI를 능가하는 성과를 내기도 했다. 

북미 기업들이 선호하는 MMLU 지표와 달리 KMMLU는 한국어 원본 문제들로 이루어져 있어, 한국어 능력을 보다 정확하게 측정할 수 있는 장점이 있다. 이러한 점은 기존 영어 중심의 AI 모델 평가 방식에서 발생할 수 있는 번역 오류나 문화적 차이로 인한 한계를 극복한다는 설명이다.

연구 결과에 따르면 하이퍼클로바X는 오픈AI의 GPT-3.5 터보 및 구글 제미나이 프로보다 우수한 성적을 기록하였으며, 특히 한국 특화 지식에서 오픈AI의 GPT-4를 상회하는 결과를 보여주었다는 설명이다. 이는 하이퍼클로바X가 교육 및 법률과 같은 로컬 정보 중심 산업에서 매우 유용할 수 있음을 시사한다.

하이퍼클로바X를 백본(back-bone)으로 구축한 클로바X에 대한 관심이 커지는 이유다. 클로바X는 창작, 요약, 추론, 번역, 코딩 등 능력이 바탕이 된 다양한 답변을 제공할 수 있다는 설명이다. 업무 보고서나 자기소개서처럼 비즈니스 글쓰기에 도움을 받는 것부터 면접 연습, 고민 상담 등 다양한 목적으로 활용될 수 있다.

최수연 네이버 대표. 사진=네이버
최수연 네이버 대표. 사진=네이버

연달아 질문하는 멀티턴(multi-turn) 대화도 가능하며 복잡하고 긴 대화도 모두 소화해 답변한다. 네이버 내∙외부의 다양한 서비스 API를 연결하는 시스템 ‘스킬(skill)’을 통해 서비스 고도화가 가능하다. 네이버쇼핑, 네이버 여행과의 연계도 강하다.

업계에서는 클로바X의 기능도 좋지만, 한국에 특화된 양질의 정보를 얻을 수 있다는 점에 높은 점수를 준다. 네이버와의 연결성도 고무적이고, 큐: 등의 다양한 서비스들과 시너지를 내는 것도 의미있다는 평가다. 네이버가 한국형 AI 전략을 가동하며 단숨에 기반 AI 생태계를 구축했기에 가능한 일이다.

한편 바이두의 어니봇도 알음알음 알려지는 중이다. 문학 창작 및 다중 언어 이해 등에 있어 강점이 있다.

미드저니가 그린 작품. 사진=갈무리
미드저니가 그린 작품. 사진=갈무리

이미지부터 영상까지
생성형 AI로 멀티모달 기반의 이미지도 만들 수 있다. 챗GPT가 이를 지원하며, 달리는 현재 챗GPT와 코파일럿에 적용되어 있다. 

미드저니도 잘 알려져 있다. 텍스트를 입력하면 AI가 이미지를 생성해주는(Text-to-Image) 모델의 선두 중 하나로 가입부터 작업까지 디스코드 서버에서 벌어지는 것이 특징이다. 정교한 이미지 작업도 가능해 선호도가 높은 편이다.

미드저니는 2022년 예술대회 우승사건으로 업계에 큰 충격을 주기도 했다. 제이슨 앨런이라는 화가가 미드저니를 통해 생성한 '스페이스 오페라 극장'을 콜로라도 주립박람회 미술대회에 출품해 디지털 아트 부문 1등을 차지했기 때문이다. "AI가 만든 작품에 상을 주어야 하는가?" "AI가 만들었지만 인간이 프롬프트했기에 인간에게 저작권이 있는 것 아닌가?" 등의 논쟁을 일으킨 바 있다. 가격은 가장 낮은 버전 기준 월 10달러다.

스테이블 퓨전도 유명하다. 독일 뮌헨 대학교에서 처음 시작한 오픈소스 기반이며 강력한 AI 이미지 생성 기능을 지원한다. 역시 AI 이미지 작업에 따른 저작권 관련 논란을 겪은 바 있다.

한편 생성형 AI로 영상을 제작하는 곳도 있다. 구글의 뤼미에르다. 다만 뤼미에르는 소라보다 먼저 출시됐음에도 지나치게 영상 길이가 짧은데다 기술력이 제한적이라는 평가를 받는다. 무엇보다 이미지 생성 과정에서 불확실한 능력을 보여주며 질타를 받고 있다. 그 연장선에서 구글은 게임 개발을 할 줄 아는 AI 지니까지 개발하며 강력한 기술력을 자랑하고 있으나 조급함에 그만 지나치게 AI 전선을 넓힌 것 아니냐는 비판이 나오고 있다.

그런 이유로 AI 영상 생성은 오픈AI의 소라가 주도하고 있다. 오픈AI는 블로그를 통해 “소라가 현실 세계를 이해하고 모사하는 능력을 가진 것은, 인공일반지능(AGI)를 개발하는 데 중요한 이정표가 될 것”이라고 밝혔다. 아직은 테스트 단계다.

소라. 사진=갈무리
소라. 사진=갈무리

음성 생성부터 비디오에서 텍스트로
생성형 AI가 텍스트 및 이미지와 영상 제작만 하는 것은 아니다. 다양한 영역에서 활동하는 가운데 음성 생성도 할 수 있다. 네이버 클로바 더빙 등이 대표적이다.

비디오를 텍스트로 변환하는 기술도 있다. 릴리스에이아이다. AI로 영상의 내용을 텍스트로 풀어주는 기능을 지원한다.