오픈AI의 챗GPT가 등판한 후 구글 바드, 일론 머스크의 그록, 메타의 라마 등이 치열한 경쟁을 벌이고 있다.

주요 초거대 AI 기업들에게 반도체라는 '무기'를 제공하는 하드웨어 기업들의 존재감도 커지고 있어 눈길을 끈다.

시장조사업체 가트너에 따르면 글로벌 AI 반도체 시장은 2030년 전체 시스템 반도체 시장의 31.3%를 점유할 것으로 예상되는 등 그 잠재력이 크다. 그 연장선에서 엔비디아와 AMD, 인텔 등이 대표적인 플레이어로 활동하고 있다. 이들은 오픈AI와 구글 등이 초거대 AI 모델을 구축할 때 반드시 필요한 AI 반도체를 제작하며 'AI 무기상인'으로 거듭나고 있다.  

젠슨 황 엔비디아 CEO. 사진=연합뉴스
젠슨 황 엔비디아 CEO. 사진=연합뉴스

엔비디아의 시대
AI 시장이 열리며 이에 걸맞는 고성능 반도체 성능이 필요해지자 업계는 고민에 빠졌다. 챗GPT와 바드 등 초거대 생성형 AI 모델들이 개발됐으나 막상 이들을 수용할 수 있는 '그릇'이 없었기 때문이다.

당장은 반도체의 기본 구성 요소 중 하나인 CPU(중앙처리장치)가 그 역할을 맡아야 했지만 기능적 측면에서 어불성설이었다. 그 결과 눈을 돌린 것이 GPU(그래픽처리장치)다. GPU는 원래 초고화질 그래픽을 구현하기 위해 탄생했기에 CPU 대비 약 3배 빠른 연산이 가능했고, 이러한 '파워'를 AI 활용에 적용하는 것은 당연한 결과였다. 오픈AI의 GPT 초기 버전도 GPU를 통해 구동됐다. GPU의 가치가 급상승한 배경이다.

GPU의 존재감이 커지며 시장을 장악한 엔비디아의 힘도 강해졌다. 실제로 비트코인 및 메타버스 등 GPU 파워가 필요한 소프트웨어 플랫폼을 절묘하게 미래 트렌드에 버무려 비싼 가격이 팔아먹는 것에 익숙한 엔비디아는 AI 시대에도 '영악한 장사'를 하기 시작했다. 

사진=연합뉴스
사진=연합뉴스

고 스티브 잡스 애플 창업주는 디자인 철학을 담은 하드웨어에 특유의 브랜딩이 가미된 소프트웨어 생태계를 탑재하는 방식으로 큰 성공을 거뒀다. 이어 아이폰을 구매하는 행위를 소위 혁신을 구매하는 행위로 치환시키는데 성공했다. 그리고 애플 팬덤은 고 스티브 잡스가 아이폰 위에 올려둔 혁신의 빛에 감격해하며 기꺼이 지갑을 열었다.

'가죽재킷'의 남자 젠슨 황 엔비디아 CEO도 마찬가지다. GPU가 팔릴 수 있는 소프트웨어 플랫폼에 미래 비전을 투영시킨 후 여기에 뛰어들지 않으면 도태의 그림자에 빠질 것이라 설파했다. 비트코인이 그랬고 메타버스가 그랬다. 나아가 지금도 젠슨 황 CEO는 생성형 AI 시대에 올라타지 않으면 낙오될 것이라 주장하며 자신들이 만든 GPU인 H100을 눈 앞에서 흔들고 있다.

여세를 몰아 H200도 공개했다. 141기가바이트(GB)의 차세대 메모리 HBM3가 지원되며 전작 대비 2배 강한 파워를 자랑하는 것으로 알려졌다. 엔비디아의 가속 컴퓨팅 플랫폼인 호퍼(Hopper) 아키텍처를 기반으로 하며 내년 2분기 출시 예정이다.

H200. 사진=엔비디아
H200. 사진=엔비디아

GPU에서 AI 반도체로
엔비디아의 시대는 계속될까. 장담하기에는 변수가 많아졌다.

우선 H100과 같은 GPU 가격이 지나치게 올라갔다. 각 기업은 물론 국가 단위에서 치열한 GPU 확보 전쟁이 시작되며 평균 가격인 1년 사이 무려 30%나 치솟았다.

GPU가 AI 기능에 완전히 적합하지 않다는 것도 문제다. 당초 그래픽 기능을 처리하기 위한 제품인만큼 다양한 부가기능들이 있기에 소위 AI에 대한 '선택과 집중'이 어렵기 때문이다. 또 병렬처리의 GPU가 직렬처리의 CPU보다는 AI 파워에 적합하다지만, 역시 완전한 AI 기능을 풀어내기에는 한계가 많다. 

이러한 한계가 완전한 형태의 AI 반도체에 대한 관심으로 이어지고 있다. 엔비디아의 H100과 같은 GPU도 AI 반도체의 범주에 들어간다. 다만 이를 뛰어넘는 말 그대로 '완전체 AI 반도체'가 핵심으로 부상했다.

AMD가 도전장을 내밀었다. 인스팅트 MI300X 시리즈를 전격 공개하며 AI 반도체 시장의 판을 흔들려 시도하기 때문이다.

엔비디아의 H100에 비해 2.4배 높은 메모리 밀도와 1.6배 이상의 대역폭을 제공한다는 설명이다. 이미 다수의 빅테크들이 인스팅트 MI300X 시리즈 구매 의향을 보이고 있다는 것이 리사 수 AMD CEO의 설명이다.

리사 수 AMD CEO. 사진=연합뉴스
리사 수 AMD CEO. 사진=연합뉴스

여세를 몰아 AMD는 소프트웨어 플랫폼 ROCm6까지 공개하며 엔비디아가 만든 쿠다 생태계에 도전장을 내밀기도 했다. 엔비디아 GPU에 특화된 '플랫폼+ API'인 쿠다의 '생태계'를 연상시키는 ROCm의 6번째 버전은 말 그대로 AI 반도체 하드웨어+소프트웨어 판에서 제대로 붙어보겠다는 의미로 여겨진다. 하드웨어 및 소프트웨어 연결 생태계 전반으로 판을 넓힌 후 AMD만의 '판'을 만든다는 의지다.

인텔도 가만히 있지 않았다. 5세대 인텔 제온 프로세서를 통해 하이브리드 AI 전략을 지원한다는 주장이다. 인텔코리아 나승주 상무는 “5세대 인텔 제온 프로세서는 AI 워크로드를 효율적으로 처리하기 위해 설계된 제품으로, 고객이 클라우드, 네트워크에서 엣지에 이르는 광범위한 인프라에서 AI 역량을 갖추도록 지원할 것”라며, “인텔은 AI 인프라 구축 및 배포를 쉽게 만드는 하드웨어와 소프트웨어를 함께 제공함으로써 개발자가 어디서나 AI를 구현할 수 있도록 지원할 것”이라고 말했다.

딥러닝 및 대규모 생성형 AI 모델용 차세대 AI 가속기 인텔 가우디3(Intel Gaudi3)도 베일을 벗었다. 이를 바탕으로 인텔은 경쟁력 높은 TCO 및 가격대와 함께 더욱 향상된 성능 혜택을 바탕으로 가우디 파이프라인을 빠르게 확장한다는 설명이다. 내년 생성형 AI 솔루션 수요가 증가하면서 2024년에는 가우디가 주도하는 AI 가속기 제품군을 주축으로 가속기 시장 점유율을 넓혀갈 것으로 기대한다고 밝혔다. 내년 초 출시된다.

CPU에서는 엔비디아와 AMD가 인텔의 아성을 넘지 못했다. 다만 GPU에서는 인텔과 AMD가 엔비디아의 벽을 넘지 못했다. 이 과정에서 한때 CPU에서 인텔 타도를 외치던 AMD가 새로운 라이젠을 출시하면서도 GPU에서는 엔비디아에 대항하기 위해 인텔과 공동전선을 짜는 혼란한 복마전이 벌어진 바 있다. 이런 가운데 당분간 글로벌 AI 반도체 시장 경쟁은 GPU에 기반을 둔 기존의 강자인 엔비디아에 맞서 AMD와 인텔의 각축전으로 좁혀질 전망이다. 

끝나지 않는 합종연횡이다.

인텔코리아 권명숙 사장이 인텔 4 공정 기반 웨이퍼를 직접 선보이고 있다. 사진=인텔
인텔코리아 권명숙 사장이 인텔 4 공정 기반 웨이퍼를 직접 선보이고 있다. 사진=인텔

한국 플레이어도 한 방 있다
AI 반도체 시장의 각축전에 엔비디아, AMD, 인텔 등만 뛰어든 것은 아니다. 한국의 AI 무기상인들도 발 빠르게 움직이는 중이다.

삼성전자와 네이버의 협력이 눈길을 끈다. 

지난 19일 서울 서초구 더케이호텔에서 열린 '2023 인공지능반도체 미래기술 컨퍼런스'에서 'K-클라우드 실증사업 시범 서비스 시연'이 열린 가운데 양사의 협력으로 프로그래머블반도체(FPGA) 방식의 AI 반도체가 모습을 드러냈다. 저전력 및 고효율로 AI 모델을 구동할 수 있다. 330억개 파라미터를 가진 메타 라마를 가동하려면 통상적으로 2개 이상의 AI 반도체가 필요하지만, 양사의 AI 반도체는 하나면 충분하다는 설명이다.

이동수 네이버클라우드 이사는 "엔비디아 대비 전력 효율이 8배 높다"면서 "메모리에서 읽어내는 방식, 계산하는 방식을 다 뜯어 고쳤다”고 설명했다. 나아가 HBM이 아닌 LPDDR을 쓴 것도 눈길을 끈다. 폭발적인 AI 파워를 감당하려면 대중성을 갖춘 LPDDR이 유리하다는 판단이다. 시장의 선택을 받아야 하는 영역이지만 우선 지켜볼 필요가 있다는 설명이다.

한편 네이버클라우드는 자사가 주관사로 참여하는 과학기술정보통신부 및 정보통신산업진흥원의 ‘AI반도체 Farm 구축 및 실증’도 원만하게 끝내 눈길을 끈다. 

컨소시엄은 국산 AI반도체 기반의 컴퓨팅 인프라 구축과 AI-SaaS 플랫폼 솔루션화를 위해 총 연산용량 19.95PF 달성과 4개의 응용서비스 실증을 최종 목표로 삼고 3년에 걸쳐 단계별 상세 목표를 설정했다. 그 중 1차년도 목표인 1.1PF 구축 달성과 관제분야 AI 응용서비스 1개를 실증하고, 클라우드 플랫폼 분석 및 설계 등을 완료하며 성공적으로 사업을 수행했다는 설명이다.

통신사들도 AI 반도체 전략에 뛰어들었다. 당장 SKT는 사피온X200을 2020년 공개한 후 상용화에 돌입했고 최근에는 사피온X300도 전격 공개했다. TSMC의 7 나노 공정을 통해 생산된 제품이며 전작 대비 연산이 4배 빠르고, 전력 효율이 2배 높다는 설명이다.

사피온 X300. 사진=사피온
사피온 X300. 사진=사피온

사피온 류수정 대표는 “사피온은 지난 2020년 국내 최초로 데이터센터용 AI 반도체 X220을 발표한 이후, 자동차, 보안, 미디어 등 다양한 분야로 상용 서비스를 확대하고 있다”며 “산업 전분야에서 AI 반도체 활용도를 높여 고도의 AI 기술을 누구나 이용하도록 제공하고자 한다”고 전했다.

KT도 리벨리온 등과 긴밀하게 협력하고 있다. 초거대 AI 모델인 믿음을 공개한 상태에서 AI 풀스택 전략을 가동, 그 하드웨어 핵심에서 AI 반도체 전략에 드라이브를 걸었다. KT클라우드의 경우 리벨리온이 개발한 AI 반도체를 지난 5월 자사의 클라우드 기반 NPU 인프라에 탑재하기도 했다.