미국 샌디에고에서 11일(현지시간) 열린 스냅드래곤 X 시리즈 아키텍처 딥다이브 2025 행사의 하이라이트는 단연 오라이언(Oryon) CPU였지만, PC 시장의 패권 장악을 노리는 퀄컴의 야심은 CPU 하나에 머물지 않았다. 오라이언이라는 강력한 두뇌와 완벽하게 호흡을 맞출 그래픽 심장, 아드레노 X2(Adreno X2) GPU의 상세 아키텍처가 베일을 벗었다.
무대에 오른 에릭 데머스(Eric Demers) 퀄컴 엔지니어링 수석 부사장은 "우리가 오랫동안 준비해 온 무언가를 여기 올라와 발표하는 것은 정말 스릴 넘치는 일"이라며 흥분을 감추지 않았다.
그가 공개한 아드레노 X2는 퀄컴의 8세대 아드레노 제품군으로 "지금까지 최고의 세대라고 생각한다"는 자신감처럼, 퀄컴이 PC 시장을 위해 칼을 갈고 만든 괴물급 GPU의 등장이다.

2.3배 성능, 125% 효율… "가장 크고 빠른 GPU"
퀄컴의 목표는 확실하다. 바로 X1(이전 세대)보다 훨씬 더 나은 성능을 제공하는 것이다.
퀄컴은 두 가지 전략을 동시에 추진했다. ALU와 백엔드 등 모든 측면에서 약 33% 더 많은 성능을 추가해 GPU의 물리적인 크기 자체를 키우는 것과 모바일에서 했던 것보다 훨씬 더 높은 클럭 주파수를 밀어붙이는 것이다.
이를 위해 코어 일부를 재설계하고 더 빠른 SRAM을 사용하는 등 전면적인 구조 변경을 감행했다는 설명이다.
데머스 수석 부사장은 아드레노를 두고 "우리 조직에서 만든 GPU 중 가장 큰 GPU이자 우리 조직에서 만든 가장 빠른 GPU며, 동시에 엄청난 전력 소모를 일으키지만 씬앤라이트(thin and lights) 폼팩터를 목표로 하는 제품에서 성능만 높이는 것은 퀄컴의 철학과 맞지 않는다"며 "이 모든 것을 해결하기 위해 노력했으며 와트당 성능, 즉 효율성은 우리 DNA의 일부"라고 강조했다.
크기와 클럭을 높여 성능을 확보하는 동시에 아키텍처 전반의 효율성 개선을 통해 전력 상승을 억제하는, 두 마리 토끼를 잡는 것이 핵심 과제였다는 설명이다.
목표를 달성했다. 데머스 부사장은 "9월 등판한 아드레노 X2는 125%의 전력 효율성을 자랑한다"면서 "전작과 동일한 성능 수준에서 2.5배 더 적은 전력을 사용한다는 것"이라 말했다. 단순히 빨라진 것이 아니라, 전례 없는 수준의 효율성을 바탕으로 압도적인 성능 점프를 이뤄냈다는 분석이다.

'미니 GPU' 레고 블록… '슬라이스 아키텍처'의 비밀
성능과 효율의 마법 뒤에는 슬라이스(slice) 아키텍처가 자리하고 있다. 그리고 아드레노 X2는 4개의 슬라이스(X2-90은 4슬라이스, X2-85는 3슬라이스)로 구성되어 있다.
슬라이스는 미니 GPU로 정의할 수 있다. 프론트엔드, 지오메트리 처리, 셰이더 프로세서, 백엔드(ROP), 심지어 HPM 메모리까지 모든 것이 하나의 슬라이스에 포함되어 확장된다.
이 '미니 GPU' 개념은 엔지니어링과 성능 두 측면에서 막대한 이점을 가져다준다. 또 유연하게 설계되었다는 설명이다. 그는 "엔지니어링 리소스를 크게 절약할 뿐 아니라 단일 슬라이스를 정말 잘 만들 수 있게 집중할 수 있는 구조"라며 "1.8~1.85GHz와 같은 높은 GPU 클럭을 달성하기 위해서도 이 슬라이스 하나를 완벽하게 튜닝하는 것이 매우 중요했다"고 말했다. 나아가 이 구조 덕분에 슬라이스 개수를 늘릴 때 거의 선형에 가까운 스케일링을 얻을 수 있다는 설명이다.
슬라이스 내부에도 2개의 셰이더 코어가 있지만 필요하다면 슬라이스 구성 자체도 바꿀 수 있는 유연성이 있다. 요약하면, 슬라이스는 우리가 GPU를 조립할 때 사용하는 파란 레고 블록과 같은 개념이다.

4배 빨라진 지오메트리, 강력해진 하드웨어
슬라이스 개념은 GPU의 모든 부분에 적용된다. 전작 대비 4배의 프리미티브 처리율을 달성했다. 윈도우즈 온 ARM(Windows on ARM) 애플리케이션은 지오메트리가 풍부하다는 퀄컴의 분석에 기반한 전략적 결정이다. 특히 언리얼 엔진 5의 나나이트처럼 수많은 지오메트리를 처리해야 하는 최신 게임 환경에서 강력한 성능을 발휘할 것이라는 전망이다.
레이 트레이싱(RT) 유닛 역시 대폭 강화됐다. 전작에도 레이 트레이싱이 있었지만 DX 12.1과 벌칸 익스텐션을 통한 '레이 쿼리' 수준이었던 반면, X2는 완전한 레이 트레이싱 유닛을 갖추고 있다는 설명이다. 그는 "16개의 레이 트레이싱 유닛이 있다"고 밝히기도 했다.
백엔드(ROP) 역시 사이클당 64 ROPs를, Z 검사의 경우 그 두 배인 사이클당 최대 128개의 프래그먼트를 처리할 수 있다. 모든 것이 '미니 GPU' 슬라이스 4개 분량으로 확장된 결과다.
이 모든 하드웨어는 두 배로 늘어난 L2 캐시와 시스템 레벨 캐시를 통해 유기적으로 연결된다. 그는 "GPU가 총 320 기가바이트(GB/s) 정도의 대역폭을 처리할 수 있으며, 일반적으로 이 특정 구성에서는 대역폭 제한에 걸리지 않는다"고 덧붙이기도 했다.
한편 데머스 부사장은 새로운 아드레노를 두고 "모바일 GPU는 아니다"라고 선을 그었다. 그는 "4개의 슬라이스를 가진 모바일 GPU는 없다"며 "윈도우즈 온 ARM을 위해 맞춤 설계된 디자인"이라고 강조했다. 8세대 아드레노라는 DNA를 공유하지만, PC용으로 완전히 새롭게 태어난 독자적인 GPU라는 뜻이다.

실전 게임 성능, 경쟁사를 압도하다
데머스 부사장은 약 20개의 게임에서 테스트한 결과, 새로운 아드레노가 전작 대비 약 2.5배의 성능을 달성하고 있다고 말했다. 그는 "토탈 워 햄머(Total War Hammer)처럼 4배의 성능을 내는 다른 게임들도 있고, 유콩(Wukong)처럼 50% 정도 더 높은 성능"에 그친 경우도 있지만 전반적인 성능 향상은 보인다"면서 "기대했던 성능이 실제 실리콘에서 나온다는 것을 확인하는 것은 언제나 좋은 일"이라고 만족했다.
경쟁사와의 비교에서도 자신감을 보였다. 그는 "인텔 코어 울트라 9와 AMD의 스트릭스 포인트를 씬앤라이트 폼팩터에서 비교 테스트한 결과 특정 게임을 위한 최적화가 없는 상태에서도 우수한 성능을 보여준다"고 말했다.
이러한 성능은 전력 효율이 뒷받침하기에 가능하다. 전작이 25와트에서 내는 성능(12.2 FPS)을 새로운 아드레노는 10와트에서 달성하기 때문이다. 만약 25와트를 공급한다면 70% 더 높은 성능을 달성한다는 계산이 나온다. 이는 새로운 아드레노가 '오라이언' CPU와 함께 씬앤라이트 노트북이라는 전력 제약 환경 속에서 경쟁사들을 압도하는 '와트당 성능'을 제공할 핵심 무기라는 점을 잘 보여준다.













