미국 캘리포니아주 샌디에고. 퀄컴의 본사가 위치한 이곳은 1년 내내 온화한 날씨를 자랑하지만 지난 11일(현지시간)부터 이틀간 이어진 스냅드래곤 X 시리즈 아키텍처 딥다이브 2025 행사장만큼은 기술 혁신의 열기로 뜨겁게 달아올랐다.
이번 행사는 단순한 신제품 쇼케이스가 아니었다. 인텔과 AMD가 수십 년간 철옹성처럼 지켜온 x86 기반의 PC 시장 패권에 대해, 모바일의 절대 강자 퀄컴이 던지는 기술적 선전포고이자 거대한 패러다임 전환의 선언이었다.
퀄컴은 이 자리에서 차세대 PC 플랫폼인 스냅드래곤 X2 엘리트 익스트림의 아키텍처를 현미경으로 들여다보듯 낱낱이 공개했다. 40년간 모바일이라는 극한의 환경에서 연마해 온 저전력 고성능 DNA를 PC라는 더 큰 캔버스에 어떻게 이식했는지, 그리고 왜 지금이 AI PC의 골든타임인지를 증명했다. 기존 PC 시장의 문법을 철저히 파괴하고 퀄컴이 가장 잘하는 방식으로 PC를 재정의한 그 현장을 심층 분석했다.

케다르 콘답(Kedar Kondap) 퀄컴 수석 부사장 겸 컴퓨트/게이밍 본부장은 11일(현지시간) 미국 샌디에고에서 열린 스냅드래곤 X 딥다이브 2025 현장에서 창립 40주년을 맞이한 퀄컴의 정체성을 기술 회사(Technology Company)로 규정했다.
"많은 이들이 퀄컴을 모뎀 회사로 기억합니다. 맞습니다. 우리는 지난 40년간 전 세계 80억 인구를 연결하는 무선 기술의 최전선에 있었습니다. 하지만 우리는 멈추지 않았습니다. 피처폰에서 스마트폰으로의 전환기, 우리는 강력한 연산 능력과 저전력 설계, 그리고 끊김 없는 연결성을 손톱만한 칩(SoC) 하나에 집약시키는 마법을 부렸습니다. 이제 우리는 그 마법을 PC 시장에 뿌리려 합니다."

"통신 회사에서 기술 회사로, 그리고 오케스트라의 지휘자로"
콘답 부사장이 제시한 퀄컴의 PC 전략 핵심은 이종(Heterogeneous) 컴퓨팅이다. 그는 이를 아름다운 오케스트라에 비유했다.
기존 x86 PC가 거대한 범용 프로세서(CPU) 혼자서 북 치고 장구 치며 모든 짐을 떠안는 구조라면 퀄컴의 방식은 다르다. CPU, GPU, NPU, ISP(이미지 신호 프로세서), 센싱 허브 등 각기 다른 특기를 가진 전용 코어(악기)들이 시스템(지휘자)의 통제 하에 유기적으로 협력하는 구조다.
"예를 들어 화상 회의를 한다고 가정해 봅시다. 기존 PC는 단순히 사용자의 목소리를 인식하기 위해 고성능 CPU를 깨워야 했습니다. 이는 마치 모기 한 마리를 잡기 위해 대포를 쏘는 것과 같은 엄청난 전력 낭비입니다. 퀄컴의 오케스트라에서는 다릅니다. 초저전력 센싱 허브 내의 작은 NPU가 음성 인식을 전담하고, 거대한 메인 CPU는 잠을 잡니다. 이것이 바로 소비자가 원하는 오래가는 배터리와 고성능이라는 두 마리 토끼를 잡는 비결입니다"
퀄컴은 보이지 않는 기술의 가치도 강조했다. 콘답 부사장은 GPS를 예로 들었다. 15년 전 도심 빌딩 숲에서 끊기던 GPS가 지금은 위성망과 와이파이 삼각 측량을 결합해 완벽해진 것처럼, 소비자는 복잡한 기술적 원리를 알 필요 없이 그저 잘 작동하는 경험을 누려야 한다는 것이다.
그는 "전원 플러그를 꽂았을 때만 성능이 나오는 반쪽짜리 노트북은 이제 끝났다"며 "이동 중이든 카페든, 퀄컴의 칩은 언제나 최고의 성능과 수일간 지속되는 배터리 수명을 제공하는 욕심쟁이가 될 것"이라고 단언했다.

나노 공정과 모놀리식 설계의 완벽한 결합
파라그 아가시(Parag Agashe) 퀄컴 엔지니어링 수석 부사장이 무대에 올라 스냅드래곤 X2 엘리트 익스트림의 시스템 아키텍처를 해부했다. 괴물의 심장은 TSMC의 3나노 공정(N3X)으로 빚어졌으며, 무려 310억 개 이상의 트랜지스터가 집적됐다.
가장 큰 기술적 쟁점은 모놀리식(Monolithic) 설계였다. 최근 경쟁사들이 수율과 비용 절감을 위해 여러 칩을 이어 붙이는 칩렛(Chiplet) 구조로 선회하는 것과 달리, 퀄컴은 단일 다이(Single Die) 구조를 고수했다. 아가시 부사장은 이에 대해 명쾌한 답변을 내놨다.
"우리는 매 세대마다 성능(Performance), 전력(Power), 비용(Area)이라는 PPA 방정식을 풉니다. 검토 결과, 이번 세대에서 최적의 전력 효율과 낮은 지연 시간(Latency)을 달성하는 정답은 여전히 통합 SoC, 즉 모놀리식 설계였습니다. 우리는 칩렛 기술이 없어서 안 하는 게 아니라, 사용자의 경험을 위해 가장 타협 없는 선택을 한 것입니다"
이를 뒷받침하는 것이 PC 환경에 특화된 맞춤형 코히런트 스파인 패브릭(Coherent Spine Fabric)이다. 단순히 모바일 IP를 가져온 것이 아니라, PC의 고성능 데이터 흐름을 감당하면서도 모바일급의 저지연성을 유지하도록 새로 설계된 고속도로다.
메모리 아키텍처 또한 혁신적이다. 192비트 인터페이스의 LPDDR5x 메모리를 채택, 초당 최대 228GB의 데이터 전송 속도를 구현했다. 이는 전작 대비 69% 향상된 수치로, 거대 언어 모델(LLM)을 PC 자체에서 돌리는 온디바이스 AI의 필수 조건인 메모리 대역폭 문제를 해결했다.
특히 메모리를 칩 패키지 안에 내장하는 패키지 온 패키지 또는 근접 배치 방식을 통해 메인보드 공간을 줄이고 전력 효율을 극대화했다. 최대 128GB 용량 제한에 대한 우려에 대해 아가시 부사장은 "AI 모델의 경량화(양자화) 기술 속도를 고려할 때, 예측 가능한 미래에 128GB는 차고 넘치는 용량"이라며 자신감을 피력했다.
보안 측면에서는 스냅드래곤 가디언(Snapdragon Guardian)이 공개됐다. 이는 메인 OS와 완전히 분리된 별도의 하위 시스템이다. 내부에 독립적인 RISC-V 프로세서를 탑재해, 윈도우가 블루스크린을 띄우거나 전원이 꺼진 상태에서도 원격으로 PC를 잠그거나 데이터를 삭제하고 위치를 추적할 수 있다. 기업용 시장이 요구하는 최고 수준의 보안성을 소비자용 PC에도 적용한 것이다.

효율 코어는 필요 없다… 5GHz로 질주하는 오라이언
이번 딥다이브의 하이라이트는 단연 퀄컴이 자체 설계한 3세대 커스텀 CPU 오라이언(Oryon)의 상세 스펙 공개였다. 프라딥 카나파티필라(Pradeep Kanapathipillai) 퀄컴 엔지니어링 부사장은 오라이언을 "PC와 데이터센터를 겨냥해 바닥부터(from the ground up) 새로 깎은 걸작"이라고 소개했다.
오라이언 CPU는 총 18개의 코어로 구성되는데, 그 구성이 파격적이다. 인텔이나 애플이 사용하는 고성능(P) 코어 + 고효율(E) 코어의 하이브리드 구조를 과감히 버렸다. 대신 12개의 프라임(Prime) 코어와 6개의 퍼포먼스(Performance) 코어로 이루어진 3개의 클러스터(Prime 2개, Performance 1개) 구조를 택했다. 소위 약한 코어를 아예 없앤 것이다.
"왜 효율 코어가 없느냐고요? 우리의 퍼포먼스 코어는 이미 경쟁사의 효율 코어보다 전력을 적게 쓰면서 성능은 월등하기 때문입니다. 그리고 우리의 프라임 코어는 현존 최고 성능을 냅니다. 이 두 가지 조합만으로도 저전력부터 초고성능까지 모든 동적 범위를 완벽하게 커버할 수 있습니다."
그 결과 오라이언은 ARM 기반 커스텀 CPU 사상 최초로 마의 벽이라 불리던 5GHz 클럭 속도를 돌파했다. 이를 뒷받침하기 위한 캐시 메모리 시스템도 압도적이다. 프라임 클러스터에 16MB, 퍼포먼스 클러스터에 12MB 등 총 44MB에 달하는 L2 캐시를 탑재했다.
여기에 CPU 파이프라인의 입구인 프론트엔드에는 192KB의 L1 명령어 캐시와 한 번에 9개의 명령어를 처리하는 9-wide 디코드 유닛을 배치해 데이터 병목을 원천 차단했다. 특히 4단계에 걸친 정교한 분기 예측기는 예측 실패 시 복구 시간을 단 10~13 사이클로 줄여, 고클럭 CPU의 약점인 파이프라인 낭비를 최소화했다.
하지만 오라이언의 진짜 비밀 병기는 따로 있었다. 바로 CPU 내부에 심어진 매트릭스 엔진(Matrix Engine)이다. 이는 80 TOPS 성능의 메인 NPU와는 별개로, CPU 클러스터 내부에 위치해 L2 캐시를 직접 공유하는 소형 AI 가속기다.
"기존에는 작은 AI 연산 하나를 하려 해도 데이터를 NPU로 보내고 받는 과정에서 지연 시간이 발생했습니다. 하지만 오라이언은 CPU 바로 옆에 붙은 매트릭스 엔진이 이를 빛의 속도로 처리합니다. NPU가 무거운 짐을 나르는 트럭이라면, 매트릭스 엔진은 CPU의 손발이 되어주는 날쌘 오토바이입니다."
한편 퀄컴은 마이크로소프트(MS)와의 긴밀한 협업을 통해 x86 에뮬레이션의 난제를 하드웨어적으로 풀었다. x86 아키텍처의 메모리 순서 모델인 TSO(Total Store Order)를 하드웨어 레벨에서 지원, MS의 프리즘(Prism) 에뮬레이터가 번역 과정에서 겪는 부하를 획기적으로 줄인 것이다. 또한 스펙터, 멜트다운 등 CPU의 구조적 결함을 노리는 사이드 채널 공격을 원천 봉쇄하는 보안 설계도 적용되어 기업 시장 진입의 장벽을 허물었다.

레고 블록처럼 쌓아 올린 아드레노 X2의 마법
그래픽을 담당하는 아드레노(Adreno) X2 GPU 세션에서는 에릭 데머스(Eric Demers) 퀄컴 엔지니어링 수석 부사장이 무대에 올랐다. 그는 "아드레노 X2는 모바일 GPU의 확장판이 아니다. 윈도우 PC 환경을 위해 완전히 새로 설계된 짐승"이라며 강한 자신감을 드러냈다.
아드레노 X2의 핵심은 슬라이스(Slice) 아키텍처다. 이는 프론트엔드, 셰이더, 텍스처 유닛, 백엔드(ROP) 등 GPU의 모든 구성 요소를 포함한 미니 GPU 형태의 블록이다. 퀄컴은 이 슬라이스를 4개(X2-90 모델 기준) 결합해 하나의 거대한 GPU를 만들었다. 마치 레고 블록을 쌓듯 유연한 확장이 가능하며, 엔지니어링 리소스를 절약하면서도 각 슬라이스를 1.8GHz 이상의 고클럭으로 완벽하게 튜닝할 수 있는 비결이다.
그 결과 아드레노 X2는 전작 대비 2.5배의 성능 향상을 이뤘으며, 전력 효율은 무려 125%나 개선됐다. 경쟁사의 외장 GPU가 25W를 소모하며 내는 성능을 아드레노 X2는 불과 10W로 구현해낸다.
여기에 HPM(High Performance Memory)이라는 비장의 무기가 더해졌다. 이는 21MB 용량의 GPU 전용 범용 메모리로, 단순한 캐시를 넘어선다. 4개의 슬라이스에 분산 배치된 HPM은 GPU가 렌더링한 데이터를 시스템 메모리(DRAM)로 보내지 않고 내부에서 후처리(Post-processing)까지 끝낼 수 있게 한다. 데이터 이동이 줄어드니 전력 소모는 줄고 성능은 비약적으로 상승한다.
게이밍 기능 지원도 완벽에 가깝다. 다이렉트X 12.2 얼티밋의 모든 기능을 지원하며, 특히 레이 트레이싱(Ray Tracing) 성능이 일취월장했다. 전작이 소프트웨어 방식에 의존했던 바운딩 볼륨 순회(BVH) 과정을 하드웨어 가속기로 처리하도록 변경해, 실제 게임에서 프레임 저하 없는 빛 반사 효과를 구현했다.
가장 큰 우려였던 호환성 문제도 정면 돌파했다. 데머스 부사장은 "에뮬레이션이라는 단어를 싫어한다. 우리의 드라이버는 100% 네이티브다"라고 강조했다. ARM 윈도우의 아킬레스건이었던 안티 치트 프로그램 역시 에픽게임즈 등 주요 업체와 협력해 네이티브 지원을 이끌어냈으며, GPU 드라이버 업데이트 주기를 월간으로 단축해 최신 게임 최적화에 기민하게 대응하겠다는 약속도 잊지 않았다.

80 TOPS 숫자보다 중요한 시스템의 균형
마지막 세션은 퀄컴이 그리는 AI PC의 미래, NPU(신경망처리장치)에 할애됐다. 퀄컴은 스냅드래곤 X2 전 라인업에 80 TOPS(초당 80조 회 연산) 성능의 NPU를 탑재한다고 발표했다. 이는 경쟁사 대비 3~5배 높은 수치지만, 퀄컴은 단순한 숫자 경쟁을 거부했다.
루시안 코드레스쿠(Lucian Codrescu) 퀄컴 기술 부사장은 NPU 설계의 핵심을 시스템 밸런스와 암달의 법칙으로 설명했다.
"AI 성능을 높이겠다고 매트릭스 연산 유닛만 무작정 키우면 어떻게 될까요? 정작 데이터를 처리하는 두뇌나 메모리가 따라오지 못해 전체 성능은 제자리걸음입니다. 이것이 암달의 법칙입니다. 퀄컴의 헥사곤 NPU는 이를 피하기 위해 스칼라(제어), 벡터(전처리), 매트릭스(연산) 유닛을 동시에 업그레이드했습니다."
실제로 X2 NPU는 두뇌 역할을 하는 스칼라 유닛의 쓰레드를 2배로 늘리고, 일꾼인 벡터 유닛 성능을 143% 향상시켰다. 또한 거대 언어 모델(LLM)을 쪼개지 않고 한 번에 처리할 수 있도록 64비트 주소 체계를 도입했다.
무엇보다 중요한 것은 전력 효율이다. 코드레스쿠 부사장은 "미래의 AI는 사용자가 시키지 않아도 백그라운드에서 항상 작동하며 다음을 예측하는 에이전틱(Agentic) AI가 될 것"이라고 정의했다. 기존 CPU 작업 위에 AI라는 짐이 더해지는 상황에서, 배터리만으로 하루 종일 AI 비서를 구동하려면 압도적인 전력 효율이 필수라는 것이다. 이를 위해 퀄컴은 매트릭스 유닛에 별도의 전원 레일을 깔아, AI가 필요할 때만 전력을 쓰고 평소에는 완전히 끌 수 있도록 설계했다.
우펜드라 쿨카르니(Upendra Kulkarni) 부사장은 실제 벤치마크 결과를 공개하며 퀄컴의 우위를 증명했다. Procyon AI 벤치마크에서 스냅드래곤 X2의 NPU는 경쟁사 NPU 대비 5.7배, 심지어 경쟁사 GPU보다도 3.4배 높은 점수를 기록했다.
그는 "우리는 단순히 칩만 만드는 게 아니다. 윈도우 ML이나 퀄컴 QNN 같은 개발 도구를 통해, 개발자가 별다른 최적화 없이도 이 강력한 실리콘 속도(Speed of Silicon)를 100% 누릴 수 있게 생태계를 구축했다"고 강조했다.

모바일에서 온 혁명, PC의 미래를 바꾸다
이틀간의 딥다이브 행사를 통해 퀄컴이 보여준 것은 단순한 스펙의 나열이 아니었다. 그것은 40년간 모바일이라는 가장 가혹한 환경에서 생존하며 터득한 생존 기술을 PC라는 정체된 시장에 이식하려는 거대한 실험이자 도전이었다.
전력 효율을 위해 미세한 공정 하나까지 쥐어짜고, 칩 내부의 데이터 이동 경로를 단축하기 위해 아키텍처를 갈아엎는 퀄컴의 집요함은 그동안 성능 향상을 위해 전력 소비 증가를 당연시했던 기존 PC 업계에 경종을 울리기에 충분했다.
TDP(열 설계 전력)로부터의 해방. 파라그 아가시 부사장이 던진 이 말은 스냅드래곤 X2가 가져올 변화를 함축한다. 팬이 없는 초박형 노트북부터 고성능 워크스테이션까지, 하나의 아키텍처로 모든 폼팩터를 아우르며 언제 어디서나 최고의 AI 경험을 제공하겠다는 퀄컴의 비전은 이제 현실이 되었다.
x86 제국이 지배하던 40년의 질서가 흔들리고 있다. 그리고 그 균열의 틈새로, 스마트폰의 DNA를 가진 새로운 PC가 걸어 나오고 있다. 2025년, 퀄컴이 쏘아 올린 이 작은 칩은 PC 시장의 판도를 뒤집을 거대한 신호탄이 될 전망이다.













