미국 샌디에고에서 11일(현지시간) 스냅드래곤 X 시리즈 아키텍처 딥다이브 2025 행사가 열린 가운데 18코어, 5GHz라는 경이적인 성능의 오라이언 CPU의 내밀한 '비밀'이 전격 공개됐다. 다만 퀄컴은 오라이언을 단순한 고성능 CPU가 아닌, 차세대 AI PC 시대를 여는 전략적 플랫폼으로 규정하고 있었다.
핵심 승부수는 바로 매트릭스 엔진(Matrix Engine)이다. 당장 프라딥 카나파티필라 퀄컴 엔지니어링 부사장은 "이전 세대에는 없었던 CPU 자체의 매트릭스 가속기를 갖추고 있다"고 발표했다.
오라이언 CPU 아키텍처에서 가장 혁신적인 부분 중 하나로 평가된다.

NPU와는 다르다… CPU 코어와 L2 캐시 공유하는 '매트릭스 엔진'
일반적으로 AI 연산은 NPU(신경망 처리 장치)라는 별도의 하드웨어 블록이 담당하는 것으로 알려져 왔다. 하지만 퀄컴은 NPU와 별개로 CPU 클러스터 내부에 직접 AI 연산을 위한 전용 가속기를 탑재하는 파격적인 결정을 내렸다.
카나파티필라 부사장은 "클러스터당 이 가속기의 인스턴스가 하나씩 있다"고 설명했다. 그리고 오라이언 CPU는 2개의 프라임 클러스터와 1개의 퍼포먼스 클러스터, 총 3개의 클러스터로 구성된다. 이는 곧 3개의 매트릭스 엔진 인스턴스가 CPU 전체에 분산 배치되어 있음을 의미한다.
기존 NPU 방식과 근본적인 차이가 있다. 매트릭스 엔진 자체가 클러스터에 위치해 있기 때문에 L2와 자체적으로 메모리 트랜잭션을 수행할 수 있기 때문이다. CPU 코어와 동일한 클러스터 내에서 16MB 또는 12MB의 방대한 L2 캐시를 직접 공유한다는 설명이다.
AI 연산에 필요한 데이터가 NPU로 전달되고 다시 받아오는 과정에서 발생하는 데이터 이동 병목과 지연 시간을 원천적으로 제거할 수 있음을 의미한다. NPU가 무거운 AI 작업을 처리하는 '전문 일꾼'이라면, 매트릭스 엔진은 CPU 코어 바로 옆에서 실시간으로 발생하는 자잘하고 즉각적인 AI 추론 작업을 빛의 속도로 처리하는 '민첩한 조수' 역할을 수행하는 셈이다.
심지어 이 매트릭스 엔진은 논리적으로 SMT(Simultaneous Multi-Threading, 동시 멀티스레딩)를 지원한다. 물리적으로는 클러스터당 1개지만, 소프트웨어 관점에서는 6개의 코어가 각각 자신만의 AI 가속기를 가진 것처럼 독립적으로 작동한다는 것이다.
오프로드 엔진이 아니라 CPU 아키텍처 및 마이크로 아키텍처의 일부로 설정됐다. 별개의 코프로세서가 아니라 CPU 명령어 세트(ISA)에 완벽하게 통합된 'CPU의 확장 기능'이라는 것이다.
개발자들에게 매력적이다. 그는 "ML 가속기에도 CPU와 동일한 메모리 순서 및 일관성 규칙이 적용된다"며 "개발자들은 복잡한 메모리 동기화 문제없이 CPU 연산과 AI 연산 명령어를 자연스럽게 혼합하여 프로그래밍할 수 있게 된다"고 말했다. 이는 AI 기능을 운영체제(OS) 커널 레벨이나 애플리케이션의 핵심 로직에 통합하는 것을 훨씬 용이하게 만들 것이라는 분석이다.
다만 매트릭스 엔진만으로 다가올 AI 시대를 준비하기에는 '나이브한 대응'이라는 지적도 나온다. 이는 더 지켜볼 필요가 있다는 것이 중론이다.

"MS와 긴밀한 관계"… x86 에뮬레이션 하드웨어 지원
퀄컴 오라이언의 또 다른 전략적 무기는 바로 마이크로소프트(MS)와의 공고한 파트너십이다. ARM 기반 윈도우 PC의 성공은 하드웨어 성능뿐만 아니라, 기존 x86 윈도우 애플리케이션과의 호환성에 달려있기 때문이다.
특히 프리즘(Prism) 에뮬레이터에 대해서는 심도있는 협력이 이뤄지고 있다는 말이 나왔다. 퀄컴이 오라이언 CPU를 설계하는 단계부터 MS의 '프리즘' x86 에뮬레이터가 최상의 성능을 낼 수 있도록 하드웨어와 소프트웨어 최적화를 동시에 진행했음을 시사하는 순간이다.
결정적인 증거는 TSO(Total Store Order) 지원 여부다. TSO는 x86 CPU가 사용하는 메모리 순서 모델로, ARM의 메모리 모델(Relaxed)보다 더 엄격하다. 그리고 오라이언 CPU는 하드웨어 수준에서 x86의 메모리 동작 방식을 지원, 에뮬레이션으로 인한 성능 저하를 최소화했다는 설명이다.
과거 ARM 윈도우 PC의 가장 큰 약점으로 지적받았던 x86 앱 호환성 및 성능 문제를 퀄컴과 MS가 프리즘이라는 소프트웨어와 오라이언이라는 하드웨어를 공동으로 설계함으로써 정면 돌파하겠다는 전략이다.

"스펙터, 멜트다운 이후 모든 공격 완화"… 강력한 보안 아키텍처
AI, 에뮬레이션과 더불어 퀄컴이 강조한 마지막 카드는 '보안'이다. PC, 특히 기업용 시장에서 보안은 성능만큼이나 중요한 요소기 때문이다.
카나파티필라 부사장은 "설계에 내장된 보안 아키텍처는 탄탄한 구조를 가지고 있다"면서 "보안 EL2, TEE(신뢰 실행 환경) 등 다층적인 보안 구조를 갖추고 있다"고 밝혔다.
특히 주목할 부분은 '사이드 채널 공격(Side-channel attack)'에 대한 대응이다. 2017년 인텔 CPU에서 발견된 '스펙터(Spectre)'와 '멜트다운(Meltdown)'은 CPU의 추측 실행(speculative execution) 기능을 악용하는 심각한 보안 취약점이었다.
퀄컴은 다르다. 카나파티필라 부사장은 "우리는 모든 종류의 사이드 채널 공격을 완화했다"며 "공격이 악용하는 CPU 내부의 예측기 등 마이크로아키텍처 구조 자체를 원천적으로 보호하도록 설계했다"고 말했다. 나아가 '컨트롤 흐름 무결성(Control Flow Integrity)'을 위한 '포인터 인증(Pointer Authentication)'과 '분기 대상 ID(Branch Target ID)' 같은 최신 방어 기술도 모두 내장했다고 밝혔다.
퀄컴이 ARM 아키텍처를 기반으로 처음부터 CPU를 설계하면서도 x86 진영이 오랫동안 안고 온 보안 부채에서 더 자유로운 보안 아키텍처를 구현했음을 강조하는 대목이다.
오라이언 CPU의 정체성이 망라되는 순간이다. CPU 코어와 긴밀하게 통합된 매트릭스 엔진을 통해 차세대 온디바이스 AI 시대를 선점하고, 마이크로소프트와의 긴밀한 협력을 통해 x86 에뮬레이션이라는 가장 큰 난제를 하드웨어 수준에서 해결하는 한편 '사이드 채널 공격'을 원천 방어하는 강력한 보안으로 무장한 전략적 플랫폼이라는 평가다.













