에이전틱 AI 시대... 퀄컴, PC의 두뇌를 다시 쓰다 [스냅드래곤 X 딥다이브 2025]

AI가 바꾼 PC의 패러다임

2025-11-19 미국 샌디에고=최진홍 기자

"당신을 대신해 행동하는 AI, 그것이 바로 에이전틱 AI(Agentic AI)이며 이를 위해서는 PC가 24시간 깨어 있어야 합니다"

미국 캘리포니아주 샌디에고에서 11일(현지시간) 열린 스냅드래곤 X 시리즈 아키텍처 딥다이브 2025는 지난 40여 년간 도구에 머물렀던 PC(Personal Computer)의 개념을 능동적 비서로 진화시키는 일종의 변곡점이다. 실제로 퀄컴은 이번 행사를 통해 AI가 퀄컴이라는 기업을 어떻게 변화시켰는지, 그리고 퀄컴이 AI를 통해 PC 시장을 어떻게 송두리째 바꾸려 하는지에 대한 거대한 청사진을 제시했다.

우펜트라 쿨카르니 부사장. 사진=최진홍 기자

인지를 넘어 행동으로 "에이전틱 AI의 부상"
행사에서 가장 주목받은 키워드는 단연 에이전틱 AI였다.

우펜드라 쿨카르니 퀄컴 제품 매니지먼트 부사장이 AI의 진화 단계를 인지(Perceptive)에서 생성(Generative)을 거쳐 행동(Agentic)으로 정의한 것이 눈길을 끈다. 그는 "생성형 모델은 당신을 위해 결과물을 만들어내지만 목표를 달성하기 위해 당신을 대신해 행동하지는 않는다"면서 "목표만 주면 오케스트레이터 에이전트가 작업을 분해하고 캘린더, 이메일 등 전문 에이전트와 협력해 스스로 작업을 완수하는 것이 에이전틱 AI의 핵심"이라고 설명했다.

퀄컴이 바라보는 미래 PC의 모습이 단순한 고성능 연산 장치가 아님을 시사한다. 사용자의 의도를 파악하고, 백그라운드에서 끊임없이 상황을 인지하며 사용자가 명령하기 전에 미리 준비하는 지능형 파트너다. 쿨카르니 부사장은 "마이크로소프트의 리콜 기능이 3초마다 스크린샷을 찍고 분석하듯 에이전트는 사용자의 최신 상황을 파악하기 위해 24시간 깨어 있어야 한다"며 상시 구동(Always-on)의 필요성을 역설하기도 했다.

이러한 비전은 퀄컴의 하드웨어 설계 철학을 근본적으로 변화시켰다. 루시안 코드레스쿠 퀄컴 기술 부사장은 "미래의 AI는 사용자가 명령하지 않아도 백그라운드에서 항상 실행되며 다음 작업을 예측해야 한다"며 이를 "기계의 지속적인 내면의 독백"이라고 표현했다.

이 내면의 독백을 유지하기 위해서는 막대한 전력이 소모될 수밖에 없으며, 퀄컴이 그토록 전력 효율성에 집착하는 이유도 바로 여기에 있다.

케다르 콘답 수석 부사장. 사진=최진홍 기자

NPU 80 TOPS의 의미... '성능의 평등' 선언
퀄컴은 이번 스냅드래곤 X2 엘리트 시리즈 전 라인업에 80 TOPS(초당 80조 회 연산) 성능의 NPU를 탑재했다. 경쟁사들이 등급에 따라 AI 성능을 차별화하는 것과는 대조적인 행보다.

이유는 무엇일까? 케다르 콘답 수석 부사장은 "우리가 AI 혁신을 선도하고 있다고 말하는 이유는 소비자가 앞으로 사용할 AI 애플리케이션을 충분히 수용할 수 있는 헤드룸(여유 공간)을 제공하기 때문"이라고 밝혔다.

'AI 경험의 보편화'를 위한 전략적 결단으로 볼 수 있다. 콘답 수석 부사장은 "전 세계 소비자들에게 서로 다른 가격대에서도 동일한 경험을 제공하는 것이 목표"라며 "어떤 가격대의 제품을 사더라도 같은 수준의 AI 경험을 누릴 수 있도록 했다"고 강조했다. 소비자가 저가형 모델을 구매했다는 이유로 미래의 핵심 기술인 AI 에이전트 기능을 사용하지 못하는 일이 없도록 하겠다는 의지다.

한편 코드레스쿠 부사장은 80 TOPS라는 수치 자체보다 그 성능을 구현하는 방식에 주목하기도 했다. 그는 "단순히 매트릭스 유닛만 키운다고 성능이 오르지 않는다"며 '암달의 법칙'을 인용해 설명했다. 나아가 스냅드래곤 X2의 NPU는 스케일러(두뇌), 벡터(일꾼), 매트릭스(엔진)라는 세 가지 핵심 요소가 유기적으로 결합하여 시스템 밸런스를 맞췄다는 설명이다.

스케일러의 쓰레드를 2배 늘리고 벡터 유닛의 성능을 143% 향상시킨 것은 특정 벤치마크 점수 올리기가 아닌, 실제 AI 워크로드를 가장 효율적으로 처리하기 위한 공학적 해답이다.

사진=최진홍 기자

CPU에 들어온 AI
퀄컴의 AI 전략에서 또 하나 눈여겨볼 점은 AI 연산 능력을 NPU에만 국한하지 않았다는 점이다. 당장 프라딥 카나파티필라 엔지니어링 부사장이 공개한 오라이온(Oryon) CPU 아키텍처는 CPU 클러스터 내부에 '매트릭스 엔진'을 직접 내장하는 파격적인 설계를 채택했다.

카나파티필라 부사장은 "클러스터당 이 가속기의 인스턴스가 하나씩 있다"며 "이는 CPU 명령어 스트림에 완전히 통합되어 있다"고 설명했다.

NPU로 데이터를 보내고 받는 지연 시간조차 허용하지 않겠다는 뜻이다. CPU가 처리하는 일반적인 작업 흐름 속에서 빈번하게 발생하는 작은 AI 연산들은 CPU가 직접 처리하고, 거대하고 지속적인 AI 워크로드는 NPU가 맡는 '역할 분담'이 칩 레벨에서 구현된 것이다.

개발자들에게도 큰 의미를 갖는다. 별도의 NPU 코드를 짜지 않아도 CPU 명령어를 통해 자연스럽게 AI 가속 기능을 활용할 수 있기 때문이다. 카나파티필라 부사장은 "개발자들은 복잡한 메모리 동기화 문제없이 CPU 연산과 AI 연산 명령어를 자연스럽게 혼합하여 프로그래밍할 수 있게 된다"고 강조했다.

AI가 특정 앱의 전유물이 아니라 운영체제와 일반 소프트웨어 전반에 깊숙이 스며드는 '퍼베이시브 AI(Pervasive AI)' 시대를 대비한 포석이다.

사진=퀄컴

훈련에서 추론으로... 온디바이스 AI의 미래
AI 전반의 큰 그림에 대해서도 시선이 집중된다. 당장 콘답 수석 부사장은 행사 기간 현재의 AI 열풍이 거품이 아니냐는 질문에 단호하게 고개를 저었다.

그는 "오늘날 AI 세상은 트레이닝(학습)에 집중해 있지만 앞으로의 세상은 인퍼런스(추론) 중심으로 이동할 것"이라며 온디바이스 AI의 폭발적 성장을 예고했다. 클라우드 비용 문제와 개인정보 보호 이슈 등으로 인해 결국 AI 연산의 상당 부분이 기기 내부(Edge)로 들어올 수밖에 없다는 논리다.

그는 "휴대폰에서 글을 쓰기 시작하고, 인퍼런싱은 노트북에서 이루어지며 이미지 생성도 노트북에서 바로 돌아가는 디바이스-투-디바이스 경험이 아이부터 어른까지 모든 소비자의 삶에 접점을 만들 것"이라고 전망했다.