[리스크 콕] 반도체주 '폭락'…사실은 구글 터보퀀트발 시장의 착각?

엔비디아 주가가 또 흔들렸다. 삼성전자, SK하이닉스도 마찬가지다. 이번엔 구글이 3월 24일 리서치 블로그에 올린 글 한 편이 발단이었다. 터보퀀트(TurboQuant)라는 기술인데, AI가 대화 중 이전 내용을 기억해두는 임시 저장공간, 즉 KV 캐시(Key-Value Cache)를 훨씬 적은 메모리로 운용할 수 있다는 내용이다. 시장의 해석은 단순했다. 메모리를 덜 쓰면 반도체를 덜 산다. 주가는 즉각 반응했다.
이 논리, 어디서 본 적 있지 않나. 1년 전 딥시크 사태 때도 판박이였다. 중국 스타트업이 기존보다 훨씬 낮은 비용으로 고성능 AI를 구현했다는 소식이 전해지자 엔비디아는 하루 만에 17% 넘게 빠졌다. 비싼 반도체를 대규모로 살 이유가 없어졌다는 공포가 시장을 덮쳤다. 그 뒤 어떻게 됐나. 빅테크들의 AI 인프라 투자는 멈추지 않았고, AI를 도입하는 기업이 오히려 급격히 늘면서 반도체 수요는 더 가파르게 올라갔다. 주가는 제자리를 찾았다.
터보퀀트도 본질은 다르지 않다. KV 캐시 효율화 기술은 사실 AI 업계에서 수년째 진행돼온 연구 흐름이다. KV 캐시는 AI가 긴 문서나 대화를 처리할 때 앞서 분석한 정보를 메모리에 쌓아두는 구조인데, 대화가 길어질수록 필요한 메모리 용량이 기하급수적으로 커진다는 문제가 있다. 이를 압축·효율화하는 연구는 구글만 하는 게 아니다. 엔비디아도 2025년에 이미 NVFP4 KV 캐시, KTVC 같은 자체 기술로 메모리 사용량을 최대 20배까지 줄일 수 있다고 발표했다.
그 발표 때 반도체주가 폭락했나. 아무 일도 없었다. 같은 방향의 기술이 나올 때마다 시장이 지금처럼 반응했다면, 반도체주는 진작 바닥을 쳤어야 한다. 이번 반응이 기술의 내용을 정확히 읽은 결과가 아니라는 방증이다.
수요 감소 논리도 숫자 앞에서 버티질 못한다. 효율이 20배 좋아지면 이론상 같은 메모리로 20배 많은 일을 할 수 있다. 그런데 AI가 실제로 소비하는 연산량은 그보다 훨씬 빠른 속도로 불어나고 있다. AI 모델이 텍스트를 처리하는 최소 단위인 토큰을 기준으로 보면, 스스로 코드를 짜고 복잡한 업무를 처리하는 AI 에이전트는 단순 챗봇보다 약 만 배 많은 토큰을 소비하는 것으로 알려졌다. 여러 AI 서비스의 API 트래픽을 중계하는 플랫폼 오픈라우터(OpenRouter)의 주간 토큰 처리량은 이미 그 흐름을 수치로 보여주고 있다. 효율이 좋아지는 속도와 수요가 늘어나는 속도가 게임이 안 되는 상황이다.
빅테크들의 움직임도 같은 방향을 가리킨다. 아마존, 구글, 마이크로소프트, 메타 등 4개사가 올해 AI 인프라에 쏟아붓겠다고 밝힌 설비투자 합계는 6000억달러를 훌쩍 넘는다. 아마존 단독으로 2000억달러, 구글은 최대 1850억달러, 메타도 최대 1350억달러를 예고했다. 터보퀀트 블로그를 올린 당사자가 구글이라는 점도 짚고 넘어갈 만하다. 자기 발표 하나 때문에 이 투자 계획을 바꿀 기업은 없다.
지금 시장을 짓누르는 건 터보퀀트가 아니다. 무역분쟁과 유가 충격이 만들어놓은 불안 심리 속에서 어떤 소식이든 악재로 읽히는 환경이 문제다. AI 에이전트 시대가 만들어낼 연산 수요의 규모는 시야 밖으로 밀려나고, 당장 눈앞의 공포만 크게 보이는 것이다.
기술이 발전할수록 AI를 쓸 수 있는 곳이 늘어나고, 수요는 결국 더 커진다. 이것이 AI 산업이 지금까지 반복해온 경로다. 터보퀀트발 착각도 예외가 되기 어렵다는 게 조심스러운 예측이다.







