本周观点
■ 1月我们发布行业点评报告《CPU涨价能持续多久?》,率先揭示Agent对CPU的刚性需求以及CPU供需失衡全面
爆发。过去4个月,CPU逻辑持续得到强化:1)AMD、Arm等头部厂商大幅上修服务器CPU TAM,Meta、AWS等大厂加码CPU部署,需求侧持续验证;2)Intel、AMD库存趋紧、交期拉长并持续涨价,景气度不断提升;3)同时,NVIDIA新一代Vera RuBin Al系统中CPU/GPU配比持续抬升,CPU正从辅助角色重新回到Al系统核心。
■ Agent对CPU刚性需求,CPU重回核心地位。随着大模型从Chatbot向Agent演进,计算负载重心正发生偏移。
Agent不仅需要GPU进行模型推理,更依赖高性能CPU处理复杂逻辑编排、工具调用与内存管理。我们认为,Agent对CPU的刚性需求主要来自三方面:1)Multi-Agent架构带来的OS调度压力,以及沙盒环境创建、调度与销毁对CPU算力的持续消耗;2)长上下文场景下KV Cache卸载对CPU内存与带宽提出更高要求;3)高并发工具调用带来的大量CPU算力消耗。Intel论文显示,多数Agent工作负载中,CPU耗时占端到端延迟比例可达40%-90%。伴随Agent数量、任务复杂度与Token消耗指数级增长,CPU产业已进入新一轮景气周期,Intel、AMD服务器CPU库存趋紧、交期延长,并于2026年以来持续推进涨价。
■ CPU TAM扩容,CPU/GPU部署比例抬升。1)TAM来看,AMD与Arm均大幅上修服务器CPU市场空间,预计2030年
全球服务器CPU TAM将超过1000亿美元。根据AMD,CPU需求可分为通用计算CPU、Al头节点CPU以及AgenticAI CPU三部分,其中智能体Al相关需求是最大的增量来源。2)配比来看,AI数据中心CPU/GPU部署比例正从传统HGX时代的1:4、1:8,逐步向1:2、1:1甚至更高演进。以NVIDIA为例,GB300 NVL72已实现72颗GPU搭配36颗Grace CPU的1:2配比,Vera Rubin进一步通过外挂独立Vera CPU机柜,使整体CPU配比继续抬升。
■ 所有CPU架构均受益,ARM中期变化更显著。1)ARM架构低功耗、高核心密度的特性更契合Agent工作负载。相
比x86,ARM在高并发、低功耗场景下具备更优能效比与扩展能力,尤其适合海量API调用、KV Cache调度等轻计算、高并发任务。2)ARM开放授权生态亦高度契合云厂商自主构建AI基础设施的需求,当前AWS Graviton、NVIDIA Grace、微软Cobalt等方案均已加速落地。ARM在FY26Q4业绩会上预计,到2030年按CPU类型划分的最大市场份额将属于Arm架构。
■ Agentic Al驱动CPU重构,全球厂商开启新一轮架构升级。1)海外方面,Intel、AMD、Arm、NVIDIA等均围绕
高核心密度、异构协同与能效优化展开新一轮产品迭代,CPU竞争正从单纯性能竞争迈向系统级算效竞争;2)国内方面,海光、飞腾、龙芯、华为海思、熠知电子等厂商在x86、ARM与自主指令集方向持续突破,核心数、线程数、内存带宽与生态能力快速提升。伴随Agentic Al带来的CPU需求爆发,以及自主可控趋势深化,国产CPU有望迎来规模化替代与产业地位重估。
相关标的
CPU:Intel、海光信息、禾盛新材、高通、AMD、澜起科技、中科曙光、中国长城、龙芯中科、广合科技、兴森科技、深南电路、宏和科技等。
海外算力:中际旭创、东山精密、胜宏科技、欧科亿、天孚通信、天岳先进、新易盛、工业富联、兆易创新、大普微、源杰科技、景旺电子、英维克、唯科科技、领益智造等;Lumentum、闪迪、铠侠、美光、SK海力士、中微公司、北方华创、拓荆科技、长川科技。
风险提示
■ 行业竞争加剧的风险;技术研发进度不及预期的风险;特定行业下游资本开支周期性波动的风险。
一、CPU何以重回核心地位?
1月我们发布行业点评报告《CPU涨价能持续多久?》,率先揭示Agent对CPU的刚性需求以及CPU供需失衡全面爆发。过去4个月,CPU逻辑持续得到强化:1)AMD、Arm等头部厂商大幅上修服务器CPU TAM,Meta、AWS等大厂加码CPU部署,需求侧持续验证;2)Intel、AMD库存趋紧、交期拉长并持续涨价,景气度不断提升;3)同时,NVIDIA新一代Vera RuBin Al系统中CPU/GPU配比持续抬升,CPU正从辅助角色重新回到AI系统核心。
1.1三大逻辑揭示Agent对CPU的刚性需求
随着大模型的应用从简单的Chatbot向能完成复杂任务的Agent演进,计算负载的重心正在发生微妙的偏移。Agent不仅需要GPU进行模型推理,更依赖高性能CPU来处理复杂的逻辑编排、工具调用和内存管理。我们认为,Agent对CPU的刚性需求基于以下三大逻辑:
Chatbot向Agent演进,Multi-Agent架构引发OS调度压力,计算负载重心正从GPU侧向CPU侧偏移。Agent工作流的“推理-执行-评估-反思”循环机制,在生成Token之外持续进行逻辑判断与状态管理,“思考”和“行动”的频繁切换显著加剧操作系统的上下文切换与进程调度压力。与此同时,Agent执行代码等操作须在隔离沙盒中运行,沙盒环境的创建、调度与销毁全程依赖CPU算力,进一步推高CPU侧的工作负载。
长上下文场景下KV Cache卸载对CPU构成挑战。KV Cache在加速Transformer推理的同时,带来了显著的显存消耗问题,以8万Token的上下文为例,KV Cache本身即可消耗数十GB显存,叠加模型权重与中间激活值后,HBM资源极易触及上限。对此,业界提出将不活跃的KV Cache卸载至CPU内存或SSD,以解决HBM瓶颈。但CPU与GPU之间的通信带宽远低于GPU内部的HBM带宽,数据搬运本身存在明显瓶颈;同时,在进行KV Cache传输和管理时,也需要CPU进行任务的调度,进一步加剧CPU的负载。
高并发工具调用带来巨大的CPU算力消耗。Agent的能力不仅在于对话,更在于使用工具,例如检索、写代码、浏览网,这类非推理任务的计算负担主要由CPU承担。在高并发场景下大量Agent同时工作,多线程/多进程调度需求集中爆发,对CPU的性能提出更高要求。

本文来自知之小站
报告已上传百度网盘群,限时15元即可入群及获得1年期更新
(如无法加入或其他事宜可联系zzxz_88@163.com)