计算机行业研究：再谈CPU涨价能持续多久？.pdf

本周观点
■ 1月我们发布行业点评报告《CPU涨价能持续多久?》,率先揭示Agent对CPU的刚性需求以及CPU供需失衡全面
爆发。过去4个月，CPU逻辑持续得到强化：1)AMD、Arm等头部厂商大幅上修服务器CPU TAM,Meta、AWS等大厂加码CPU部署，需求侧持续验证；2)Intel、AMD库存趋紧、交期拉长并持续涨价，景气度不断提升；3)同时，NVIDIA新一代Vera RuBin Al系统中CPU/GPU配比持续抬升，CPU正从辅助角色重新回到Al系统核心。
■ Agent对CPU刚性需求，CPU重回核心地位。随着大模型从Chatbot向Agent演进，计算负载重心正发生偏移。
Agent不仅需要GPU进行模型推理，更依赖高性能CPU处理复杂逻辑编排、工具调用与内存管理。我们认为，Agent对CPU的刚性需求主要来自三方面：1)Multi-Agent架构带来的OS调度压力，以及沙盒环境创建、调度与销毁对CPU算力的持续消耗；2)长上下文场景下KV Cache卸载对CPU内存与带宽提出更高要求；3)高并发工具调用带来的大量CPU算力消耗。Intel论文显示，多数Agent工作负载中，CPU耗时占端到端延迟比例可达40%-90%。伴随Agent数量、任务复杂度与Token消耗指数级增长，CPU产业已进入新一轮景气周期，Intel、AMD服务器CPU库存趋紧、交期延长，并于2026年以来持续推进涨价。
■ CPU TAM扩容，CPU/GPU部署比例抬升。1)TAM来看，AMD与Arm均大幅上修服务器CPU市场空间，预计2030年
全球服务器CPU TAM将超过1000亿美元。根据AMD,CPU需求可分为通用计算CPU、Al头节点CPU以及AgenticAI CPU三部分，其中智能体Al相关需求是最大的增量来源。2)配比来看，AI数据中心CPU/GPU部署比例正从传统HGX时代的1:4、1:8,逐步向1:2、1:1甚至更高演进。以NVIDIA为例，GB300 NVL72已实现72颗GPU搭配36颗Grace CPU的1:2配比，Vera Rubin进一步通过外挂独立Vera CPU机柜，使整体CPU配比继续抬升。
■ 所有CPU架构均受益，ARM中期变化更显著。1)ARM架构低功耗、高核心密度的特性更契合Agent工作负载。相
比x86,ARM在高并发、低功耗场景下具备更优能效比与扩展能力，尤其适合海量API调用、KV Cache调度等轻计算、高并发任务。2)ARM开放授权生态亦高度契合云厂商自主构建AI基础设施的需求，当前AWS Graviton、NVIDIA Grace、微软Cobalt等方案均已加速落地。ARM在FY26Q4业绩会上预计，到2030年按CPU类型划分的最大市场份额将属于Arm架构。
■ Agentic Al驱动CPU重构，全球厂商开启新一轮架构升级。1)海外方面，Intel、AMD、Arm、NVIDIA等均围绕
高核心密度、异构协同与能效优化展开新一轮产品迭代，CPU竞争正从单纯性能竞争迈向系统级算效竞争；2)国内方面，海光、飞腾、龙芯、华为海思、熠知电子等厂商在x86、ARM与自主指令集方向持续突破，核心数、线程数、内存带宽与生态能力快速提升。伴随Agentic Al带来的CPU需求爆发，以及自主可控趋势深化，国产CPU有望迎来规模化替代与产业地位重估。
相关标的
CPU:Intel、海光信息、禾盛新材、高通、AMD、澜起科技、中科曙光、中国长城、龙芯中科、广合科技、兴森科技、深南电路、宏和科技等。
海外算力：中际旭创、东山精密、胜宏科技、欧科亿、天孚通信、天岳先进、新易盛、工业富联、兆易创新、大普微、源杰科技、景旺电子、英维克、唯科科技、领益智造等；Lumentum、闪迪、铠侠、美光、SK海力士、中微公司、北方华创、拓荆科技、长川科技。
风险提示
■ 行业竞争加剧的风险；技术研发进度不及预期的风险；特定行业下游资本开支周期性波动的风险。

一、CPU何以重回核心地位?
1月我们发布行业点评报告《CPU涨价能持续多久?》,率先揭示Agent对CPU的刚性需求以及CPU供需失衡全面爆发。过去4个月，CPU逻辑持续得到强化：1)AMD、Arm等头部厂商大幅上修服务器CPU TAM,Meta、AWS等大厂加码CPU部署，需求侧持续验证；2)Intel、AMD库存趋紧、交期拉长并持续涨价，景气度不断提升；3)同时，NVIDIA新一代Vera RuBin Al系统中CPU/GPU配比持续抬升，CPU正从辅助角色重新回到AI系统核心。
1.1三大逻辑揭示Agent对CPU的刚性需求
随着大模型的应用从简单的Chatbot向能完成复杂任务的Agent演进，计算负载的重心正在发生微妙的偏移。Agent不仅需要GPU进行模型推理，更依赖高性能CPU来处理复杂的逻辑编排、工具调用和内存管理。我们认为，Agent对CPU的刚性需求基于以下三大逻辑：
Chatbot向Agent演进，Multi-Agent架构引发OS调度压力，计算负载重心正从GPU侧向CPU侧偏移。Agent工作流的“推理-执行-评估-反思”循环机制，在生成Token之外持续进行逻辑判断与状态管理，“思考”和“行动”的频繁切换显著加剧操作系统的上下文切换与进程调度压力。与此同时，Agent执行代码等操作须在隔离沙盒中运行，沙盒环境的创建、调度与销毁全程依赖CPU算力，进一步推高CPU侧的工作负载。
长上下文场景下KV Cache卸载对CPU构成挑战。KV Cache在加速Transformer推理的同时，带来了显著的显存消耗问题，以8万Token的上下文为例，KV Cache本身即可消耗数十GB显存，叠加模型权重与中间激活值后，HBM资源极易触及上限。对此，业界提出将不活跃的KV Cache卸载至CPU内存或SSD,以解决HBM瓶颈。但CPU与GPU之间的通信带宽远低于GPU内部的HBM带宽，数据搬运本身存在明显瓶颈；同时，在进行KV Cache传输和管理时，也需要CPU进行任务的调度，进一步加剧CPU的负载。
高并发工具调用带来巨大的CPU算力消耗。Agent的能力不仅在于对话，更在于使用工具，例如检索、写代码、浏览网，这类非推理任务的计算负担主要由CPU承担。在高并发场景下大量Agent同时工作，多线程/多进程调度需求集中爆发，对CPU的性能提出更高要求。

本文来自知之小站

报告已上传百度网盘群，限时15元即可入群及获得1年期更新

（如无法加入或其他事宜可联系zzxz_88@163.com）

相关文章

计算机行业研究：超级电容：AI电源革命，下一个涨价品种.pdf

计算机行业深度报告：AI专题研究——阿里：从千问开源生态到超级AI云，或将重构商业基础设施.pdf

计算机行业深度报告：国产算力趋势不可逆，AI信创的战略拐点.pdf