行业观点
■当前Al推理瓶颈迭代与架构演进,正推动PCB价值定位实现根本性跃升。Transformer架构下大模型推理存
在算力与带宽极端错配,英伟达解耦式推理架构对PCB提出高密度封装、高速互联、高功率供电散热等更高要求,PCB技术门槛与认证周期对标半导体封装。Rubin系列开启Al硬件密度时代,2026-2027年量产的VeraRubin、Rubin Ultra平台大幅提升算力,正交背板以78层PCB替代铜缆,拉动PCB价量齐升,单台服务器PCB价值提升超两倍,高端PCB供需失衡20法7至年。CoWoP方案打破PCB与封装基板边界,使PCB承担封装基板功能,单GPU配套PCB价值达600美元,M9级材料体系升级叠加上游供给紧张,推动PCB工艺精度逼近半导体级,行业完成从承载平台到核心互联介质的价值跃迁。
■ Rubin、ASIC、LPU等多元需求爆发,持续拓宽PCB行业成长空间。英伟达Rubin Ultra NVL576机柜2027
年量产,算力为GB300的14倍,配套超高带宽与高密度互联需求,催生高层数、高阶HDI及高频高速PCB刚需,单机柜PCB价值大幅提升。北美CSP自研ASIC加速放量,2026年ASIC AI服务器份额预计达27.8%,单机PCB价值倍数级提升,对PCB设计灵活性、定制化能力提出更高要求,形成GPU与ASIC双引擎驱动格局。LPU等推理专用芯片逐步商用,侧重时延与功耗优化,拓展PCB在云端、边缘、设备端推理场景的应用边界。多场景需求共振下,AI服务器出货量持续高增,为高端PCB提供长期成长支撑,头部厂商迎来增量红利。
■ AI需求爆发与工艺迭代,驱动PCB行业资本开支高增,头部厂商前瞻布局高端产能。2025-2026年一季度,
胜宏科技、沪电股份、鹏鼎控股等六家头部企业资本开支大幅增长,胜宏科技2025年同比增693.41%,2026年Q1增速389.59%,行业进入成长性扩张周期。头部企业密集落地大额扩产计划,胜宏科技2026年投资不超200亿元,鹏鼎控股累计扩产233亿元,沪电股份四项投资合计逾180亿元,聚焦mSAP、CoWoP、高阶HDI等高端工艺,同时推进海外产能布局。重资本投入、长扩产周期、高客户认证壁垒下,头部厂商通过提前卡位高端产能,构筑技术与规模护城河,锁定北美CSP等大客户供应链先发优势,行业集中度持续提升。
■ AIPCB扩产推高设备精度与投入强度,钻孔、压机、钻针、镭射电镀等关键环节壁垒加深。2026年中国PCB
设备市场规模预计达347.09亿元,钻孔、曝光、检测设备合计占比近半,高端AIPCB对设备精度、自动化水平要求升级,单台价值显著提升。钻孔设备领域,国产大族数控机械钻孔机市占率领先,高端激光钻孔机依赖海外厂商,国产加速追赶;压机设备由德国Bürkle主导,适配高多层板量产需求,是产能释放核心瓶颈。钻针市场量价齐升,全球CR4达70.5%,鼎泰高科、金洲精工合计市占近50%,高端加长径、涂层钻针需求旺盛。镭射与电镀工艺决定PCB良率,激光钻孔适配微盲孔加工,电镀均匀性影响信号完整性,国产设备加速国产替代,关键设备投入与技术升级成为厂商量产能力核心变量。
相关标的
■ 海外算力:胜宏科技、鹏鼎控股、沪电股份、广合科技、生益科技、景旺电子、东山精密、世运电路
■ 其他海外算力:东山精密、工业富联、中际旭创、天孚通信、中钨高新、天岳先进、新易盛、兆易创新、沪电股
份、大普微、源杰科技、欧科亿、英维克、唯科科技、领益智造等;Intel、SK海力士、Lumentum、闪迪、高通、博通、marvell、铠侠、美光、中微公司、北方华创、拓荆科技、长川科技。
风险提示
■ AI服务器出货及PCB升级不及预期的风险;CoWoP、正交背板等新工艺商业化进度不及预期的风险;原材料供
应紧张及价格波动的风险;行业扩产节奏过快导致竞争加剧与价格战的风险;大客户订单波动及客户集中度过高的风险
一、AI推理瓶颈迭代与架构演进,推动PCB价值定位跃升
1.1推理瓶颈从算力转向显存带宽,PCB成为AI系统性能关键承载者
从Al计算底层物理特性来看,Transformer架构下大模型推理严格分为Prefill与Decode两个阶段,二者硬件资源消耗特征存在显著不对称,Prefill阶段为计算密集型,以矩阵-矩阵乘法(GEMM)为主,算术强度高,GPU可逼近FP4/FP8理论峰值性能,而Decode阶段为显存带宽密集型,以向量-矩阵乘法(GEMV)为主,需反复从HBM显存读取历史Key、Value向量至SRAM,算术强度大幅下降,Tensor Core长期处于等待数据的闲置状态,系统瓶颈由算力转向显存带宽,这种不对称性彻底重塑Al硬件设计哲学,推动PCB向高频高速、高密度互连、高层数、高精度方向升级,使其在材料、制程、精度上全面趋近半导体级标准,进而实现PCB“半导体化”,以匹配AI算力硬件对信号完整性、传输效率与系统稳定性的极致要求。
这一阶段的资源消耗变化可以用一组数据直观呈现:在Prefill阶段,GPU算力利用率可达
90%-95%,但显存带宽占用通常低于30%;而在长上下文Decode阶段(KVCache满载),GPU算力利用率可能降至20%-40%,显存带宽占用率则会升至85%-95%。这种算力与带宽的极端错配,正是英伟达在Rubin系列中推出“解耦式推理”(Disaggregated Inference)的核心动因——将Prefill与Decode拆分到不同硬件上,对Decode硬件大幅增加显存容量与互联带宽,对Prefill硬件保留高算力配置,通过硬件异构化实现资源的最优配置。这一架构变革对PCB提出了前所未有的要求:Decode节点需要更高密度的HBM显存封装基板与更高速的片间互联(NVLink/C2C),Prefill节点则需要支持更高功率密度的供电与散热方案,二者共同推动PCB从传统的连接载体升级为决定系统性能瓶颈的关键半导体级组件,技术门槛与客户认证周期已逼近半导体封装环节,行业属性由此发生根本性跃迁。为缓解长上下文推理中KV Cache带来的显存压力,行业演化出三条差异化解决路径:算法层面,采用MLA(Multi-head Latent Attention)、MoBA(Mixture of BlockAttention)等混合注意力机制,通过低秩压缩与稀疏化技术,显著降低KV Cache容量占用,从算法根源上减轻显存负担;硬件层面,通过Tensor Parallel(张量并行)将KV Cache横向分布至多张GPU,依托NVLink等高速互联协议在卡间实时汇聚计算结果;系统层面,通过Pipeline Parallel(流水线并行)纵向跨节点拆分模型层,以节点间激活值传输替代全量KVCache搬运。三条路径在工程实现上各有侧重,但它们均将”卡间/节点间的高速互联”提升至与”单卡算力”同等重要的战略高度,直接驱动PCB向更高层数、更高阶HDI及更高信号完整性方向迭代,PCB由此向半导体化方向升级,以满足Al算力硬件对信号完整性与传输效率的极致要求。
换言之,过去十年Al硬件的核心竞争是”单卡算力”,而下一个十年的核心竞争已经悄然转向”全系统互联带宽”。这一转变在物理层面催生了三层新需求:芯片内部,HBM4代相比HBM3e带宽翻倍,需更宽内存接口与更高密度I/O;封装内部,Rubin Ultra采用16颗HBM4E×16层堆叠结构,硅中介层尺寸与布线密度呈指数级攀升;机柜内部,NVLink从早期8卡互联演进至576端口全池化架构,实现数百颗GPU的Scale-up网络。这三层需求的物理承载者,正是PCB——尤其是高速高频PCB与正交背板,其技术门槛已从传统的层间对位精度、阻抗控制,跃升至半导体级的信号完整性、电源完整性及热管理协同设计。PCB由此成为决定Al系统算力释放效率的关键瓶颈环节,行业价值中枢与竞争壁垒同步向半导体封装领域靠拢。

本文来自知之小站
报告已上传百度网盘群,限时15元即可入群及获得1年期更新
(如无法加入或其他事宜可联系zzxz_88@163.com)