本期投资提示:
● 国内AI算力行业正经历供给和需求的双重剧变。需求侧:Token消耗快速提升推动Al
Capex增长,深层次体现出国内AI大模型渗透率和用户粘性的提升。供给侧:国产Al芯片产品、技术、供给在2025均有较大进展;最先进产品在推理端的性能已接近英伟达H100水平,持续追赶。
● 摩尔线程:生态、架构、集群亮点纷呈。摩尔线程成立于2020年,专注自主研发全功
能GPU芯片及相关产品。创始人团队均来自英伟达,创始人张建中曾任英伟达全球副总裁、大中华区总经理,行业经验丰富。
● 定位全功能GPU,24年起智算产品开始商业化。摩尔线程单一GPU芯片中集成了Al
计算加速、图形渲染、物理仿真和科学计算、超高清视频编解码等多种能力,满足多样化需求。在工作效率、生态完整多样性以及兼容性等方面更具有优势,更好适应未来新兴及前沿计算加速应用场景的需求。产品线覆盖AI智算、图形加速及智能SoC,可应用于端侧设备、PC、服务器及数据中心等场景。24年后AI智算卡驱动收入高速增长。
● 智算领域,公司在芯片、集群层级均具备先进性:1)芯片级:公司自主研发软硬融合的
全功能GPU计算加速统一系统架构MUSA,硬件上采用Chiplet、高速I/O接口和优化通信协议等提升性能;软件上兼容CUDAC++核心语义和Triton语言,与国际主流GPU生态的兼容。2)集群级:打造软硬一体、系统级算力解决案KUAE,包含基础设施、集群管理、大模型三个层级,攻克千卡至万卡级GPU集群的高效互联难题,确保算力协同与通信性能契合大规模智算中心需求;千卡集群效率超过同等规模国外同代产品。
● 后续国产AI芯片生态如何演变?1)软件生态:从框架适配到开源生态社区的产业链协
同,算力与大模型深度融合;2)互联生态:国内华为、海光两大生态体系雏形初定。
● 软件生态:①华为昇腾:使能CANN全面开源开放,采用木兰宽松许可证v2,支持商
用和二次分发。新增200+深度优化算子,80+融合算子,100+通信、矩阵运算API,显著降低开发门槛。②寒武纪:拥有完整的软件堆栈,SDK中包含各类库,自有智能编程语言BANG底层算子处于国产算力第一梯队。③海光信息:兼容“类CUDA”环境,已与国内外主流大模型全面适配,兼顾推理与训练需求,全面支持300+Al应用场景。
● 模型生态:耦合已超越简单的硬件适配,进入算子与模型架构共同演进的阶段,深度耦
合在产业合作中已涌现出清晰的落地路径与生态雏形。国产大模型公司与国产AI芯片企业紧密合作。如DeepSeek模型更新,华为、寒武纪等实现Day0适配,通义千问同样在探索与国产算力的深度融合。
● 互联生态:①海光:开放CPU互联总线协议(HSL),合作伙伴可通过HSL实现更高
效系统互联。②华为:开放灵衢统一总线(Unified Bus),支持超节点内不同类型、不同距离的组件统一互联。
● 风险提示:技术路线不确定的风险;技术研发迭代进展不及预期;供应链稳定风险。
投资案件
结论和投资分析意见
国产Al芯片已经到达全面放量应用的临界点,第一梯队包括华为、寒武纪、海光信息,进展较快的包括沐曦股份、摩尔线程、阿里平头哥、百度昆仑芯、壁仞科技等。最先进产品在推理端性能已接近英伟达H100,持续追赶。
其中,摩尔线程在生态、架构、集群亮点纷呈,其产品定位全功能GPU,更适应未来新兴及前沿计算加速应用场景的需求,未来有望成为领先的国产AI芯片厂商。
原因与逻辑
需求端:国内Tokens消耗量快速增长,推动云、互联网等参与方大幅增加Al相关Capex投入,底层逻辑为国内AI大模型渗透率和用户粘性的提升。供给端:国产Al芯片产品、技术、供给在2025均有较大进展,最先进产品在推理端性能已接近英伟达H100,且性能持续追赶。
摩尔线程创始团队成员均具有英伟达背景,创始人张建中曾任英伟达全球副总裁、大中华区总经理,行业经验丰富。摩尔线程在芯片架构设计、软件生态兼容CUDA、集群通信互联能力等AI芯片应用的关键问题上均有布局,切实解决AI芯片在应用场景的瓶颈,实现产品力提升。随着IPO落地,预计产品将加速迭代,继续提升摩尔线程在国产AI芯片厂商中的地位。
国产Al芯片生态正在加速丰富和深化。从过去的适配PyTorch/TensorFlow等框架到现在的工具链全栈开源,国产AI芯片的开发者生态与工具链成熟度显著提升。此外,国产芯片与大模型的协同超越简单的硬件适配,进入算子与模型架构共同演进的阶段,未来将形成国产算力-国产大模型生态闭环。在互联生态领域,华为、海光开源自研的互联协议,打造标准化的互联范式。
有别于大众的认识
市场认为,国产AI芯片尚处于小批量、可用阶段。我们认为,随着越来越多头部互联网厂商大规模测试国产Al芯片并得到可靠的验证结果,叠加国产Al芯片出货量,印证国产AI芯片在推理端的性能已达到“好用”水平。
市场认为,国产AI芯片的软件生态仍为掣肘。我们认为,国产AI芯片软件生态主要为自研和类CUDA两条路线,经过近两年迭代与生态开发,下游用户易用性已有极大提升;此外,AI芯片厂商与大模型厂商、客户紧密合作,显著提升生态耦合度。
市场认为,国产算力在互联领域仍与NVLink有较大差距。我们认为,随着华为384超节点展现UB网络互联能力,以及随后华为、海光分别开放互联总线协议灵渠、HSL,通用的国产Al芯片互联生态正在逐步成熟,未来在互联规模和效率上都会有显著提升。

本文来自知之小站
报告已上传知识星球,微信扫码加入立享4万+深度报告下载及1年更新。3天内不满意退出星球款项原路退回,欢迎试用。到期续费仅需5折
(如无法加入或其他事宜可联系zzxz_88@163.com)