大模型后训练:中美路径与商业闭环

全球主流大模型集中于中美。据Artificial Analysis数据,美国头部模型厂商包括OpenAl、xAI、Anthropic与Google;国内DeepSeek、阿里、智谱、Kimi与MiniMax较为领先。由于国内高性能算力受限,在同样强化学习+后训练范式下,海外模型偏向规模扩展,而国内擅长架构优化。投资建议上,把握算力、存储、电力、应用四个方向,我们认为:1)大模型产业的基座是算力。2)随着多模态模型的普及,存储需求同步提升。3)电力是算力的配套,是大规模集群上线的前提之一。4)Al应用是商业化落地的关键。
与市场不同的观点
1)中美大模型差异并非技术强弱,而是算力结构决定路线:海外依托高密度集群深化后训练与推理扩展,国内在算力约束下以Attention优化、MoE稀疏化和长上下文重构追求单位算力效率,因此跑分不构成统一比较锚。2)Al 应用落地并非遥远,OpenAI提出统一模型、Pulse 主动Agent与ACP对话内结账已使应用从“能用”进入“可经营”,电商等高频闭环场景率先具备规模化条件。3)市场普遍低估数据标注的价值,ScaleAl、SurgeAl等高收入与高客单价显示标注是模型能力上限的关键投入;需求扩张叠加客户对独立供应链偏好提升,行业定价权仍在抬升。
强化学习+后训练范式下,中美模型迭代路径分化明显
大模型能力演进呈预训练、后训练与推理全链路扩展范式。早期 Scaling Law聚焦预训练(参数/数据/算力同步放大);2024年9月OpenAI发布0系列后,强化学习系统性并入后训练,推理端以思维链延长思考时间、生成更多token 释放能力。海外以xAl为代表,依托约20万卡级集群,持续在推理端扩算力;国内在算力受限下更侧重架构与算法精修,Qwen、DeepSeek、Kimi等以注意力优化、稀疏化与MoE等提升训练推理效率与性价比。我们认为,两条路径将沿各自要素禀赋持续演进。
商业化已成头部厂商当前重心,应用与生态建设优先推进
OpenAI提出GPT-5统一模型后,后续的模型迭代更多属工程整合、价值再提效,研发重心上移至应用与变现。OpenAl以ACP(与Stripe)实现对话内购买,首批接入 Shopify、Etsy,并与Salesforce、Walmart 协作,打通“发现-支付”闭环。国内侧阿里Qwen 以多模态与场景推动 token上量;据云栖大会2025主题演讲,近2-3个月Token消耗倍增、百炼平台过去一年日均调用量增约15倍、FY26Q1云业务收入同比增速25.8%。我们认为,支付闭环叠加生态扩展将主导下一阶段商业化。
投资建议
1)算力:预/后训练迭代推高算力需求,OpenAI规划算力中心合计超36GW;据SCMP,出口限制后NVIDIA在华先进芯片份额95%→0,国产供给接棒。利好海外/国产算力链,如翱捷科技、沪电股份、芯原股份。2)存储:多模态/长视频抬升容量与带宽(图片1MB、音频5MB、视频≈50MB/分)。3)电力:美国新建大型数据中心并网申请到商运的中位时长继续增加,而矿场改造成本约500-800万美元/兆瓦、落地更快。4)应用:OpenAI ACP实现对话内结账贯通“触达-体验-支付”;国内入口卡位者更易受益:2C领域,福昕软件、金山办公、奥多比有丰富的C端用户积累;2B领域,用友网络、泛微网络、鼎捷数智、虹软科技、微软有多样化的企业客户。
风险提示:宏观经济波动,技术进步不及预期,中美竞争加剧。研报中涉及到未上市公司或未覆盖个股内容,均系对其客观公开信息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖。

与市场不同的观点
#1:中美大模型走出了差异化的发展路线
我们认为,市场以模型跑分来衡量国内外大模型技术孰优孰劣,是对国内算力供给约束的误读。海外依托高密度算力把后训练与强化学习做大做深,更易拔高长尾任务基准分;国内面临算力供给不足,并非技术不行,而是主动转向差异化路线:以Attention本质优化、MoE稀疏化、长上下文工程重构,追求单位算力的有效产出。因此,跑分并不构成统一锚;决定路径的变量是算力结构而非研究能力,分化由此形成并将延续。
海外路径正将算力重心移向后训练与推理,国内路径在算力约束下押注架构与算法精修。XAI以Scaling Law 2.0为纲,围绕后训练+强化学习+算力扩张迭代Grok。而在算力供给差距下,国内头部厂商聚焦Attention本质优化与MoE稀疏化以换取训练推理效率:Qwen3-Next在Transformer+MoE框架内引入“75%线性注意力+25%传统注意力”的混合注意力机制,显著提高长上下文与大参数场景的效率。DeepSeek V3.2以DSA(动态稀疏注意力)重构算子与内核,API输入/输出成本相比上一代模型约-50%/-75%。
#2:Al应用的转折点或将到来
市场多认为Al应用大规模落地仍远;我们认为时间点正在接近,电商等高频垂类具备先行条件。OpenAl为代表的头部厂商研发重心由底层能力转向应用与商业化:统一模型提供一致能力底座,Pulse把模型从被动问答推进为主动智能体,ACP对话内结账打通“推荐-下单-履约”,叠加Apps SDK与MCP的标准化接入与分发,以及与Shopify、Etsy等合作扩展生态,“对话即入口、即时结账”的工程与流量前提已具备。
商业化抓手成形、需求侧启动。OpenAI Pulse引入异步推理,使Agent在用户离线时持续分析与生成,算力需求由“交互次数”转向“在线Agent数量”。在2025年10月OpenAl开发者大会上,官方把ACP对话内即时结账确认为生态核心,Apps SDK与MCP提供接入、控制与富交互能力;其后宣布与Salesforce、Walmart合作扩展生态。据The Information数据,OpenAl 2030年营收预期上调至约2,000亿美元,结构从订阅IAPI拓展至Agent与新产品。国内侧,阿里Qwen推进多模态与2B落地;据云栖大会2025主题演讲,百炼平台模型日均调用量一年增约15倍,阿里云FY26Q1云业务收入增速25.8%。我们认为,“统一模型+Pulse+ACP”已将应用从“能用”推进到“可经营”,电商垂类具备流量、闭环与支付三要素,转折点正在逼近。
#3:数据标注的重要性被低估
市场低估标注价值,海外龙头营收与客单价已给出明确反证与强力证据。市场认为“数据标注技术含量低、价值量不高”,我们认为,高质量标注是模型训练的关键投入。据TapTwiceDigital数据,ScaleAl收入由2022年2.5亿美元升至2023年7.6亿美元、2024年8.7亿美元;据路透社信息,SurgeAl在2024年营收超过10亿美元并实现盈利,单笔合同与客单价多在八位数至九位数美元区间;据TechCrunch信息与Forbes数据、Sacra数据,2025年9月,Mercor年化收入快速逼近4.5亿美元,2025年上半年录得净利润约600万美元。高收入与高客单价共同说明标注价值被系统性低估。
需求扩张叠加供给演变,行业空间与议价能力同步抬升。据Mordor Intelligence数据,全球Al数据标注市场规模预计自2025年约19亿美元增至2030年近55亿美元,年复合增长率超过20%。驱动来自更高LLM性能需求、基于LLM的Agent数据、机器人与自动驾驶感知数据、以及医疗保健与金融科技等垂直场景。供给侧出现结构变化:客户对数据隔离与供应链独立性的偏好增强。2025年6月,Meta以战略入股方式取得Scale A 49%股权后,部分大型实验室为降低信息外泄风险倾向选择与大型互联网公司股权关系更疏的独立标注方,Surge Al承接相关迁移并实现业务跃升。我们认为,高质量标注决定模型能力上限与商业化效率,在需求与结构性变化共同作用下,行业渗透率与定价权仍有提升空间。

投资建议
1)算力
算力投资主线延续,训练与推理共振抬升需求。据OpenAl现在的算力规划,截至25年10月,成体系大型算力中心已超30GW,奠定大模型容量基础;头部厂商在预训练与后训练持续迭代,训练端扩容保持韧性,硬件投入与软件优化围绕版本与架构升级推进。Google在多国扩展AI Overview、AIMode,25年10月AI Mode引入36种新语言/40多个新国家和地区,覆盖逾200个国家和地区;OpenAl在2025年开发者大会宣布打造应用生态,周活用户达8亿(图表29)。随用户与场景扩大,推理端对吞吐与响应要求提升,算力需求走强。我们认为,推理侧边际增量更为突出,对上游提出更高并发与更低时延的配置要求。
国产算力接棒推进,供给体系趋于多元稳健。据South China Morning Post于2025年10月信息,黄仁勋指出受美国出口限制影响,NVIDIA不被允许向中国大陆公司出售先进产品,其在中国先进芯片市场份额由95%降至0。叠加国内互联网厂商采购国产化趋势增强,外采第三方与自研并行,有助缩短迭代、优化成本并强化自主可控,带动本土生态协同升级。我们认为,并行策略将提升国产芯片规模化落地效率与韧性。
2)存储
Al存储需兼顾容量、吞吐与可靠性。训练侧重稳定写入与快速恢复检查点,推理侧重高效查询与即时响应,对系统扩展性与可用性提出更高门槛。硬盘用于保留模型产出、检查点与查询数据;SSD与内存承担高并发低时延通路。随模型参数与能力扩张,训练对数据规模、丰富度与标注质量要求提升,多模态样本需持续汇聚与留存,催生原始与清洗多副本管理与分层留存。我们认为,大容量HDD与高性能SSD协同、以容量扩充与分层优化为主,将与算力投入并行成为中长期建设重点。
视频多模态推理驱动容量与带宽上行。多模态成熟后,线上推理对素材、缓存与生成成品留存扩大,并发访问与调用频率提升。据希捷科技数据:单图约1MB、音频约5MB、视频按分钟计约50MB;随生成视频分辨率与时长上行,单体内容容量继续抬升。Sora App等应用病毒式传播提升创作者渗透率与产量,视频生成分发依托边缘低时延内存与SSD快速检索与回源,推动本地缓存与中心存储协同调度与分层管理细化。我们认为,推理端需前瞻规划容量与带宽冗余,边缘存储与SSD加速将获增量。
3)电力
电力约束抬升算力门槛,能源成为Al时代稀缺要素。Al训练与推理持续推高用电负荷,据彭博新能源财经(BNEF)预测,至2035年美国数据中心电力需求将由2024年的近35吉瓦增至78吉瓦,平均每小时用电由16吉瓦时升至49吉瓦时。AI与能源已“合二为一”,有效算力的度量正转向以吉瓦为单位的供电能力。我们认为,能获得稳定低价电力者,将在算力竞争中占据结构性优势。
核能被视为稳定低碳的中长期解法,海外头部云厂商等已签订多个电力购买协议(PPA)。美国电网当前面临需求激增与多年投资滞后叠加,SMR(小型模块化反应堆)有望成为新增负荷的重要抓手。海外头部厂商,包括微软、Gogole、亚马逊、Meta均与SMR厂商签订了相关协议或PPA。
4)应用
Al应用是后续AI商业化落地的核心战场与抓手。在OpenAI加速扩展数据中心的同时,2025年9月OpenAl与Stripe合作推出ACP支付协议,打通ChatGPT内的即时支付功能,形成商业化变现闭环。首批接入ChatGPT应用生态的厂商包括Etsy、Shopify两家电商,以及Figma、Zillow、Expedia、Instacart、Salesforce、Spotify、Duolingo等各垂类应用。国内入口卡位稀缺、覆盖较多2B/2C客户的标的更易受益于Al应用商业化浪潮。面向国内Al应用标的,我们延续“生态优先”的判断框架:以平台级入口为抓手、具备服务企业(2B)或消费者(2C)的用户结构,并能与模型、支付与分发渠道形成闭环者,更有望在应用商业化范式变化中率先兑现。此类公司通常兼具稳定的终端触达与企业服务能力,能通过API、插件或原生场景快速嵌入,放大用户黏性与付费转化。我们认为,入口卡位、用户结构齐备与生态协同将构成筛选受益标的的关键标准。

本文来自知之小站

 

报告已上传百度网盘群,仅需25R即可获得本站精选报告合集(4.5万份)及1年以上更新

(如无法加入或其他事宜可联系zzxz_88@163.com)