人工智能研究框架:大模型白热化,应用加速分化.pdf_下载

大模型:加速多模态研发,阳源模型逐步逆袭开源。
■多模态技术路蝴尚未收效,国内外大模型厂商持绩刚新SOAT,图片领域,GPT-40图像生成功能妇1发热潮后,爷歌Gemini 25Fash Iruage登顶多主流图缴榜,
Meta也从Midjoumey授权A图像模型;视频领域,阿里字节等刷新能力高度,谷歌视频模型推进至实时校互通用世界模型阶段,
■Deepseek开源浪蒸推动模型平权与应用加速,浪潮后闭源模型逐渐维持性能领先,目借开源策略打造生态入口一方面,预川练校型Saling Law造速放缓使
闭源与开源顿型性能差距收窄,但OpenA,谷歌等闭源厂商凭资源、人才与技术积累仍领先;另一方面,闭源厂商推行“开源+闭源”协同,保留主模型闭源忧势的同时,开源上一代成轻量模型,激活开发者井反哺自身闭原模型以维持领先。
算力:海内外资本开支提振,芯片厂加速推出新版本芯片。
■海外抛软、谷歌。Meta.亚马逊四者合计资本开支在2023Q3后连绩多个季度环比上升,同时上两资本开支指引;国内CSP厂商在大模型取得重要突跛、比肩海
外之时,也需通过大量资本开资缩小与海外差距
■为了满足海内外CSP资本开支放量需求,GPU、ASC克相角逐新品研发。1)传流芯片大厂:英伟达芯片架构正在由ackwel响Rubin过渡;AMDM1350系列
对标GB200,M400系列计划为26年新壁服务器“Helios”的基础;华为云CoudMatrix 384通过多卡互联实现性能弯道超车。2)云端巨头自研ASKC:根据TrendForce集邦容询,AIServe嘴求带动北美四大CSP加速自研ASC芯片,平均1-2年就会推出升级版本;国内阿里、百度、腾讯等办推出自研ASIC方案
应用:海外应用加逵分化,聚焦与数据结合的复杂toB场景,复盘今年美恐A应用表现,行情有所分化,股价涨幅蛟好的公司体现在:具备显著的行业Know-how壁垒,同时A职能业务放量增长,例如,以PLTR为代表的toB企业,其股价走强的核心逻揖在于A产品菜度财能主业(如A提升服务效率,鼓拓展离价值客户场景》,直接推动营收规模快速墙长,这一特征在to频域因奇业场景更器落地而表现得尤为显著,to C企业中,创意类挤压具类、A替代性显现,多模态大校型推动其从“辅助工具”进化为懂需求、能创方案的“创意伙伴”,强化替代恍势,又以低学本、快产出吸吲|客户,逼近传统专业工具价值模心.
投资建议:建议关注:1)AIAgent:禁捷数智、视源投份、泛微网络、数远互联金蝴国际、用友网络、汉得信息、赛意信息、迈富时、光云科技,税友股份、润达医疗、同花顺恒生电子、金山助公、万兴平科技、擂晰软性、科大讯飞、金桥信息、卓昌信息、普元软件等;2)A缘烤:云天励飞红软科技、小米集团、联把集团、科大讯飞、乐直科技、中科蓝讯等;3)A算力:寒武纪、云天飞、亿都(国际控股》、工业富联、浪潮信息、曙光数创、超评通信、华丰科技。神州数码、软动力、烽火通信、广电运通、招维信息、四川长虹等;4)A多模态:万兴平科技、虹软科技,当虹科技、中科创达、大华股怡、海康威视、温步者、萤石网络、汉仪股份、美图公司,云从科技等,
风险提示:地缘政治冲与预易风险、技术选代不及预阻、国内A Agert商业化进展不及预期、算力供应不及预期、行业竞争加题风险等.
多模态大模型赔合了多种感知路径和表达形态,能够同时处理文本,图像。语音等多种数据,并进行深度的语义理解和交叉機态处理,具备深度人机交互和全面智能应用的潜力。当前,多模态大模型主要分为理解和生成两种类型,技术路线尚未收敛,成为国内外大模型厂商重点突破方向之一。
多模态理解模型:多横态理解横型对齐视觉特征与文本特征实规跨模态的统一理解,分为以下两类技术路线:1)一方面,基于语言大模型庄座,配合多类外部专家横型共同实现多模态处理;2)另一方面,通过跨模态特征对齐学习,实现多横态输入的统一和融合,例如OpenA的CLP横型通过对比学习,将图像与文本通过各自的与训练模型获得的端码向量在向量空间上对齐,从而理解和推理图像和文本之间的关系
多模态生成:多模态生成模型基于对不同模态信息的理解,具备文本、图像、视顿。语音信息的生成绝力,分为两类技术路方面,DT结合扩散模型与Transformer优势,成为视频生成横型主流架构;2)另一方面,端到端统一多横态架构,实规跨模态生成与实时交互响应,例如GPT-40与Gemin均采用端到端原生多模态单体模型的方式学习文本、视觉、语音等不同模态的统一表征,实现跨模态实时交互响应。
3

本文来自知之小站

 

完整报告已上传至知识星球,微信扫码加入立享4万+深度报告及1年期精选报告更新

(星球内含更多专属精选报告.其它事宜可联系zzxz_88@163.com)