摘要
尖端AI推理模型DeepSeekR1一经问世,便在整个科技行业引起波澜。因其性能能够媲美甚至超越先进的同类模型,颠覆了关于Al发展的传统认知。
这一关键时刻是更广泛趋势的一部分,凸显了行业在打造高质量小语言模型和多模态推理模型方面的创新,以及这些创新正在为Al的商用应用和终端侧推理落地做好准备。这些新模型能够在终端侧运行,将加速强大边缘侧芯片的规模化扩展,并创造对此类芯片的需求。
四大趋势正在显著提高目前可在终端侧运行的AI模型的质量、性能和效率,从而推动上述变革:
·当前先进的AI小模型已具有卓越性能。模型蒸馏和新颖的Al网络架构等新技
术能够在不影响质量的情况下简化开发流程,让新模型的表现超越一年前推出的仅能在云端运行的更大模型。
·模型参数规模正在快速缩小。先进的量化和剪枝技术使开发者能够在不对准
确性产生实质影响的情况下,缩小模型参数规模。
·开发者能够在边缘侧打造更丰富的应用。高质量AI模型快速激增,意味
着文本摘要、编程助手和实时翻译等特性在智能手机等终端上的普及,让AI能够支持跨边缘侧规模化部署的商用应用。
·AI正在成为新的UI。个性化多模态AI智能体将简化交互,高效地跨越各种应
用完成任务。
高通技术公司在引领并利用从Al训练向大规模推理转型,以及AI计算处理从云端向边缘侧扩展方面具有战略优势。公司在开发定制CPU、NPU、GPU和低功耗子系统领域取得了广泛的成就。通过与模型厂商展开合作,以及面向跨不同边缘终端领域的模型部署提供工具、框架和SDK,高通技术公司赋能开发者在边缘侧加速采用AI智能体和应用。
近期对AI模型训练方式的颠覆变革和重新评估验证了AI格局即将向大规模推理转变的趋势,这将形成全新边缘侧推理计算的创新和升级周期。尽管模型训练仍将在云端进行,但推理将受益于采用高通“技术的广泛终端规模,并催生更多边缘侧AI赋能处理器的需求。
高质量Al模型目前已变得丰富且经济实惠创新推动模型质量提升,减少开发时间和成本
AI模型训练成本的下降和开源合作相结合,让更多的开发者和组织能够进行高质量模型开发。
这种转变是由多种技术进步共同推动的。使用更长上下文文本和简化一些训练步骤,能够节省计算成本。从混合专家模型(MoE)到状态空间模型(SSM)等较新的网络架构,正在以更少的计算开销和功耗不断实现技术突破。
新一代AI模型还集成了诸如思维链推理(Chain-of-Thought Reasoning)和自我验证等先进方法,能够在数学、编码和科学推理等各种颇具挑战性的领域获得出色表现。
蒸馏(Distillation)是开发高效小模型的一项关键技术。它能够让大模型“教学”小模型,保持准确性的同时迁移知识。蒸馏技术的使用促使小型基础模型激增,包括众多面向特定任务调优的模型。
图1展示了蒸馏的强大能力。这里比较了Llama 3.3700亿参数模型和同类DeepSeekR1蒸馏模型的LiveBench平均测试结果,显示出在相同参数规模下,蒸馏能够在推理、编程和数学任务中显著提高性能。
本文来自知之小站
PDF完整报告已分享至知识星球,微信扫码加入立享4万+最新精选报告
(星球内含更多专属精选报告.其它事宜可联系zzxz_88@163.com)
