章AGI起于大语言模型,终于具身智能。AGI(Artificial General Intelligence),即通用人工智能,也称强人工智能,指的是具备与人类同等甚至超越人类的智能,能表现出正常人类所具有的所有智能行为。AGI技术实现突破,离不开LLM大模型和多模态能力,在两者结合下,AI具备了创造力。具身智能是迈向通用人工智能(AGI)的重要一步,国内外大厂及高等学府均开展了具身智能的相关研究,如微软、谷歌、斯坦福、达闼机器人、智元机器人等。
人形机器人是AGI最佳截体,业界研究进展加速。谷歌的RT-1是迈向视觉语言动作(VLA)模型的一个尝试,通过吸收大量的真实数据,提升机器性能和泛化能力;RT-2是全球首个控制机器人的VLA模型,将视觉语言模型(VLM)与机器人操作能力结合,在泛化能力和涌现能力上均有明显提升。GPT-4是OpenAI发布的最新GPT系列模型,是一个大规模的多模态模型,已应用在Ameca和Eureka等机器人上;GPT-4V(ision)新增语言、图像交互功能。Meta和CMU联合打造出RoboAgent,突破了缺乏足够庞大的数据集来训练通用智能体和缺乏能够生成此类数据的通用智能体的困境。特斯拉链接FSD和机器人的底层模块,使用端到端的神经网络,助力Optimus在任务操作方面展现出先进性。章“机器人+大模型”是迈向AGI时代的有效途径:人工智能大模型的语言处理能力可以被看作“大脑”,若想真正发挥通用人工智能的力量,未来的AGI需要有具身实体。LLM有助于实现任务级编程/交互,整个过程基本不需要或者仅需少量人类的介入和确认,降低了机器人的使用门槛。多模态大模型使得机器人开始理解如何合理使用多种输出能力来更好的完成任务。但我们离通用人工智能还很遥远,仍然存在许多尚未解决的重大问题,如多模态融合、安全性、高质量训练数据缺乏等。
投资建议:AGI是人工智能未来发展的方向,LLM和多模态推动AGI实现*
技术上的突破,“机器人+大模型”为AGI走进物理世界提供了更多的可能性。随着谷歌、OpenAI、Meta和特斯拉等科技大厂以及斯坦福等高等学府纷纷投入AGI的研究中,“机器人+大模型”将会进入发展的快车道,带动机器人软件和硬件系统的迭代升级,具有较好的发展前景。建议关注机器人整机领域的公司,如三花智控、拓普集团、埃斯顿、亿嘉和、博实股份、德昌股份等。心 风险提示:特斯拉人形机器人量产进展不及预期;国产化替代进展不及预期;制造业景气度恢复低于预期等。
1 AGI的关键拼图:起于大模型,终于具身智能
1.1大语言模型百家争鸣,推动弱人工智能向通用人工智能跃升
AGI(Artificial General Intelligence),即通用人工智能,也称强人工智能(Strong
AI),指的是具备与人类同等甚至超越人类的智能,能表现出正常人类所具有的所有智能行为。这种人工智能系统可以比人类更好更快地学习和执行任何任务,包括人类无法处理的任务。并且由于机器在速度、内存、通信和带宽方面的巨大优势,未来,通用人工智能在几乎所有领域都将远远超过人类的能力。
《Artificial Intelligence:AModernApproach》给出了人工智能的最新定义,即设计和构建智能体,这些智能体从环境中接收感知并采取影响环境的行动。如果以人类为中心来定义人工智能,即以人类的智能水平执行任务,那么人工智能需要感知、推理、推断、知识构建、决策和规划、学习、沟通以及高效改变和操纵环境的能力。人工智能大致分为三个主要层次——弱人工智能(ANI)、强人工智能(AGI)和超人工智能(ASI)。与AGI相比,传统的基于中小模型的弱人工智能聚焦某个相对具体的业务方面,采用相对中小参数规模的模型以及中小规模的数据集,然后实现相对确定、相对简单的人工智能场景应用。
本文来自知之小站
PDF报告已分享至知识星球,微信扫码加入立享3万+精选资料,年更新1万+精选报告
(星球内含更多专属精选报告.其它事宜可联系zzxz_88@163.com)
