中国联通新一代AI计算基础设施白皮书.pdf

本报告版权属于中国联合网络通信有限公司研究院,并受法律保护。转载、摘编或利用其他方式使用本报告文字或者观点的,应注明“来源:中国联通研究院”。违反上述声明者,本院将追究其相关法律责任。

人工智能是当今世界发展的重要领域之一,对推动人类科技

经济发展起着加速作用。人工智能产业化落地也是推动我国战略新兴产业实现融合集成、促进我国科技高水平自立自强、提振数字经济高质量发展的重要推动力。随着新技术的不断演进,人工智能发展呈现出应用场景多元化拓展、数据体量爆发式增长、算法模型参数量指数级增加的发展态势,这对支持大规模Al计算的基础设施提出更高的性能要求。高性能的Al计算基础设施应支持大规模、多任务的算法模型训练与推理部署,满足高并发、高弹性、高精度的计算需求;具备兼容异构底层硬件的生态对接能力以实现上层应用和底层硬件的解耦;还需提供安全可信的计算环境以保障数据隐私;并且能够合理地分配计算资源以实现绿

色低碳目标。

中国联通作为数字信息基础设施运营服务国家队,携手产业链凝聚共识,突破Al计算基础设施的发展瓶颈,为Al服务于千行百业提供灵活高效的计算基座发布此《中国联通新一代Al计算基础设施白皮书》。白皮书分析了当前Al计算基础设施的发展趋势以及规模化部署面临的挑战,系统性地介绍了Al计算基础设施的发展背景、总体架构、关键技术、商业模式和未来展望,呼吁产业链携手共建标准化的、开放的Al算力生态,加快输出

具有中国经验的标准化体系。

人工智能(Artificial Intelligence)起源于20世纪五六十年代,历经符号主义、连接主义和行为主义三次浪潮的相互交织发展,到如今作为一项新兴的通用技术,正推动着社会生活与各行各业的巨变。数据、算力、算法是人工智能发展的三要素,也被誉为数字经济时代发展的三驾马车。其中,数据是生产资料,海量优质数据是驱动算法持续演进的基础养料;算法是生产关系,是处理数据信息的规则与方式;算力是生产力,体现为数据处理与算法训练的速度与规模。

作为人工智能三大基础要素之一,算力是决定Al产业变革的关键承载基础。回顾人工智能的演进历程,就曾多次遇到因基础设施运算能力不足而无法突破技术瓶颈的案例,例如深度学习早在上世纪80年代就已被人工智能专家提出,由于训练深度学习模型需要循环迭代上千次,当时的计算机的运算性能不足以支撑上千次的迭代,导致深度学习模型的发展经历数年寒冬。直到21世纪高性能计算硬件的出现,加速了人工智能的训练迭代速度,使得大规模的数据训练效率大大提升,才极大地促进了人工智能的快速发展。

现阶段Al基础设施的概念已不仅仅是承载计算的硬件设备,其范围已经扩展到高速互联网络、资源管理与调度、分布式策略、计算框架、训练/推理相关应用等一套完整的Al基础服务体系。大力发展

新型的Al计算基础设施可以有效推动技术资源向创新领域集聚,助力实现智能产业化与产业智能化协同并进。中国联通作为数字信息基础设施运营服务的国家队,需要在构建新一代AI计算基础设施方面找到着力点,联合产业链各方一同推动Al计算基础设施的自主创新。

(二)人工智能产业对AI计算基础设施的算力需求激增

近年来,人工智能产业对AI基础设施运算能力的需求更是显性化激增,具体表现在以下三个方面:一是Al场景的复杂多样化提升了对AI计算基础设施算力通用性的需求。人工智能技术正在加速与千行百业的融合并因此创造出了丰富的行业应用场景,据国际数据公司(IDC)测算,我国人工智能行业应用不断深入,已有58%的企业在使用人工智能,远远高于全球平均水平网,领跑全球。而复杂多样的Al场景落地必将依托Al基础设施提供的通用性运算能力;二是

5G、Al、大数据、云计算、物联网等技术的加速发展将会带来大量的数据。预计到2025年,中国的数据量将达到486万亿亿字节网,海量数据的计算分析必然离不开高性能的Al计算基础设施;三是Al模型越来越庞大,模型的参数规模也在快速增长,随着量级从千亿级到万亿级的发展,模型的结构也将越来越复杂。OpenAI发布的一份关于Al算力增长趋势的分析报告显示自2012年以来,Al训练所需

算力每3.5个月增长一倍(对比摩尔定律翻倍需要18个月),自2012年以来,该指标已增长30万倍以上网。由此可见,在复杂场景、海

量数据、超大模型的需求背景下,各个行业对于Al计算基础设施算力的需求迫切增长。

(三)国家产业政策积极鼓励发展新型AI计算基础设施

在2021年底,中央网络安全和信息化委员会印发《“十四五”国家信息化规划》,着重提出要着力夯实数字基础设施建设水平,部署了建设泛在智联的数字基础设施体系任务,适度超前部署下一代智能设施体系,深化公共设施数字化、智能化转型升级。2022年底,中共中央、国务院印发了《扩大内需战略规划纲要(2022-2035年)》,也再次明确前瞻布局创新基础设施。支持有条件的地方建设区域性创新高地,适度超前布局建设重大科技基础设施,强化共性基础技术供给。由此可见,数字经济时代,作为产业智能化底座的Al计算基础设施方面的竞争力予国家和产业的战略价值。截至2022年我国算力总规模达到180EFlops[5],全球占比约33%,保持50%以上的高速增长,远超全球平均水平。面向Al计算基础设施的智能算力占比由2016年的3%提升至2020年的45%,预计未来新增算力中Al算力规模增速将进一步扩大。

二、运营商应积极布局新一代Al计算基础设施(一)运营商建设新型AI计算基础设施的需求

2022年11月,OpenAI基于大规模预训练模型GPT-3.5和自然语言生成技术发布了大模型ChatGPT,实现多轮对话问答。据估

电信运营商作为ICT基础设施算力的建设者和运营者,拥有全国

跨域网络互通、云网融合统一纳管的资源优势,也担当着使能全社会数智转型主力军的重任,因此在人工智能产业飞速发展的过程中,也应抓住新机遇加快构建新一代Al计算基础设施,为千行百业提供高性能的智能算力。运营商未来在构建新一代Al计算基础设施时,将通过引入异构计算的方式,打造高性能并行、异构兼容、安全可信、绿色低碳能力的新架构,满足用户高并发、高算力的需求。重点考虑:对大规模算力集群的组网,需满足超高带宽、超低时延、超高稳定性的网络质量要求;对硬件资源的整合,实现异构Al芯片的融合,并根据业务场景的需求灵活调度计算资源;针对对大规模模型的分布式训练,可根据任务选择所需资源类型和算力规模,创建集群组网并匹

配相应的并行计算模式。

本文来自知之小站

 

PDF报告已分享至知识星球,微信扫码加入立享3万+精选资料,年更新1万+精选报告

(星球内含更多专属精选报告.其它事宜可联系zzxz_88@163.com)