为企业生产环境下的AI负载选择合适的架构6.0.pdf

人工智能(AI)和机器学习(ML)已经成为企业运营和进行数据相关决策的关键。目前,企业正在逐步将Al和ML任务从试点扩展到生产级部署,因此需要能够满足任务快速增长的可扩展架构。然而,许多企业在扩展AI基础设施时忽略了存储和计算之间的鸿沟,导致出现性能瓶颈、计算资源利用率低下以及企业内部无法充分利用数据的情况。
本白皮书重点介绍了企业要最大程度实现业务收益,在现有基础设施上扩展Al负载时应考虑的重要因素。同时还讨论了AI在数据访问方面的挑战,以及像NAS这样的常用解决方案存在的局限性,最后,介绍了Alluxio作为关键的数据访问层如何优化架构并加速工作流。

第一章:背景

1.1企业AI:从试点到生产
人工智能(Al)为各行各业带来了巨大的价值,但企业往往只能做小规模试点,很难将AI解决方案进行规模化应用。随着生成式AI和类似ChatGPT的机器学习模型引发越来越多的关注,企业对AI项目的投资和重视程度也在增加。
Gartner最新调查显示,企业对于采用生成式AI的热情日益高涨。45%的企业报告称自ChatGPT发布以来加大了对AI的投资。此外,68%的高管认为生成式模型的益处大于风险。尽管如此,目前仅有19%的企业正在试点或部署生成式AI。
由此可见,对于AI的热情与实际部署情况之间存在着一定的差距,这也凸显了当前将AI解决方案从试点推向生产环境面临的挑战。Gartner研究显示,数据可访问性以及数据量/复杂性是企业在采用AI方案时面临的普遍难题。要将AI应用从试点转向生产,企业需要优化架构,使其适用于机器学习任务,能解决数据访问方面的挑战。
1.2企业AI的早期架构
人工智能(AI)为各行各业带来了巨大的价值,但企业往往只能做小规模试点,很难将AI解决方案进行规模化应用。随着生成式Al和类似ChatGPT的机器学习模型引发越来越多的关注,企业对AI项目的投资和重视程度也在增加。随着数据和模型的增长,这类早期AI架构通常会变得效率低下。企业在云上训练模型,随着项目扩容,预计其数据和云使用量在12个月内也会大幅增加。许多企业最初的数据量都能匹配当前内存大小,但他们也清楚地知道要为处理更大的负载做好准备。

本文来自知之小站

 

PDF完整报告已分享至知识星球,微信扫码加入立享4万+最新精选报告

(星球内含更多专属精选报告.其它事宜可联系zzxz_88@163.com)