冷板液冷标准化及技术优化白皮书.pdf

ODCC(开放数据中心委员会)发布的各项成果,受《著作权法》保护,编制單位共同享有著作权。
转载、摘编或利用其它方式使用ODCC成果中的文字或者观点的,应注明来源:“开放数据中心委员会ODCC”。
对于未经著作权人书面同意而实施的剽窃、复制、修改、销售、改编、汇编和翻译出版等侵权行为,ODCC及有关單位将追究其法律责任,感谢各单位的配合与支持。本规范由开放数据中心标准推进委员会发布。
2015年,OpenAI成立,通过GPT(Generative Pre-trainedTransformer)算法,在2018年6月推出了GPT-1(1.2亿参数),在2019年11月增加了训练的数据量后推出了GPT-2(15亿参数),在2020年6月推出了GPT-3(1750亿参数)。随着数据参数的加大发现差异很小,后加入人工反馈强化学习来提升对话质量,在2022年3月推出了GPT-3.5;对话优化后,在2022年11月就推出了ChatGPT。月活人数突破1亿仅用时两个月。2023年2月7日微软将ChatGPT引入到搜索引擎Bing正式发布。除了微软,谷歌、Meta、百度、腾讯、阿里巴巴纷纷入局进军生成式AI。生成式AI模型需求的暴涨,使得对芯片的需求从CPU+加速器转变为以GPU主导的大规模并行计算。未来,在单芯片性能之上,智算中心能够通过算力的生产-调度-聚合-释放,支持AI产业化发展。现阶段,单CPU热设计功耗为150~200W,最高可达350W;单GPU热设计功耗为300~400W,最高可达700W。与此同时,服务器功耗从传统服务器的1kW增加到AI服务器的6.5~10kW。空气冷却解决成本和难度大幅上升,英伟达、英特尔等芯片公司已经开始将冷却的方式转向液冷。
液冷是指通过液体代替空气冷却芯片,根据液体与芯片是否接触可以分为直接液冷和间接液冷。直接液冷包括浸没液冷和喷淋液冷,浸没液冷又分为单相浸没和两相浸没。而间接液冷主要是冷板液冷。早在20世纪60年代,IBM就推出了用冷板液冷冷却的计算机产品。直到21世纪初,美国GRC(Green Revolution Cooling)公司推出了单相浸没冷却解决方案。2017年,广东合一推出了喷淋式液冷。2019年曙光完成全球首个大规模刀片式浸没两相液冷商业应用项目。2021年,微软发布了箱体式两相浸没液冷方案。而冷板液冷作为历史最悠久,技术最为成熟,生态系统最为丰富的液冷解决方案,它的爆发已经到来!
本白皮书倾注了作者大量的时间和精力,其成文也仰仗各参编老师撰写并参与讨论,其次,本文得到程军先生、王锋先生、何智强先生和袁达人先生提供的产品资料,在此对上人员做出的贡献表示由衷的感谢。此外,本文很多化工类专有名词的解释均得益于ChatGPT,令人充分感受到科技的便利和AI的潜力。最后,作者尽量用实物照片为读者生动呈现相关技术和产品,希望通过本白皮书促进冷板液冷技术快速迭代优化,为读者在冷板液冷的实践和决策提供有价值的信息和建议。
由于时间仓促,水平所限,错误和不足之处在所难免,欢迎各位读者批评指正。如有意见或建议请联系dceco@caict.ac.cn。

本文来自知之小站

 

PDF报告已分享至知识星球,微信扫码加入查阅下载3万+精选资料,年享1万+精选更新

(星球内含更多未发布精选报告.其它事宜可联系zzxz_88@163.com)