Molex莫仕 | 驱动 AI 的未来

2023年12月7日
人工智能(AI)性能的新突破,掀起了一场未来强大数据中心的竞赛。随着 AI 应用的复杂性不断提高,以及对计算的 […]
人工智能(AI)性能的新突破,掀起了一场未来强大数据中心的竞赛。随着 AI 应用的复杂性不断提高,以及对计算的需求呈指数级增长,电源可能决定着哪些数据中心可提升到更高一级的处理水平并保持领先地位。

近年来,AI 在各行各业带来了翻天覆地的变化——从医疗保健和金融到交通运输。机器学习算法和深度神经网络已成为数据分析、模式识别和决策方面的强大工具。然而,这些 AI 应用需要大量的计算能力和能源才能有效运作。

训练大的 AI 模型可能会消耗大量电力,图形处理器 (GPU) 或张量处理器 (TPU) 等专用硬件常常被用来执行深度学习算法所需的复杂矩阵计算,这样的计算速度比传统 CPU 快得多。这些专用硬件单元旨在处理大量数据以及优化机器学习所需的处理。

 

当大模型开始扩展

近期的例子表明,训练模型可能需要多达数百千瓦的电力。例如,OpenAI 的大语言模型 (LLM) GPT-3 的训练使用了 1,750 亿个参数和来自互联网的 570GB 数据,据称消耗了 355 兆瓦的电力。

OpenAI 的下一个版本 GPT-4 比 GPT-3 强大数百倍,其训练集包括 170 万亿个参数,使其成为有史以来最强大的 AI 引擎——至少在目前是这样。

OpenAI 使用了 Microsoft Azure 数据中心来开展 GPT 项目。公司将会继续在自己的场所内打造并维护数据中心,以帮助提升自身知名度或迅速扩大用户群。但公司可能还需要依赖基于云的服务,例如 Microsoft Azure、Amazon Web Services 和 Google Cloud Platform,以提供额外计算能力来满足突然激增的需求。

这些大规模云平台一直引领着超大规模数据中心最佳实践的发展,并推动数据中心在计算速度和带宽方面的性能不断进步。

 

在这个竞争激烈的环境中,前景广阔 AI 项目将会在最大计算处理负载的可靠数据中心方面展开争夺。展望 AI 发展和数据中心升级的下一阶段,可能没有足够的优质数据中心服务供每个人使用。

造成瓶颈的原因在很大程度上可能是电力限制。一项以 800 多名设计工程师及其经理为调查对象的 Molex莫仕调查显示,40% 的受访者将电源管理列为在数据中心实施电源系统时面临的最大挑战。有 20% 的受访者认为,配电问题是第二大挑战。

 

让数据能力翻倍

当今一流的数据中心可提供高达 112 Gbps 的数据传输率。许多数据中心正在升级硬件和连接器,以期达到这种速度和性能水平。

打造 224 Gbps-PAM4 数据中心趋势已初现端倪,以满足不断增长的 AI 处理需求。然而,适用于 224G 的基础设施组件还处于上市的早期阶段,这意味着完全采用 224G 技术的设施要在几年后才会普及。

让全世界数据中心的数据传输率总体上翻倍将是一项艰巨的任务,因为这需要大幅增加发电量。鉴于如今 AI 消耗的能源量占了能源消耗总量的 2%,未来的升级可能相当于在这个世界新增几个大城市,每个城市需要有自己的发电厂。

事实上,典型 GPU 模块的电力需求已从 2018 年的每个模块 450W 增加到 2022 年的 1000W,OCP OAM 的电力需求从每个机箱 3600W 增加到 8000W——推动这种增长的因素是对更强计算能力的需求。这种电力增长带来了前所未有的高发热量,并促使需要能够耐受更高温度的散热片和组件。Molex莫仕 Mirror Mezz 连接器可满足更高的电力需求并实现相关的热管理。这些连接器可用于 450W 和 1000W GPU 型号,且具有出色的气冷和液冷性能。

 

适应未来发展趋势

AI 数据中心的电力需求成倍增长,这与现有设施的局限性形成了矛盾,解决这种矛盾需要创造性的解决方案。目前,一些超大规模数据中心可能只是因为地理位置不佳而无法进行下一代升级。某些地区可能不会选择将本已有限的发电量分配给云服务提供商。而且,老旧的电网(即使已开始过渡到使用可再生资源)可能会出现间歇性停电,事实证明,这种情况会导致数据服务出现问题。

随着数据中心从一种技术过渡到另一种技术并充分利用内部配电架构,数据中心内部也可能会出现瓶颈。除了硬件投资外,行业打造 AI 驱动的数据中心的趋势,数据中心还必须着眼于寻找新方法优化自身的功耗。优化功耗的方法可能包括使用先进的冷却系统、高效节能的硬件和创新的电源管理策略。对于想方设法优化现有资源的数据中心来说,AI 驱动的管理工具甚至可能是理想的未来解决方案。

AI 不断重塑计算世界,数据中心必须做出调整,以满足这些应用不断增长的需求。随着 AI 领域的发展,以及越来越多公司希望在业务中部署 AI 应用,对强大计算资源的争夺将愈演愈烈。数据中心运营商必须投资于最新的技术和策略,以在这个不断变化的环境中保持领先地位和竞争优势。因此,Molex莫仕投资于未来的技术,其中包括 224 Gbps-PAM4 功能以及一整套数据中心电源管理解决方案。