连接器和电缆的可靠性对数据中心的性能至关重要
云端计算和物联网的发展,以及行动装置在日常技术中的普及,都使得创新且高效的数据中心(data center)比以往更加重要。要确保当今日益复杂数据中心敏捷、适应性强、具分布性、高效和智能,这已成为一个时代的挑战。然而,要在高温和高速运行的未来架构中实现并保持最高水平的精度和性能,就必须仔细考虑经常受到低估但却非常关键的测试领域。
数据中心实施测试是确保最佳性能的唯一途径,但这里就产生了一个问题,我们究竟需要进行什么测试?数据中心内的个别设备往往在更广泛的环境中发挥作用,例如暴露在更大的温度范围内。这些设备的认证级别与设计用于数据中心机柜的产品明显不同,因为它们不用暴露在极端环境中。
设计用于数据中心的产品要负责为整个设施提供最高可靠性,因为它们需要几乎毫无延迟地发送和接收数据,并且能够在芯片与芯片之间、机盒与机盒之间、交换机和交换机之间,成功地传输这些「1」和「0」。在这样运行的同时,它们还要避免发生停机,并最佳化数据中心的容量。这些都是我们需要的高可靠性产品,以避免出现未被利用或利用效率低下的机架,并确保数据和讯号的完整性得到保护,能以接近实时的速度进行无延迟传输。简而言之,连接器和电缆的可靠性对数据中心的性能至关重要。
数据中心故障的高昂成本
数据中心的可靠性有赖于正常运行时间和实现低延迟,因此在设计这些产品时,长期的可靠性和效率是我们追求的目标。每条电缆的性能要可靠,并且这些性能要连贯一致,是理所当然的,但是对终端用户来说,问题在于可以从中获得什么好处?一个证明测试好处的最简单方法,是看一下未经测试或测试不佳的产品对操作人员的效率影响。
举例来说,如果设计用于服务器交换机的产品没有经过适当的测试,在一整排伺服机上插上电源后才发现出现间歇性问题,那么一旦投入使用后,要进行更换或者维修零件或机架的成本将是难以估计的,不仅会停机浪费时间,还有额外的人力成本。工作指南表明,工程师只能在「热通道」上操作15分钟,加上工作和休息时间,因此至少需要花上一个小时才能恢复运行。将这个时间乘以一个拥有高达五千个机架的工作站,对正常运行时间的影响可能极大。高度熟练的操作人员应该把时间花在提升容量上,而非这些原本在安装之前就应该解决掉的问题。
「Open 19 Project」是一个创新计划,专注于数据中心和边缘硬件的开放性硬件平台,可解决如何提高数据中心运作效率的问题。提高硬件的互操作性是这项计划背后的精神基础,硬件标准的开发使计算机、储存和网络制造商能够建立具差异化的硬件解决方案,同时保护自己具竞争力的知识产权。更标准化的方法,例如符合Open 19要求的提案,通常侧重于快速替换和启动时间。与使用传统的电缆相比,使用更创新的方法可以将花费的时间从大约6小时减少到75分钟左右。
有了横向思考的能力除了考虑单纯的产品焦点,还对112 Gbps速度的液体冷却系统可能带来的优势推动了开发调查。这些创新解决方案更加突显了可靠产品性能的重要性。
除此之外,虽然对更大频宽的追求主导着通讯市场,但客户可能会在实现下一代数据速度升级的冷却系统时,面临经济上的难题。有远见的人也还在寻找可能的方法来取代系统中(包括服务器和交换机在内)大部分的电路板组装结构,以便在系统设计中实现更高的模块化和灵活性。这种方法可能包括去除一些阻碍空气流动的材料,增加可能的技术范围,例如实施Bipass,以减少散热问题。
主张采用「越冷越好」方法的组织报告指出,每个机架的整体能源消耗节省了多达25%。这样说来,一个拥有10,000个机架的数据中心将可达成显著的节能效果,每年可望实现七位数的节约!
为了最好的讯号完整性
数据中心汇集了无数的电路和元件界面。在这种环境下,阻抗偏移或阻抗不匹配会影响电气性能。这意味着在制造时必须保持在指定的公差范围内,以持续生产正常运行的产品。
我们要如何实现此一目标?Molex莫仕正在不断创新用于定期生产产品的制程、协定和材料。这一切都是因为要降低产品设计的复杂性,同时要遵守严格规定的公差。
当一个芯片向另一个机盒中的另一个芯片发送1或0时,要求接收芯片要非常清楚是1还是0。测试保证了产品将在指定的公差范围内按设计运行。这个过程可确保产品保持连贯地达到客户要求,从一个零件到另一个零件,从一批产品到另一批产品。而且,所有这些都没有发生变化,例如会干扰讯号传送的封包丢失及间歇性问题。
可处理更多的数据
由于乙太网络的频宽,以及服务器内部网络交换机与服务器之间的频宽增加,芯片性能因此变得更为强大,有两个不同的装置驱动着数据速度。这样一来处理能力会有所提升,可以在更短的时间内处理更多的数据。这也意味着讯号传输和吞吐量的增加提高了运行高速网络和应用所需的性能水平。
成功传输加速数据流的基石是连接器,无论是电缆、PCB,或是特定于处理器与通道末端之间路径的连接器。目的是确保这些构件之间通过连接器和电缆稳定传送到接收端(RX)。
这样反过来又对创新互连技术专家提出了相当高的要求,他们需要非常精确地处理和遵守所涉及的众多因素,包括保证产品的微小机械公差范围。对于数据中心而言,机械变化最终意味着电气变化。
让我们以宏观的角度来看数据中心会提示出几个关键的考虑因素。如果发生数据连续性的问题会如何?从质量的角度来看,随着越来越多的零件、产品、电缆和交换机逐渐被内建到机架中,如果有个突发状况导致突然的间歇性问题或某个讯号丢失,数据中心会怎么样?
这种实际情况通常需要更换损坏的服务器、更换损坏的交换机、在热通道里拔掉电缆、重新插入电缆,然后再次测试机架。显然,当技术人员必须把宝贵时间花在热通道上,而不是实际安装设备和启动及运行新资产和容量,数据中心的生产力就会受到影响。
宝贵的经验教训
要避免上述类型的情况发生,需要实现连接产品的连贯性。业界基准已明确定义了电气的不一致可能引起的众多问题,并有助于了解如何善后。
在这些关键产品的制造中,创新的重要性比以往更重要。Molex莫仕强劲的数字化转型能力促成了一项全球制造策略,这项策略提供连贯性,特别是对于小型化元件,同时还使冷却单元发挥作用。Molex莫仕多年的大量投资造就了更加稳定的制程和资源,不仅实施自动化生产,同时实现量产和连贯性。
现实情况是,连接性是提供完整性的关键,首先是讯号完整性和电源完整性。当数据中心的完整性得到维护,各种复杂系统的性能就会得到维护。
只有通过对生产的每个电缆组件的每个讯号进行全面测试,以确保一贯的业界领先质量控制,才能实现安全、有效的数据中心解决方案。此举让客户能够信赖每条电缆的性能,以及该性能的连贯性。
由于这种测试十分严格,因此客户不必自行进行此类测试。这不仅仅是关于时间和费用的问题,还意味着技术上的复杂挑战,就好像那些围绕光缆连接和端到端问题,最后都要交给专家解决--Molex莫仕工程师将在公司的传统基础上继续发展绝佳的连接体验。
最后结果是如何?我们将有效地实施管理,也就是实现立即安装,同时消除日后排除故障电缆的风险;达到最佳的正常运行时间,为客户节省时间和金钱,并加速产品上市时间和投资回报率。