行业与应用
传统板级互连系统的物理限制现已成为提升数据中心性能的主要挑战。无论是球栅阵列 (BGA)、表面贴装技术 (SMT) 焊点,还是铜柱等先进微电子连接,每个互连点都有可能产生信号损耗。
虽然先进的材料能起到一定作用,但它们并不是完整的解决方案;高频信号在基板上即使经过短距离传输,也会损失大量功率。因此,系统架构师的主要目标已发生变化。当前的重点是,消除通孔和长 PCB 走线等会降低性能的转换环节,从而优化整个电气通道。
这一现实促使互连系统转向两种模式:紧邻主处理器(近 ASIC),或直接集成到主处理器上(ASIC 上)。系统架构师现在需要评估这类新的解决方案,包括近 ASIC 设计,以及共封装铜缆 (CPC) 和共封装光学 (CPO) 等 ASIC 上技术。由于将连接器直接与基板对配是一种新颖的应用,因此架构师需要掌握更高层次的专业知识,才能实现妥善处理。关键挑战已经从选择技术转向掌握全新的设计理念,而这始于对性能瓶颈本身有更深入的理解。
现代系统设计的性能瓶颈
更高的数据传输率会产生多个相互关联的问题,导致传统的板级设计变得不可持续。其核心是信号完整性危机。从芯片及其基板再到主板,在整个互连系统路径上的每个转换点,累积的信号损耗会不断削弱高频传输信号。
信号损耗会直接转化为功率挑战,因为需要更强的驱动信号来克服损耗,而这反过来又会增加热量和整体系统功耗。设计工程师往往不得不添加重定时器等昂贵的组件来增强信号,导致系统复杂性和功耗进一步增加。这一概念通常被称为“I/O 功耗瓶颈”,它是一个临界点,在这个点上,传输数据所消耗的能量与处理数据本身相当。数十年来,这个问题始终是个持续的挑战,但随着数据传输率提升至 224G(奈奎斯特频率超过 50 GHz),传统 PCB 材料已达到其绝对物理极限。
密度危机会进一步加剧信号完整性方面的挑战。即使保持相同的数据传输率,仅是将系统中的 GPU 数量翻倍,就会使传统布线方式愈发困难。前沿的现代交换机和 GPU 设计可能需要在芯片周围极其有限的区域内,容纳超过 1,024 对差动信号线对。在某些极端情况下,信号损失非常严重,以至于架构师甚至无法使用基板的外缘进行布线。密度挑战不仅限于布线本身,还影响着连接器间距、逃逸布线、功率密度和热管理。信号衰减、功率需求和密度限制这三重挑战,凸显出在针对 224G 及更高数据传输率进行规划和设计时,传统方法存在的局限性。
定义新格局:近 ASIC 与 ASIC 上
在近 ASIC 和 ASIC 上解决方案之间进行选择,需要做出一系列明确的架构决策。作为决策起点的常用经验法则是:在近 ASIC 设计中,从 PCB 到基板的转换会造成大约 3 dB 的信号损耗。224G ASIC 上解决方案的性能目标极为严苛,通常要求在高达 56 GHz 的频率范围内,插入损耗低于 -1.0 dB,回波损耗低于 -17 dB,以保持信号完整性。
近 ASIC 方法
近 ASIC 解决方案可为完整的 PCB 走线解决方案提供性能更好的替代方案。由于位于主板上,它们通常依赖于成熟的 SMT 焊接,能够在性能提升和现有的制造工艺之间取得平衡。在标准 PCB 上实施该系列解决方案通常需要大量的层数(超过 30 层)来满足布线密度要求,这可能会推高电路板成本。
如果上市时间是关键因素,则通常会选择这种方法,因为这是一个经过验证的解决方案,可确保系统如期发布。然而,其可行性取决于系统的总体损耗预算,以及它是否能承受板到基板转换所产生的额外信号损耗。对注重上市时间的架构师来说,ASIC 上方法的设计复杂性和可感知风险,使近 ASIC 方法更具吸引力。
ASIC 上方法
ASIC 上解决方案直接集成到高级基板上,可实现更细的走线和更高的布线密度。近 ASIC 设计由于层数更多,会推高主板成本,而 ASIC 上方法是将费用转移到基板本身。在系统中,高价值基板成本高昂,通常仅次于处理器芯片本身,因此其设计必须优先考虑防护性。采用可返工的压缩式互连系统可带来显著优势,这类系统能可靠运行,且避免了焊接带来的诸多挑战。
展望未来,业界正探索用玻璃或硅来替代有机基板,以应对未来的性能需求。这些材料提供卓越的尺寸稳定性和平整度,既有助于缓解基板翘曲等问题,又能实现更精细的电路特性。
共封装铜缆和共封装光学对比
CPC 将值得信赖且成本较低的铜互连技术延伸到短距离应用场景,在这类场景中,经过验证的可靠性是关键因素。铜是一种成熟可靠的介质,其可靠性和实施方法均已得到了充分验证。然而,它的主要缺陷在于:每当传输率升级时,都需进行大量且高成本的信道重新设计,这一过程非常耗时,可能延误系统开发。
CPO 技术通过从根本上解决信号传输距离和完整性难题,提供全新的技术路径。但该优势伴随着更高的初始成本和新增的制造复杂性,因为系统必须引入大量新元件。波分复用 (WDM) 等技术让单根光纤能承载多路数据流,从而进一步强化这一优势。通过解决核心的信号完整性问题,CPO 将开启新的创新周期。它支持先进系统设计,例如将组件拆解为可独立升级的硬件,这对于超大规模数据中心具有显著的优势。
最终,选择 CPC 还是选择 CPO 通常取决于成本效益分析。虽然量产型 CPO 系统尚未普及,但一些超大规模运营商因其迭代周期快,可能更青睐 CPO 所带来的长期灵活性。相比之下,电信行业需要系统拥有更长的使用寿命并能应对多次速度升级,因此通常优先考虑可靠性经过验证且初始投资更低的 CPC。
全局视角:向芯片级连接的转变
高速互连系统向芯片迁移是行业的当务之急,这是高速数据传输的物理极限带来的直接结果。要在当前速率下取得成功,需要在早期阶段就进行深入协作。Molex 积极与整个生态系统(涵盖芯片开发人员和最终用户)中的公司合作设计解决方案。成熟的近 ASIC 解决方案所验证的工程技术,直接为有效的 ASIC 上策略提供参考,该策略优先考虑稳健、可返工的设计,以保护高价值的基板。
要在未来取得成功,需要选择既掌握了多元生态系统(包括近 ASIC 解决方案以及 CPC 和 CPO 等 ASIC 上技术)专业知识,又能够在整个价值链中开展紧密协作的合作方。这种紧密的合作使 Molex 能够打造出支持更快数据处理的近 ASIC 解决方案,以及能够提升下一代网络能效和可扩展性的 CPC 和 CPO 技术。展望未来,Molex 正在为行业密度提升的下一个重大瓶颈做准备,在此挑战中,光学技术或将展现显著的长期优势。
通过与设计工程师合作,Molex 将继续开发克服现在和未来的性能瓶颈所需的高速解决方案。探索 Molex 224G 高速数据中心解决方案。