跳至主要内容
A futuristic data center interior featuring rows of server racks glowing with blue and yellow LED lights, representing high-speed data processing and on-ASIC integration in a hyperscale environment.

ASIC 上集成:解决芯片级挑战

对于下一代超大规模数据中心而言,ASIC 上集成代表着系统设计范式的转变,它将处理器封装重新定义为完整的 I/O 引擎,从而解锁全新的性能水平。然而,要成功实现这一强大架构,必须攻克热管理和可维护性等一系列更为严峻的全新工程挑战。

阅读时间:5 分钟

传统数据中心架构依赖前面板可插拔光学器件和铜缆,目前即将接近性能极限。这种集成方式需经由多个互连点传输,路径长且损耗大,随着波特率提升,信号劣化速度急剧加快。由此导致每一代速率升级都会显著缩短有效传输距离并压缩裕量。为满足 224Gbps PAM-4 数据传输率的需求,业界正通过 ASIC 上集成方案做出回应,这是一种将 I/O 接口直接迁移至处理器基板上的架构革新。尽管并非所有 224G 系统都必须采用此方案,但需要现在就着手解决这一复杂的技术转变,以便在未来 448G 数据传输率时代到来,且此方案成为必然时,能够实现架构的更广泛集成。这延续了行业长期以来的趋势,即从传统的板级布线,发展为部署于处理器邻近位置的近 ASIC 电缆解决方案。

在解决信号完整性和密度这两大燃眉之急的同时,ASIC 上集成也将工程设计的重心转向热管理和系统可维护性这两大严峻的新挑战上。对于设计工程师而言,现阶段能否充分发挥这一新架构的全部性能,完全取决于能否克服这些复杂的二阶挑战。

ASIC 上集成的优势:性能的根本飞跃

在传统的前面板可插拔架构中,信号完整性挑战是一个系统级难题。信号必须从芯片出发,经过多个微电子互连系统和基板,沿着一条长距离且存在损耗的路径到达前面板 I/O。

ASIC 上集成的主要优势在于缩短电气通道,从而减轻信号衰减的核心问题。就光学器件而言,它也能打破以往每一代速率升级时,都必须对整个电气通道进行重新设计与验证的高成本循环,因为工程师现在只需要解决基板上短距离走线的问题。在 224Gbps PAM-4 数据传输率下,这种简化至关重要,因为它能最大限度减少传统架构所需的高成本、高功耗重定时器。

通过将光学引擎集成到芯片上,电源效率也能显著提升。这种提升源于减少或去除了大功率数字信号处理器 (DSP),这是传统可插拔模块中用于补偿互连系统损耗所需的器件。由于摒弃了传统的多源协议 (MSA) 标准外形,光学系统能够大幅提高面板密度。用更密集、更紧凑的光纤连接器替代体积庞大的可插拔收发器屏蔽罩,可以最大限度地利用宝贵的前面板空间。

量化这些提升的过程十分复杂,且需结合具体应用场景。对于以最高速度运行的最先进芯片,可能需要采用 ASIC 上集成方案,但对于许多应用场景来说,其他解决方案已经足以应对。

二阶问题:掌握 ASIC 上集成

ASIC 上集成可解决信号损耗这个一阶问题。然而,这样做也会引入一系列新的、更为严峻的二阶挑战,使工程设计重心发生转移。

热管理的复杂性
热管理给铜和光学方案提出了不同复杂程度的紧迫挑战。共封装铜缆 (CPC) 方案因电缆密度问题,导致了对物理空间的激烈争夺,而共封装光学 (CPO) 方案则需解决其激光器与高温处理器之间的热不兼容性问题。共封装光学 (CPO) 方案中的主要热源是激光器,当它与高温处理器处于同一热区时,就无法可靠运行,因而需要全新的架构方法。这通常意味着需要设计定制的液冷散热器,以适应芯片周围精确的高度和空间限制。

可维护性风险
可维护性会带来重大的高风险挑战。由于各类组件现在都集成到了与高价值 ASIC 相同的昂贵基板上,单个低成本连接器的故障就可能危及整个处理器封装。由于 ASIC 难以便捷地拆卸或更换,整个组件便成为单点故障。这种威胁使得可返修性成为首要的设计考量,并使压缩式互连系统成为降低风险的连接方案。

对于 CPO 而言,这种风险更为严峻。在现有的设计中,光纤通常被永久性地固定在基板上的光学引擎上。在装配或维修过程中,只要有一根光纤断裂,就可能导致整个封装报废。

超越标准验证程序
验证将构成最后一项挑战,因为这种独特的基板上环境并未被标准 EIA 或 Telcordia 规范完全覆盖。在 224G 数据传输率下,一些以往微不足道的变量,如基板物理翘曲的细微变化,如今也可能显著影响性能,从而产生一类难以预测的新型潜在失效模式。当速率超过 224G 时,这些因素的影响将变得更为显著。

解决二阶挑战

要成功应对 ASIC 上集成设计带来的二阶挑战,需要一种能够解决电气、机械和热性能之间复杂交互的系统级工程理念。

可维护性与返修的新方法
针对关键的可维护性挑战,针对铜缆的一种可行方案是采用压缩式互连系统。这种设计能保护高价值基板,并支持简易、现场可更换式返修,从而降低处理器所面临的风险。

对于光学器件而言,这一原理扩展到了可分离式光纤到芯片接口的开发上,这对于构建完全模块化且易于维护的 CPO 架构至关重要。

采用外部激光源,成功应对热挑战
在 CPO 架构中,解决独特热管理难题的架构方案是,通过外部激光源 (ELS) 将主要热源与处理器分离。这种方法将大功率激光器物理分离为简易、可插拔、可维护的模块,在显著降低热应力的同时,提升激光器的稳定性和长期可靠性。

在新环境中验证性能
要克服验证挑战,需要采用全新且更严谨的测试理念。目前亟需制定新的测试流程,以成功隔离并分析细微变量(如基板翘曲)对高速系统性能的影响。这种更高层次的严谨性,对于确保系统可靠性、防止生产环境中发生代价高昂的故障至关重要。

集成的未来并非只有一条道路

ASIC 上集成的下一个前沿很可能涉及 3D 芯片堆叠。由于内存和交换机 ASIC 等组件通常在不同的晶圆代工节点制造,垂直堆叠是实现最短电气连接路径的合理选择。基板材料本身也在同步演进,业界正积极探索玻璃和硅等替代材料,以支撑这些日益密集的架构。

然而,前进的道路将是多方面的。早有预言的“铜缆消亡”尚未成为现实,且并非所有 224G 应用都必须采用 ASIC 上集成。在可预见的未来,采用转接板或子卡的替代架构仍将与光模块方案并存,成为可行且具有成本效益的选择

归根结底,掌握 ASIC 上集成意味着攻克打造全球最快系统的第二大挑战,这对于任何志在巅峰性能竞争的企业而言都是至关重要的核心能力。

设计 ASIC 上解决方案

Molex 将 ASIC 上架构理念转化为一系列可直接投放市场的解决方案,直面集成过程中的二阶挑战。

Molex 将 ASIC 上架构理念转化为一系列可直接投放市场的解决方案。对于 CPC 应用,Impress 共封装铜缆解决方案通过压缩式方法,解决关键的可维护性难题。该系统采用 30 AWG Twinax 电缆,支持 224Gbps PAM-4 及以上的数据传输率,提供无焊接口,保护高价值基板。这种工程设计支持简易的现场可更换式返修,且不会对处理器造成风险。

对于 CPO,率先上市的外部激光源互连系统 (ELSIS) 通过将激光源转移至可维护的单独模块中,解决了核心的散热和可靠性难题。Molex 还将这种系统级的专业知识应用于下一个前沿挑战领域,积极开发解决方案,以应对创建可靠、可分离的光纤到芯片接口这一艰巨任务。

ASIC 上集成是下一代数据中心的基础组件。探索 Molex 224Gbps-PAM-4 高速数据中心技术的全面产品组合。