跳至主要内容
Abstract data center corridor with glowing digital lines and waveforms visualizing high-speed data flow through servers and network infrastructure.

重新设计网络核心:光电路交换的兴起

随着光电路交换 (OCS) 的兴起,数据中心网络的未来正突破传统电子交换的物理局限,在光的领域重写新篇章。这场变革开启了效率新时代,但成功与否将取决于物理层能否具备管理大规模光信号所需的密度与精度。

阅读时间:5 分钟

从本质上讲,光电路交换 (OCS) 是一种突破传统电子分组交换的技术,它能在共享的物理光纤基础设施上构建直接、可重构的光电路。这种技术方案的出现源于 AI 和超大规模工作负载带来的指数级数据需求,这些需求正将电子交换架构推向极限。而该技术为突破电子交换的功耗和延迟瓶颈,提供了强有力的解决方案,尤其适用于大规模 AI 训练集群中庞大的东西向流量模式,在这种场景下建立直接、持久的连接可显著提升性能。

然而,这种架构转变也重新定义了主要的工程挑战。现在,焦点已从交换机本身转移到底层光互连系统的性能和密度上。

数据中心网络中的光交换与电子分组交换对比

传统电子分组交换 (EPS) 和 OCS 之间的核心区别在于如何建立连接。这种区别直接影响网络的速度和功率效率。

EPS 依赖于基于数据包的路由机制,其运作方式类似于复杂的公路网络,其中每个数据包都会被单独拦截和检查。路径上的每台交换机都必须读取单个数据包的地址信息以做出路由决策,这一步骤会消耗大量电力并导致延迟。该过程要求在每个交换阶段持续进行高耗能的光-电-光转换 (OEO),以便电子硬件能够分析数据。这些操作包括数据包处理和用于管理拥塞的缓冲等,会大幅增加网络基础设施的复杂性。

相比之下,OCS 就像控制火车方向的铁路道岔一样,控制光信号的流向。它会建立专用的端到端物理光路径以实现持续连接,使数据能够畅通无阻地流动,无需进行逐包处理。通过将数据完全保留在光域内,OCS 无需在每个交换机进行 OEO 转换,从而构建出更快速、更节能且更具长期成本效益的网络。由于交换机仅需重新定向光信号,因此 OCS 在很大程度上不受数据传输率和格式限制,可提供能够跨越多个技术世代、更能适应未来发展的网络基础设施。

从根本上说,选择 EPS 还是选择 OCS 取决于数据流量的性质。EPS 仍然是高度动态、不可预测、多对多工作负载的理想选择,而 OCS 则擅长处理大规模 AI 训练和高性能计算集群特有的大量、持久的少对少数据流。

超大规模数据中心光互连系统案例研究

光电路交换可行性的最有力证据来自 Google 的超大规模数据中心,该中心已大规模部署这一技术。Google 的 Mission Apollo 计划用数千个自主研发的 OCS 系统取代了传统的电子交换机,这些系统现在构成其庞大 Jupiter 网络的核心。

Palomar 系统
这套自主研发系统称为 Palomar,使用基于微机电系统 (MEMS) 的扫描镜来动态地重定向光束。该技术会在网络的不同部分之间创建直接、透明的光学路径,因此能以紧凑且节能的方式实现海量的连接组合。为进一步增加带宽,该系统还结合了波分复用 (WDM) 技术,使多个数据流可通过单条光纤传输。

执行结果
该部署方案成效显著。与 Google 此前采用的电子交换解决方案相比,基于 OCS 的网络所消耗的电力减少 40%,停机时间降至原来的五十分之一。这种向直连拓扑结构的转型还简化了网络层次结构,消除了对交换机整个骨干层的需求。

物理层要点
然而,这种实际部署也暴露出一个关键的物理挑战。Google 系统在最坏情况下的插入损耗为 2dB,这提醒我们,即使在最先进的光网络中,每个连接点仍会有少量的信号功率损失。这种情况的存在就导致需要一个精确而强大的物理层,以便在超大规模环境中维持信号完整性。要进行补偿,系统必须采用更高功率的光学收发器,这进一步凸显了对能同时管理信号完整性和电力传输的物理层策略的需求。

数据中心光互连系统的物理需求

向全光核心的转变将重新定义主要的工程挑战,将焦点从交换协议转向密度和信号完整性这两个核心物理问题。尽管 OCS 架构可解决电子处理的问题,但又将引入全新类别的硬件障碍,只有克服这些障碍,才能使系统在超大规模级别上具备可行性。

极端连接器密度挑战
OCS 是一种大型交叉连接,其数千条独立光纤必须装入极为有限的物理空间(通常位于交换机面板上)。这会带来极致的密度挑战,将传统连接器设计推向无以为继的极限。这种布局需要连接器解决方案能在极小的占用空间内实现前所未有的光纤密度,同时确保机械稳定性与光学连接性能不受影响。

信号功率和完整性挑战
任何光学连接固有的插入损耗是 Google 部署中凸显的关键挑战,在大规模 OCS 中更为突出。复杂路径中的每个连接点都会造成信号功率的累积损耗。这个问题需要一种包含两个关键组件的物理层解决方案。首先,它需要使用高精度、低损耗的连接器,以最大限度地降低每个连接点的损耗。其次,它需要一个强大的策略,从源头提供高光学功率,以补偿整个路径上的任何信号衰减。 

构建超大规模光网络

光电路交换网络的性能最终取决于其物理层的质量和创新水平。Molex 在整个互连系统路径中运用广泛的工程专业知识,满足全光核心的核心物理需求,提供直接解决密度和信号完整性挑战的解决方案组合。 

为应对极端连接器密度的挑战,MMC 电缆组件和适配器采用超小型 (VSFF) 设计。这样一来,它们能提供高达标准 MPO/MTP 解决方案三倍的光纤密度,这是实现大规模、高光纤数量 OCS 物理结构的关键要求。

外部激光源互连系统 (ELSIS) 提供克服插入损耗所需的高功率、易维护且热管理优秀的光源,可解决信号功率和完整性问题。此外,随着行业面向未来发展,ELSIS 将提供 OCS 与共封装光学 (CPO) 融合的关键链接。这种系统级的专业能力对于构建和扩展未来的全光学数据中心网络尤为重要。

克服超大规模数据中心的架构挑战。探索 Molex 超大规模数据中心连接解决方案

 

共享