⼈⼯智能(AI)彻底改变了各个⾏业,推动了对⾼效组⽹解决⽅案的需 求,这些解决⽅案能够⽀持⼈⼯智能应⽤的海量数据需求。DriveNets 的全新解决⽅案 Network Cloud-AI 利⽤以太⽹进⾏⼈⼯智能组⽹。在 这篇博⽂中,我们将探讨和⽐较 InfiniBand 和以太⽹,突出它们在⼈⼯ 智能⽹络背景下各⾃的优势和劣势。
什么是 InfiniBand
InfiniBand 是一种高速组网技术,主要为高性能计算(HPC)环境而设 计,能够实现极低延迟和高带宽,因而适合需要可预测和无损整体结构 的应用。尽管 InfiniBand 是一种功能强大的网络技术,但它实际上是一种专有协议,不仅价格昂贵,还附带网络和 GPU 级别的供应商锁定。因此,业界正在寻找更具成本效益且不带供应商锁定的替代解决方案
什么是以太网
相较而言,以太网是一种应用广泛的网络技术,多年来不断发展,可满足数据 中心不断增长的需求。作为当今事实上的网络标准,每年出货量超过 6 亿个以 太网端口。以太网的灵活性、可扩展性和易用性使其成为包括人工智能网络在 内的各种应用的热门选择。随着用于集群和存储区域网络的数据中心桥接(DCB)等方面的进步和发展,以太网改善了其性能特征,包括减少延迟和增 强服务质量(QoS)。
人工智能组网:让我们比较一下 InfiniBand 和以太网
到目前为止,人工智能网络一直基于以太网或半专有解决方案。传统的以太网 叶脊架构的设计初衷并非用于支持大规模的高性能人工智能工作负载。英伟达 InfiniBand 等半专有解决方案不支持网络互操作性,对于希望避免供应商锁定 的超大规模数据中心而言缺乏灵活性。
带宽与延迟
InfiniBand 在原始带宽方面表现出色,最新一代的速度高达 200 Gbps,乃至更 高。这种高吞吐量有利于涉及大量数据传输的人工智能工作负载。然而,以太 网也取得了长足的进步,现代以太网技术也可提供满足大多数人工智能应用要 求的大量带宽,例如 800 Gbps 接口——InfiniBand 在未来两年内无法支持。虽 然 InfiniBand 一直能实现较低延迟,但以太网技术的进步已显着缩小了差距,同样成为低延迟人工智能工作负载的可行选择。
可扩展性与灵活性
以太网的广泛采用和兼容性使其具有高度可扩展性和灵活性。它能够与现有数 据中心基础设施兼容,支持各种各样的设备,更容易集成到不同的网络环境 中。相比之下,InfiniBand 可能需要特定的硬件和软件配置,从而限制了其可 扩展性和互操作性。随着时间的推移,以太网的兼容性和成本优势使其在传统 基础设施集群中具有优势。
安全与管理
InfiniBand 缺乏以太网广泛的安全和管理功能,而这些功能是以太网供应商通 过数十年而构建的。以太网在企业和服务网络中的长期存在催生了健全的安全 协议和全面的管理功能。因此,对于在人工智能部署中优先考虑安全性和高效 网络管理的组织而言,以太网是更为有利的选择。
成本效益与⾏业采⽤率
以太网的普及和批量生产使其比 InfiniBand 更具成本效益。以太网组件和设备 的广泛使用降低了部署和维护成本,因此对于预算有限的组织来说是更有吸引 力的选择。此外,IDC 研究表明,以太网仍然是绝大多数人工智能工作负载的 首选协议,预计 2025 年 90%的人工智能工作负载将在以太网上运行。虽然 InfiniBand 可能在类似高性能计算的工作负载中拥有一些“利基市场”用例,但以 太网在外部连接和内部计算网络、在线连接的各种应用和人工智能工作负载类 型方面都处于有利位置。
DriveNets Network Cloud-AI 是两全其美的选择。与其他以太⽹解决⽅案相⽐,
它能够将⼤规模⼈⼯智能⼯作负载的作业完成时间(JCT)缩短⾼达 30%,从 ⽽⼤幅提⾼资源利⽤率。它还⽀持标准以太⽹,为供应商提供互操作性和选择。DriveNets Network Cloud-AI 是⼀种创新的⼈⼯智能组⽹解决⽅案,旨在最⼤ 限度地利⽤⼈⼯智能基础设施,提⾼⼤规模⼈⼯智能⼯作负载的性能。
DriveNets Network Cloud 部署于全球各种最⼤⽹络中,⽽ DriveNets Network Cloud-AI 则基于这⼀技术,在最近的试验中已被领先的超⼤规模数据中⼼验证 为最具成本效益的⼈⼯智能组⽹以太⽹解决⽅案。DriveNets 利⽤以太⽹,提供 了⼀种具有成本效益和可扩展性的解决⽅案,可与现有⽹络基础设施⽆缝集成,⽤于实现内部计算和外部连接。
通过在调度整体结构(而不是基于以太网的多跳互连)上运行的机架间连接,该解决方案能够将多层 Clos 架构(ToR/叶脊/超级脊柱)折叠为扁平的单交换 机架构,从而实现无损连接、低延迟和低抖动。
通过调度整体结构有效利用以太网实现人工智能组网
InfiniBand 和以太网都是强大的组网技术,各自在不同的环境中具有独特的优 势。虽然 InfiniBand 一直在高性能计算环境中表现出色,但以太网已经可以满 足现代数据中心和人工智能应用的需求。DriveNets Network Cloud-AI 解决方案 展示了如何通过调度整体结构来有效利用以太网实现人工智能组网。DriveNets Network Cloud-AI 提供了一种独特的创新架构,同时具有整体结构互连解决方 案的高性能和规模,以及开放解耦式云解决方案的成本效益。