全新的NVIDIA Spectrum-X 网络平台结合了NVIDIA Spectrum-4、BlueField-3 DPU 和加速软件;全球头部云服务提供商采用该平台来横向扩展其生成式AI服务
【资料图】
中关村在线消息,2023 年5月29日,NVIDIA推出NVIDIA Spectrum-X 网络平台,该平台是一个加速网络平台,致力于提高基于以太网AI云的性能与效率。
NVIDIA Spectrum-X是基于网络创新的新成果而构建——将 NVIDIA Spectrum-4以太网交换机与NVIDIA BlueField-3 DPU紧密结合,取得了1.7倍的整体AI性能和能效提升,同时可在多租户环境中提供一致、可预测的性能。Spectrum-X还提供NVIDIA加速软件和软件开发套件(SDK),使开发人员能够构建软件定义的云原生AI应用。
这种端到端的功能交付,可以减少基于transformer的大规模生成式AI模型的运行时间,助力网络工程师、AI数据科学家和云服务商及时取得更好的结果,并更快做出明智的决策。
全球头部超大规模云服务商正在采用NVIDIA Spectrum-X,包括领先的云创新企业。
作为NVIDIA Spectrum-X参考设计的蓝图和测试平台,NVIDIA正在构建一台超大规模生成式AI超级计算机,命名为Israel-1。它将被部署在NVIDIA以色列数据中心,由基于NVIDIA HGX平台的戴尔PowerEdge XE9680服务器,BlueField-3 DPU和Spectrum-4交换机等打造而成。
NVIDIA网络高级副总裁Gilad Shainer表示:“诸如生成式AI等革命性技术正在推动各家企业提升数据中心性能的极限,从而获得更多竞争优势。作为新一代以太网络,NVIDIA Spectrum-X为新一代AI工作负载扫清障碍,将会彻底改变整个行业。”
NVIDIA Spectrum-X 网络平台具有高度的通用性,可用于各种AI应用。它采用完全标准的以太网,与现有以太网的堆栈实现互通。
该平台起步于Spectrum-4,这是全球首款专为AI网络打造的51Tb/s以太网交换机。先进的RoCE扩展功能可以跨Spectrum-4交换机、BlueField-3 DPU和NVIDIA LinkX光纤相互协同,共同构建了一个专为AI云优化的端到端400GbE网络。
NVIDIA Spectrum-X 通过性能隔离增强了多租户环境,确保租户的AI工作负载能以最佳性能持续运行。NVIDIA Spectrum-X 还提供了更好的AI性能可见性,它可以识别性能瓶颈,而且具有全自动网络验证功能。
驱动Spectrum-X的加速软件包括Cumulus Linux、纯SONiC和NetQ等性能强大的NVIDIA SDK,共同助力该网络平台实现极致性能。另外,Spectrum-X还包括BlueField DPU的核心软件——NVIDIA DOCA软件框架。
NVIDIA Spectrum-X 单台交换机即可实现突破性的256个200Gb/s端口的连接,使用两层叶脊拓扑可以连接16,000个端口,以支持AI云的增长和扩展,同时保持极高的性能和极低的网络延时。
生态采用情况
提供NVIDIA Spectrum-X方案的公司包括戴尔科技、联想和超微。
供货情况
NVIDIA Spectrum-X、Spectrum-4交换机、BlueField-3DPU和400G LinkX光纤现已上市。
英伟达(NVIDIA)Tesla显卡A800 H100 T4 A100 A40计算加速GPU推理训练 Tesla V100 32G
进入购买