机器学习的理想平台——新华三H3C UniServer R5200 G3服务器详解

2019-12-24 18:33:25 盛思信息 2

图片关键词

图片关键词

而随着AI行业竞争的加剧,为了更快推出AI应用,抢占行业的制高点,AI研发企业对于AI训练速度的要求也越来越高,对TCO也变得越来越敏感。因此,寻找一款具备更高效率的专业AI计算平台就成为了AI领域众多企业的燃眉之急。新华三最新推出的H3C UniServer R5200 G3正是这样一款平台。

图片关键词


图片关键词

首先,H3C UniServer R5200 G3采用了最新的英特尔至强金牌系列处理器及配套的C621芯片组,最高支持205W TDP。在采用两颗英特尔至强金牌6148P时,服务器可提供40个物理内核及80个线程,最高可支持1.5TB DDR4-2666内存容量。

而在最重要的GPU支持上,该服务器更是做到了极致。H3C UniServer R5200 G3内部提供了21个全长PCI-E 3.0扩展接口,能够以x16方式同时安装10块双宽GPU计算卡或以x8方式同时安装20块单宽计算卡(另一个PCI-E 3.0接口用于扩展高速卡)。不同的配置分别对应了机器学习中最主要的训练和推理两大应用场景。

在搭配目前最顶级的NVIDIA Tesla V100计算卡时,整机可以在4U空间内就提供高达1120T TensorTFLOPS性能。而如果采用普通的2U服务器,用户则需要5台服务器和10U空间才能达到相同理论性能;当然,在实际的应用中,用户还需考虑服务器集群所带来的功耗、网络以及优化和管理等问题。

可以说H3C UniServer R5200 G3达到了目前商用设备中单位体积内计算性能的巅峰,能够让用户以最小的空间和硬件开销达到更高的性能,从而免去扩建数据中心、构建大型网络所带来的种种成本。

当然,为了保证服务器在满配状态下能够持续稳定运行,H3C UniServer R5200 G3也在散热和供电部分采取了冗余设计。

在散热部分,H3C UniServer R5200 G3采用了支持热插拔的5+1冗余风扇设计,不仅能够为CPU和GPU提供足够的风量满足散热需求,更为可能发生的意外留出了足够的散热余量。

而在供电部分,服务器也标配了4个1600W热插拔80Plus铂金电源,并采用N+N的冗余配置,保证服务器能够在任何情况下都能够获得极高的能源效率与充沛的电力供应。

图片关键词

在以GPU为主力计算单元的异构计算环境中,传统的管理工具却很难完美应对,因此新华三还为服务器搭载了专门针对GPU异构计算平台的管理软件——AIOS。

AIOS不仅能够实现GPU负载、工作状态监控等基础功能,更能够基于主流的云及容器环境实现GPU资源调度功能,让企业可以在多租户环境下更灵活的使用庞大的GPU资源,从而实现更全面的异构计算管理。

图片关键词


虽然H3C UniServer R5200 G3本身能够提供极强的计算能力,但在更大规模的机器学习、高性能计算等应用场景中,企业通常也会使用更多GPU服务器组成集群来实现更高的性能。为此,新华三为H3C UniServer R5200 G3提供了强大的网络选件。用户可在10Gb以太网及56/100Gb Infiniband网络之间做出选择,从而实现更高的互联能力。

而在磁盘存储方面,H3C UniServer R5200 G3标配14个SAS或SATA SFF硬盘位,可安装HDD或SSD,在满足极致计算的同时提供足够的存储空间。

图片关键词

人工智能是当今计算科学应用的最前沿之一,更是对传统硬件计算平台提出的一次重大挑战。而凭借在服务器硬件设计领域多年的积累以及庞大的投入,新华三针对人工智能应用中要求最高的机器学习场景的各类需求推出了H3C UniServer R5200 G3。该设备不仅代表了当今服务器设计领域的顶尖水平,更是“服务器设计场景化”理念的代表作。

图片关键词

本文转自《新华三》

首页
产品
新闻
联系