​全球最大AI服务器供应商,浪潮携“元脑”再出击

2019-04-19
14:00:15
来源: 半导体行业观察

过去几年5G和人工智能(英语: Artificial Intelligence,缩写为AI)的火爆,不但带动了应用端、算法和相关ASIC芯片的繁荣,在服务器端也在推动创新。

这一方面是因为AI产生的海量数据需要服务器提供更多的运算能力支持,另一方面5G带来的应用场景需要服务器做相应的转变。 而浪潮作为国内首屈一指的服务器供应商,正在引领并推动这场变革。

在日前主题为“凝聚创新”的浪潮云数据中心合作伙伴大会(IPF)上,这家走在最前线的大厂给我们分享了他们对于AI和服务器现在和未来发展的一些看法。

服务器市场第三,AI服务器头号领头羊

在IPF 2018上,浪潮提出了做服务器全球第一的目标。 虽然这是一个艰难的目标,但我们可以看到,浪潮服务器在2018年实现了84.4%的增长率,是全球服务器增长率的2.5倍。 而在全球前三的服务器厂商中,排名第三的浪潮更是唯一一家2018服务器出货量同比2017年有增长的企业。 在国内,浪潮则是毫无争议的服务器领头羊,其31%的份额遥遥领先于其他竞争对手。

至于AI服务器方面,浪潮更是当之无愧的大赢家。 资料显示,这个业务51.4%的国内市场都被浪潮承包了。 公司也凭借在AI服务器的提早布局,迅猛发展为全球领先的AI服务器供应商。

​全球最大AI服务器供应商,浪潮携“元脑”再出击

按照中国工程院院士、浪潮集团执行总裁王恩东先生

按照中国工程院院士、浪潮集团执行总裁王恩东的说法,这主要通过他们发布的领先产品和多位客户合作实现的。 王恩东指出,浪潮建立了人工智能全栈的生态、多样化的人工智能加速卡、超过20款的人工智能服务器、成熟的人工智能开发PaaS平台以及强大的人工智能框架优化能力。

同时,他们在人工智能生态上也进行了巨大投入,这就帮助他们在这个产业里建立起了广泛的合作。

​全球最大AI服务器供应商,浪潮携“元脑”再出击

据王恩东介绍,浪潮在去年和合作伙伴推出了400多个联合解决方案,销售额达到了200多个亿。 而公司现在已经有了9000多家不同行业的合作伙伴,合作伙伴与他们的合作业绩整体增长率也达到了惊人的116%。 至于人工智能方面,浪潮去年与合作伙伴一起针对人工智能的行业应用场景,整理出了超过20多个解决方案,积累了大量的经验和行业案例。

​全球最大AI服务器供应商,浪潮携“元脑”再出击

“当前在AI百强企业当中,80%的企业都是浪潮的伙伴,并且都是深度的合作伙伴,这里面包括BAT互联网厂商,也包括第四范式等AI新兴的独角兽,也有大量的企业和我们开展了合作”,王恩东强调。

发布“元脑”,打造最强AI服务器生态

即使浪潮已经为AI服务器市场准备了不少“弹药”,但正如浪潮集团副总裁彭震先生所说,AI正在加速往通信、金融、广电、医疗和制造行业蔓延,这就需要更多的计算力。

在他看来,智慧计算是我们每个人都必须深刻思考的转型的方向。 这也是为何浪潮会做出以硬件重构加软件定义去支撑云的发展; 以大数据为认知方法为整个智慧计算提供转型的支撑; 同时借助深度学习优化算法为其智慧计算提供业务变革的驱动力等决定的原因。

​全球最大AI服务器供应商,浪潮携“元脑”再出击

浪潮集团副总裁彭震先生

基于这样的思考,浪潮在IPF 2019上发布了他们的“元脑”平台等多样产品,助力人工智能产业腾飞。

据介绍,浪潮“元脑”是浪潮人工智能全栈能力的载体与具象,它既包含浪潮全球领先的场景化人工智能基础设施,多样化的深度学习框架与工具,以及最新研发的人工智能 PaaS平台和AutoML Suite等“有形”产品,同时也凝聚了浪潮多年积累的人工智能算法优化、系统优化服务等“无形”能力。 所谓“元”,寓意着一切的初始,同时神经元也是脑神经网络的基本要素。 按照浪潮的规划,“元脑”将为人工智能提供最基础、最本源的创新支撑,赋能生态合作伙伴,加速产业人工智能化进程,促进人工智能产业百花齐放。

​全球最大AI服务器供应商,浪潮携“元脑”再出击

我们来看一下浪潮元脑系统组成:

计算: 通过浪潮人工智能计算平台、人工智能超高速计算加速卡、极低延迟RDMA网络与超高带宽并行存储,共同提供极致人工智能计算性能;

框架层: 浪潮针对最热门的TensorFlow框架,可提供公有云最快训练速度的TensorFlow-Opt优化框架与FPGA计算加速引擎TF2,并支持Caffe、Caffe-MPI、MXNet等主流框架;

PaaS层: 最新开发的人工智能PaaS平台面向人工智能企业训练场景,可实现容器化部署、可视化开发、集中化管理等,有效打通开发环境、计算资源与数据资源,提升开发效率;

算法层: 最新开发的AutoML Suite可实现非专业人员亦能通过极少操作构建网络模型并获得高精度,极大降低了人工智能开发、应用的门槛和成本。在2018年的NIPS 的自动机器学习挑战赛中,浪潮与北京邮电大学、中南大学团队合作,获得自动机器学习领域的国际顶尖赛事的全球第三佳绩。

服务层: 人工智能软硬件系统级优化、人工智能框架与算法级优化、应用咨询与系统设计等专业人工智能优化服务。

其他如 F10A、F37X和人工智能计算加速引擎 TF2 这是他们AI加速卡硬件的代表作。 这些软硬件将为相关开发者提供强而有力的支持。

​全球最大AI服务器供应商,浪潮携“元脑”再出击

携手英特尔,推动传统服务器升级

除了AI服务器及其相关生态产品,传统的服务器也是浪潮未来持续关注的一个领域。 但浪潮集团副总裁彭震同样指出,随着数据中心规模的变大,他们会面临构建和管理等一系列问题,这样给服务器带来乐新挑战。

为了解决相关问题,浪潮联合英特尔一起合作了一款高密度优化的四路的云平台。

英特尔数据中心平台研发及架构部中国区总经理王飞先生指出,这款名为Crane Mountain的2U四路平台采用的的是英特尔第二代的至强可扩展处理器Cascade Lake。 因为这是一个四路的平台,所以它可以支持高达112个内核的CPU内核,支持48根内存条,可以提供很多的内存容量。 据了解,这样一个四路配置的单节点可同时满足非常多高性能需求。

“这样一个高密度的设计,能更好地实现高效管理并降低OPEX 。 按照他们的估计,整套系统的CAPEX可以节省7到12个百分点,它就意味这OPEX可以节省5到7个百分点,这样就能比较显著地降低了数据中心的总体成本”,王飞强调。 这个系统在设计上又有新的亮点和创新,这是浪潮和英特尔的工程师做了很多的努力才实现的。

​全球最大AI服务器供应商,浪潮携“元脑”再出击

王飞表示,这是一个为虚拟机优化的设计,可以支持很大的内存容量。 同时为了提高系统的散热能效比,降低OPEX,他们还特意把这个产品的CPU的位置设计到有些一些错位。 这个系统的前面板可以支持可热插拔的模块,这就提供灵活的配置,可以方便售后的运维,也降低OPEX。

“总之我们认为四路的云平台设计可以更好地满足基础设施的新需求”,王飞补充说。

彭震也表示,浪潮和英特尔有着一个想法,那就是希望用四路的服务器大规模地替代在公有云里面两路的服务器,他们的目标是是计划替代超过一半的两路服务器。 但这也毫无以为见鬼是一个非常大的而且非常有挑战的工作。

“浪潮把我们过去在互联网里面已经广泛使用的一个四路服务器的设计贡献给了英特尔,双方也一起联合把这样的一个设计共同通过OCP开放出来,贡献给我们业界的所有合作伙伴,我们希望用浪潮这样一个成熟的设计推动产业界的合作伙伴,一起推动从两路服务器迁移到四路服务器,这将是一个巨大的变化,也将是一个巨大的挑战”,彭震强调。

对人工智能计算未来的一些看法

王恩东在IPF 2019峰会上一再强调,计算力是现代社会的生产力,而人工智能则将是这种计算力的核心。 但随着终端和上游应用的变化,人工智能计算如何才能满足客户、满足市场、能更好地为客户提供计算力支撑就成为了产业界关注的重点问题。 王恩东则表示: “基于浪潮在AI方面的技术、产品、模式上探索和实践,我们认为要达到这个目标,要做到开放、融合与敏捷这三点”。

首先看开放

从浪潮集团副总裁胡雷钧先生的介绍中我们得知,所谓开放就包括了架构开放和平台开放,通过架构开放和平台开放,就能为他们的最终客户和合作伙伴提供了一个良好的技术平台。 “浪潮在过去的10年里面一直践行开放”, 胡雷钧强调。 按照他的说法,浪潮已经逐渐从软件开放走向了硬件开放。

​全球最大AI服务器供应商,浪潮携“元脑”再出击

浪潮集团副总裁胡雷钧

在软件领域的开放方面,浪潮是OpenStack的全球金牌会员,他们在OpenStack社区的代码贡献量是Top10,这些代码可以帮助OpenStack实现1千个物理机以上的扩展,管理虚拟机的规模单一集群可以达到1万个; 在存储领域,浪潮也和开源社区充分合作,能够为Ceph的性能提升提供巨大支撑,在有些场景里面可以实现I/O吞吐量的翻倍,实现了IOPS的十倍的提升; 至于人工智能领域,浪潮的OpenCL FPGA第一次把多节点并行引入到了训练领域,这个开创性的成果也获得了整个社区的广泛接受。

来到硬件领域的开放,其整机柜服务器开放的项目上是过去几年里面硬件开源领域里最成功的实践。 胡雷均告诉记者,基于浪潮和国内互联网公司合作的开放组织ODCC,他们搭建了整机架交付的服务器系统,能够集中供电、集中管理、整机柜交付,为客户提供非常好的价值。 又因为这里包含了2倍部署密度提升、10倍交付速度,更高的维护效率,更高的投资收益和增长速度。 这就让它能为多个不同的行业提供部署和应用。 同时,我们也广泛参与了OCP、ODCC、Open19等开放组织。

其次看融合

胡雷均指出,融合主要体现在几个方面,第一个就是产业链的融合。 他指出,浪潮原来的IT系统建设模式往往是基于标准产品、基于标准服务、基于用户和供应商之间比较清晰的界面,这个界面往往是以需求的方式表达的,但是这个模式对于这种变化的适应就不是那么容易。

然而在融合的开发模式下,会让浪潮的前台/后台、最终客户和合作伙伴甚至厂商在一个开发平台上,在开源代码上、硬件上做共同的联合设计。

融合的另外一个方面也非常重要,就是要把新技术、把颠覆性的新技术融合到浪潮的业务模式设计里面,融合到整个的流程里面,融合到IT系统的支撑里面。 通过这个融合,释放浪潮自己的创新能力,让创新为整个产业的升级,改善整个产业的成本,为客户的应用体验的改善而提供支撑。

再看敏捷

所谓敏捷包含两个层面,一个业务的敏捷,另一个是开发上的敏捷。

“我们现在在互联网模式的驱动下做的很多生意,都要依靠我们对客户服务的多样性,要依靠我们产品的多样性,要依靠对于市场的不断适应。 这就要求我们自己的业务不断变化,不断地前进。 尤其是在AI推动的环境之下,会创新出很多新的应用模式和商业模式,这是很难规划的,就需要敏捷对待”。

在多维布局下,浪潮为走向服务器全球第一夯实了基础。

原创文章,作者:admin,如若转载,请注明出处:http://www.eefans.com/archives/1868

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注