《金山云如何利用高性能计算让AI更具智慧?》

2017-11-13 14:57:00 作者:佚名 分类 : 新闻中心

  作为衡量计算力强弱的核心载体,近几年芯片业可谓是风水轮流转,换家坐庄。这边刚传出博通要1300亿美元收购高通,那边马上就说英特尔AMD这对多年的老冤家都决定联手了,而近日芯片巨头英伟达发布的2018财年第三季度财报则同样广受关注,其第三财季营收达到创纪录的26.4亿美元,截止今年目前为止,其股价已经上涨了约92%。

  应该看到,英伟达营收创纪录及股价暴涨的背后,是受益于以人工智能为代表的对图形芯片的强劲需求而推动,人工智能对于GPU的空前依赖同样也促进了厂商对于芯片的加速换代升级。依靠算法、数据和计算为基础支撑点的人工智能,面对空前高涨的计算力,迎来了全新的发展机遇。以GPU为代表的计算设备单位面积和单位功耗的计算能力的极大提升,带来了计算密度的提高和机柜成本的快速下降,以此为高性能计算快速步入大众视野打下了坚实的物理基础。而其中具有代表性的金山高性能计算,经过多次迭代演进,已经成为高性能计算中的领导者。

image.png

                                        金山云异构高性能计算解决方案

  高性能计算成为应对爆炸式增长神经网络的必然选择

  由于集成电路制程工艺趋于接近摩尔定律的物理极限——接近硅极限的7nm,单芯片与单系统的性能提高也开始逐渐变慢甚至趋于停滞,无法满足不断爆炸式增长的神经网络规模,此时,高性能计算集群就成了必然选择。金山云通过使用业界顶配的GPU服务器加上高带宽与低延迟的RDMA网络,搭配高性能存储服务,为用户构建了可伸缩的高性能计算集群,来应对不断增长的业务需求。

  以运算需求来划分,在初始阶段,服务器只是面对web、游等普通运算,没有太多计算压力;而随着AI训练与推理应用等强计算需求不断涌来,原来AI所依赖的深度学习的网络规模呈现了指数级增长,深度神经网络的参数从6百万增加到了87亿,对服务器产生了非常大的压力,基于公有云的高性能计算平台,成为应对该类需求的不二之选。用户可以根据业务按需创建GPU服务器资源,该类GPU服务器原生支持VPC网络,GPU服务器之间拥有20Gbps的高性能网络带宽,且都位于高品质的IDC机房,拥有电力和网络的冗余保护,同时完善的监控体系,保障业务稳定运行。

  以计算能力来划分,相对以前使用大量的CPU去堆砌超级计算的时代,现在一块GPU的计算能力,相当于之前几千块CPU搭建起来的超级计算机的能力,但对于普通终端用户而言,基于此专门去购买相应设备依然花费不菲。加上GPU设备本身采购成本极其高昂,大量采购GPU物理服务器带来了极大的资金占用,而由于GPU领域使用比摩尔定律更激进的黄氏定律,进而导致折旧成本更高。用户在面对新的业务需求时,硬件层面显得捉襟见肘,无业务弹性。

  而训练更大规模的神经网络就需要更大规模的集群,高性能计算的出现,可谓极大解决了原有大集群的搭建和维护带来的资金和运营压力,用户只需租用云服务商的高性能计算服务,无购买硬件所存在的资金占用风险,以比较低的使用成本弹性使用资源,即买即用应对业务变化,同时始终可以用到最新的高性能计算加速硬件,这也是高性能计算得以快速发展的根本原因。

  金山云高性能计算赋能人工智能加速发展

  金山云做为业内最早提供公共IaaS服务的云计算厂商之一,提供了业内最丰富的异构高性能计算服务,包括弹性GPU/FPGA服务、GPU专属云服务、异构超算平台(KHSP)和KIS-GPU服务(Kingsoft integrated Service),为大规模神经网络的深度学习用户和通用高性能计算用户提供最优质、便捷的云端体验,让用户根据业务需求,灵活创建和使用适合自身的高性能计算集群。

  在弹性GPU/FPGA服务方面,金山云提供了基于EPC的GPU服务器和基于KEC的GPU服务器两种产品形式,同时满足性能与灵活性的需求。此外,利用业界领先的的VPC网络,不仅可以连通用户在金山云上的物理服务器和云服务器,还可以方便连通用户自己在金山云其他区域的服务,实现计算能力的按需调配和灵活扩展。

image.png

                                           金山云弹性GPU/FPGA服务

  在GPU专属云服务方面,金山云通过搭建用户专属GPU服务资源池,让用户根据自己的需求配置不同CPU/GPU/内存和硬盘的云服务器,实现物理资源在使用期间仅运行用户专属业务(即资源隔离),让计算性能得到有效保障。用户可在业务高峰时把部分云服务器迁移到专属云中,或在高峰来临之前向专属云添加更多的GPU计算资源,开启更多的服务实例,待高峰过去后,再将这些节点退出专属云。

  在异构超算平台方面,基于优秀的物理机调度能力和VPC网络,可以快速为用户构建量身定制虚拟超算平台,让用户独享平台的物理计算节点资源,有效满足人工智能对高性能计算力的需求。在技术实现上,利用金山云已经构建起来的256节点集群,抽取GPU、CPU或FPGA的加速资源组成虚拟超算集群,受益于虚拟网络,展现在用户面前的依然是一个完整的超算集群。

  在KIS-GPU方面,KIS作为金山云推出的综合性混合云服务,主要负责高性能计算设备的托管和租赁,实现用户自有设备和公有云服务资源的有序调度。用户除了可以将自有GPU服务器托管到金山云KIS,高效利用已有资产;同时又具备公有云资源使用能力和BGP的服务投送能力,释放计算应用灵活性,解决了不同时期人工智能使用场景中对计算能力的需求。

最近更新
科普

邮件订阅

软件信息化周刊
比特软件信息化周刊提供以数据库、操作系统和管理软件为重点的全面软件信息化产业热点、应用方案推荐、实用技巧分享等。以最新的软件资讯,最新的软件技巧,最新的软件与服务业内动态来为IT用户找到软捷径。
商务办公周刊
比特商务周刊是一个及行业资讯、深度分析、企业导购等为一体的综合性周刊。其中,与中国计量科学研究院合力打造的比特实验室可以为商业用户提供最权威的采购指南。是企业用户不可缺少的智选周刊!
网络周刊
比特网络周刊向企业网管员以及网络技术和产品使用者提供关于网络产业动态、技术热点、组网、建网、网络管理、网络运维等最新技术和实用技巧,帮助网管答疑解惑,成为网管好帮手。
服务器周刊
比特服务器周刊作为比特网的重点频道之一,主要关注x86服务器,RISC架构服务器以及高性能计算机行业的产品及发展动态。通过最独到的编辑观点和业界动态分析,让您第一时间了解服务器行业的趋势。
存储周刊
比特存储周刊长期以来,为读者提供企业存储领域高质量的原创内容,及时、全面的资讯、技术、方案以及案例文章,力求成为业界领先的存储媒体。比特存储周刊始终致力于用户的企业信息化建设、存储业务、数据保护与容灾构建以及数据管理部署等方面服务。
安全周刊
比特安全周刊通过专业的信息安全内容建设,为企业级用户打造最具商业价值的信息沟通平台,并为安全厂商提供多层面、多维度的媒体宣传手段。与其他同类网站信息安全内容相比,比特安全周刊运作模式更加独立,对信息安全界的动态新闻更新更快。
新闻中心热点推荐
新闻中心以独特视角精选一周内最具影响力的行业重大事件或圈内精彩故事,为企业级用户打造重点突出,可读性强,商业价值高的信息共享平台;同时为互联网、IT业界及通信厂商提供一条精准快捷,渗透力强,覆盖面广的媒体传播途径。
云计算周刊
比特云计算周刊关注云计算产业热点技术应用与趋势发展,全方位报道云计算领域最新动态。为用户与企业架设起沟通交流平台。包括IaaS、PaaS、SaaS各种不同的服务类型以及相关的安全与管理内容介绍。
CIO俱乐部周刊
比特CIO俱乐部周刊以大量高端CIO沙龙或专题研讨会以及对明星CIO的深入采访为依托,汇聚中国500强CIO的集体智慧。旨为中国杰出的CIO提供一个良好的互融互通 、促进交流的平台,并持续提供丰富的资讯和服务,探讨信息化建设,推动中国信息化发展引领CIO未来职业发展。
IT专家网
IT专家新闻邮件长期以来,以定向、分众、整合的商业模式,为企业IT专业人士以及IT系统采购决策者提供高质量的原创内容,包括IT新闻、评论、专家答疑、技巧和白皮书。此外,IT专家网还为读者提供包括咨询、社区、论坛、线下会议、读者沙龙等多种服务。
X周刊
X周刊是一份IT人的技术娱乐周刊,给用户实时传递I最新T资讯、IT段子、技术技巧、畅销书籍,同时用户还能参与我们推荐的互动游戏,给广大的IT技术人士忙碌工作之余带来轻松休闲一刻。