华体会体育

您现在的位置是:首页 > 新闻动态 > 华体会体育_存储与GPU性能皆已成倍增长,IO表现为何迟迟不见好转?

华体会体育_存储与GPU性能皆已成倍增长,IO表现为何迟迟不见好转?

文章来源:华体会体育  作者:华体会体育  发布日期:2021-07-29  浏览次数:440  【打印】  【关闭】   【返回
存储与GPU机能皆已成倍增加,IO表示为什么迟迟不见好转?陪伴着HPC、主动驾驶深度进修VR/AR需求的不竭增添,IO机能也在慢慢凸显瓶颈,特别是GPU与存储之间的读写。处置器速度已从KHz进化至了GHz,VRAM从KB进化至了GB,IO速度也从KB/s进化至了GB/s,但是GB/s的年夜幅度改良从直不雅角度来看仍然像是MB/s。好比在有线毗连的VR利用中,图形需要颠末电脑进行处置,再经有线传输显示在VR屏幕上,这就激发了高延迟和长读取时候等问题。这不由让人最先联想,在CPU、GPU和存储都已改革换代的环境下,我们是不是真正有用地利用了硬件机能?为此微软和英伟达都提出了直接存储的概念来改良IO的近况。微软:Windows上的DirectStorage微软在不久前的Windows 11发布会上重点提到了DirectStorage手艺,这是一个最初为主机设计的DirectX API,现在微软也将把这一手艺带到PC上。在当前NVMe SSD和PCIe手艺的演进下,存储带宽远超旧式的硬盘存储手艺,曩昔10MB每秒的速度已到达数GB每秒。但PC上的图形工作量也在慢慢进化,数据量的增添对读取提出了更高的要求。曩昔年夜量数据的读取只需要少许的IO要求,但现在的图形衬着会将材质等资本分成小块,只有在场景提出要求时载入所需的部门,如斯一来固然提高了效力,却引入了更多IO要求。当前的GPU资本读取流程 / 微软而今朝的存储API并没有对年夜量IO要求作出优化,是以拖累了NVMe,使得读写瓶颈愈发现显。即使采取高真个PC硬件,也没法饱和操纵存储带宽优势。除此以外,这些数据常常需要颠末紧缩传输下一个环节,传入内存后,还要CPU进行一部门解压工作,最后再传入GPU显存里,如许一来每一个节点都存在效力损掉。而DirectStorage采取了全新的路径,从存储读取的数据传给内存后,直接传给GPU显存。而GPU对这些数据的解压速度远快在CPU,所以极年夜地优化了IO机能。英伟达:RTX IO和Magnum IO GPUDirect Storage英伟达在RTX 30系列显卡上引入了RTX IO,面向消费市场,晋升游戏场景下的读取速度。英伟达称RTX IO将与微软的DirectStorage连系,与传统硬盘下的存储API比拟,可将IO机能提高百倍。曩昔需要数十个CPU内核的工作全数交由RTX GPU来处置。值得一提的是,英伟达的RTX IO固然也用到了微软的DirectStorage,但该手艺并未将数据传输到内存,而是直接由SSD转向GPU。微软一位图形开辟者在GSL 2021年夜会上暗示,将来DirectStorage的方针也是绕过系统内存。GDS手艺 / 英伟达除消费市场外,英伟达在HPC市场也推出了对应的直接存储手艺,Magnum IO GPUDirect Storage(GDS)。GDS手艺一样是一个绕过CPU的手艺,与消费级GPU分歧,HPC场景下常常要用到多块GPU,如斯一来受IO延迟和CPU的影响更年夜。GDS在当地存储与GPU显存之间成立直接的数据通道,消弭了CPU引入的延迟和读写瓶颈。GDS与CPU传输至GPU读取机能对照 / 英伟达在应用GDS后,带宽晋升到达1.5倍,与传统CPU回弹缓冲的数据路径比拟,CPU操纵率也有2.8倍的晋升。今朝英伟达已将这一手艺插手到其HGX AI超算中,DDN、VAST和WEKA三家公司已最先了相干产物的量产,而IBM、美光等五家厂商也在积极引入这一手艺。三星、铠侠、西数和戴尔等厂商也最先了GDS的初期集成与认证打算。小结直接存储手艺进一步放年夜了GPU厂商与存储厂商的优势,今朝HPC市场前景庞大,英伟达在相干营业上的盈利已让其看到了商机。不但是GPU,英伟达采取Arm架构的Grace CPU一样引入了NVLink如许的数据传输改良方案。在如许的机能改良下,即使存储方案分歧,英伟达的GPU也极可能成为HPC利用的首选。
Copyright © 2020 Shanghai Lineprinting Materials Co., ltd. All rights reserved .
Tel: (+86)21-57760077 Address:No.945,Huifu road, Waigang Town, Jiading District, Shanghai