榨干GPU,AI存储进入200GIB时代
AI存储,百亿空间
IDC预测,全球AI(人工智能)市场支出将在2021年达到850亿美元,并在2025年增至2,000亿美元,五年复合增长率(CAGR)约为24。5。2025年,全球约8的AI相关支出将来自于中国市场,市场规模在全球九个区域中位列第三。
十四五规划纲要将新一代人工智能作为议题重点提及,加上新基建、数字经济在内的持续利好政策的推动,中国AI市场将稳步发展。根据最新预测,2021年,中国在AI市场的支出规模将达到82亿美元。20212025的五年预测期内,中国市场AI相关支出总量将以22左右的CAGR增长,有望在2025年超过160亿美元。
人工智能市场的高速发展,也带动了AI存储的发展。根据IDC,从2018年开始,全球AI存储的年复合增长率高达37,到2022年,AI存储的市场规模将达100亿美金。
也就是说,今年AI存储的市场规模就将进入百亿美金俱乐部了。
AI存储,IB领跑
为什么有AI存储这个分类,因为AI场景比较特殊,它和GPU关系密切。由于GPU价格昂贵,AI存储必须足够快,这样才能充分利用GPU的能力,榨干GPU的带宽。
由计算密集型机器学习(ML)和深度神经网络(DNN)组成的AI工作负载在不同阶段具有不同的输入输出(IO)特征,这要求IO负责人部署互补型存储架构。AI和ML工作负载的独特需求会让IO负责人重新评估其存储选择方法,并采用新的技术和部署方法。
从上表我们可以看到,AI工作流程一般分5个阶段:采集、数据准备、训练、推理、归档,不同阶段对存储的要求不同。
ML和DNN工作负载对存储架构有重大影响。由于GPU等更常用的专用处理器(特别是在神经网络的训练阶段)的并行处理能力和绝对密度,从基于磁盘的系统中读取训练数据是最常见的瓶颈之一。IO领导者应该设计他们的网络和存储子系统以减少IO瓶颈,以便他们能够充分利用他们在GPU等专用计算硬件上的投资价值。为了减少GPU空闲时间,使用固态阵列或驱动器,或其他形式的非易失性存储或持久内存来优化预处理流水线变得越来越普遍。由于在训练阶段摄取的数据量很大,最好将这些数据集存储在共享存储中,以便组织可以独立扩展计算和存储环境。集中式存储还有助于进行版本控制,以便用户和应用程序可以在整个组织中处理单个一致的副本。较新的NVMeSSD可以改善与神经网络相关的低带宽和高延迟挑战。
从AI的负载分析来看,高速的全NVMe闪存的分布式文件系统成为AI存储的最佳形态。
AI存储的网络接口,毫无疑问必须采用RDMA技术,只有这样才能有效降低系统的时延。RDMA技术原来主要用在Infiniband(IB)网络上,但现在无损以太网也支持。但除了RDMA,IB还具有协议栈简单、处理效率高、管理简单等优点。与以太网的分层拓扑不同,InfiniBand是扁平结构,这意味着每个节点都与所有其他节点直接连接。与TCPIP网络协议相比,IB采用基于信任和流量控制的机制来保证连接的完整性,并且数据包很少丢失。数据传输完毕后,接收端返回一个信号,指示缓冲区空间的可用性。因此,IB协议消除了由于原始数据包丢失而导致的重传延迟,从而提高了协议的性能。
由于IB的固有优势,目前高端的AI存储,一般优选IB网络,这也可以从历年的全球TOP500超级计算榜单可以看出。
根据2021年11月的全球TOP500超级计算榜单,InfiniBand连接了全球10大超级计算机中的7台,全球100大计算机中的65台。InfiniBand已成为高性能计算系统的事实标准,被深度学习基础设施广泛采用,并且越来越多地用于超大规模云数据中心。
InfiniBand提供了许多关键优势。它是一个全传输卸载网络,这意味着所有网络操作都由网络管理,而不是由CPU管理。它是最有效的网络协议,这意味着能够以更少的开销传输更多数据。InfiniBand的延迟也比以太网低得多,最重要的是,它在网络内部集成了处理引擎,可加速深度学习和高性能计算的数据处理。这些是任何计算和数据密集型应用程序的关键技术优势。这就是为什么InfiniBand已成为高性能、科学和产品模拟的公认标准。
随着GPU的能力越来越强,对带宽要求也愈来愈高。目前IB虽然已经有了400GNDR的产品,但是产品太新,性价比不高,从性价比角度考虑,200GHDRIB是目前高端AI存储的首选。
200GHDR可以支持目前最高端的应用场景,比如脑映射。而且,现在的AI系统都是多GPU的,更高的速度,就可以支撑更多的GPU。这些因素,使得2022年,AI存储支持200GIB成为一个很大的优势。
AI存储,国外占优
许多大型老牌供应商正在针对AI工作负载重新定位其分布式文件系统,同时我们还发现这个领域中涌现出多个新兴供应商。
国外的一些存储公司,还针对AI推出AI一体机,其中比较有特色的是PureStorage和DDN。
PureStorage的AI一体机叫AIRI,其早在2018年就发布,刚刚不久前发布了最新一代AIRIS。
其关键的AI存储采用自研的全闪Scaleout文件系统FlashBladeS,采用自研NVMe盘,存储网络接口目前还是100G的RDMA以太网。
PureStorage的AI存储FlashBladeS虽然相比上一代,存储介质从TLC转向QLC,性价比上更有优势,但可惜的网络接口依然是100G以太网,而且也不支持Nvidia的GPUDirectStorage(GDS)。PureStorage的首席技术官RobLee说,一项人工智能工作的总工作时间包括搜索源数据集,寻找所需的子集,提取它,然后将它发送到GPU上。搜索和提取过程可能要比数据传输到GPU的时间长得多,而FlashBladeS缩短了这一时间,而GDS仅仅是拥有更快的数据传输时间,不支持GDS对整体时间影响不大。
但是,作为专做HPC存储的DDN,其推出的AI一体机叫AI,其关键的AI存储基于开源的Lustre文件系统,目前最新的高端型号的AI400X2,也是采用NVMeSSD,但存储网络接口采用了200GHDRInfiniBand,并且支持GDS。
我们看到,DDN的AI存储优选推荐InfiniBand而不是流行的以太网技术,而且已经开始规模采用200GHDRIB接口。
国产厂商,迎头赶上
国产厂商,推出类似PureStorage这样的AIRI通用AI一体机的不多,但推出AI存储的厂商就很多了。
比如华为,就专门推出了针对HPDA的OceanStorPacific系列。
其中高端AI场景,就需要采用Pacific最高端的全闪型号Pacific9950了。但从华为官网宣传的规格看,目前Pacific9950虽然同时支持以太网和IB,但是最高速率还是100G。
反而国内专门做高性能文件系统的初创公司焱融科技,最近发布的全闪分布式文件存储一体机焱融追光F8000X系列,率先支持200GIB双端口,令人眼前一亮。
焱融追光F8000XAI存储,除了是国内自研存储中第一个支持双端口200GHDRInfiniband接口外,还有其他什么特点呢?
焱融追光,为AI而生
从焱融科技的官网介绍看,追光F8000X系列,所有的特性都围绕AI场景而设计,可以说完全是一款为AI而生的专用存储。
作为AI存储,性能是第一位的。追光F8000X搭载了第三代AMDEPYC计算平台(支持PCIe4。0)和焱融高性能分布式文件存储系统YRCloudFile,采用全NVMeSSD、InfiniBand200G高速RDMA网络,性能表现强劲,可以充分榨干多GPU的带宽。
软件方面,焱融追光F8000X从客户端到Server端做了全链路的优化(如提供Linux和Windows的高性能并发客户端),不仅能提供高IOPS,还能提供更低的延迟,以及高带宽性能。在实际测试中焱融追光F8000X每节点配置为两颗CPU,32GX8内存,2块200GbpsHDRInfiniBand网卡,存储节点(集群最少三节点起,这里只是为了方便,摊分到单节点看)测试数值如下:
带宽性能
IOPS性能
我们看到,结合InfiniBand强大的网络性能,追光F8000X取得了十分优异的性能测试数据。单个存储节点达到40GBs带宽、200万以上IOPS,80s的时延,同时存储采用分布式架构,性能可以实现线性提升,在6存储节点时性能可达1000万IOPS,210GBs带宽,在高负载情况下能够保持130s以内的延迟。
除了性能,AI存储也需要讲究成本。从前面的AI负载分析我们可以看到,AI的数据集是非常庞大的,而且需要长期保持。但是,对存储性能要求最高的只是在训练和推理阶段,这两个阶段采用全闪的AI存储是合适的,但是如果数据归档也用全闪,成本就不划算了。而对象存储,是最适合作为归档存储的。焱融追光系列虽然不支持S3访问,不是一个对象存储产品,但是它支持智能分层到第三方对象存储的方式,有效解决了成本的问题。用户可以选择其他厂商的对象存储,或者采用公有云,配合焱融追光AI存储,支撑AI所有阶段对数据的存储和处理要求。
从AI的流程,我们也看到,训练需要准备大量的数据,数据准备的时间往往大于训练的时间,因此,缩短数据的加载时间,就能够大大缩短整体的时间。焱融追光系列,采用智能数据加载DataLoad技术来解决这个问题。
DataLoad具体是如何设计的呢?实际上,它的设计和Tiering是非常类似的,主要是场景有所不同。实际上DataLoad的实现几乎是能完整复用Tiering(分层)的实现。
焱融追光的Tiering没有做物理切片。在不做物理切片的情况下,可以直接把5GB的数据文件关联到YRCloudFile,S3对象和YRCloudFile文件很直观地一一对应起来,这天然满足了DataLoad功能的用户需求和设计需求。而在做物理切片的情况下,一个5GB的对象需要先切成很多小块,然后才能再写回对象存储里。
用户通过YRCloudFileDataLoad功能,将S3上的数据直接关联为YRCloudFile文件系统中的目录和文件,直接满足用户利用S3上已知数据的计算需求。
比如用户在S3bucket中已有100万个object,现在要使用YRCloudFileDataLoad的话S3和文件系统的连接。DataLoad会自动扫描S3bucket,根据S3object的路径,在YRCloudFile中创建出对应的目录和文件,然后用户业务就可以像使用本地文件一样,使用这些DataLoad关联下来的S3数据集。
焱融追光在实现DataLoad时,也做了充分的性能考虑。比如DataLoad在创建对象和文件的关联时,将其分为不同的阶段,比如扫描S3bucket阶段、创建文件阶段、数据拉取阶段等,每个阶段都支持配置不同的策略,比如扫描bucket时,可以通过设置pattern去过滤需要的数据。比如在数据拉取时,默认配置为异步地、按需地拉取。
另外,用户在使用DataLoad时,除了一开始建立起对象和文件的关联后,用户可能还需要实时感知S3bucket中对象的变化,比如对象的新增和删除等。YRCloudFileDataLoad实现了订阅机制,并适配了阿里云、腾讯云等各种云产商各异的订阅通知机制,对用户提供一致的订阅功能体验。
最后一点,就是AI存储需要共享存储,而焱融追光软件就是焱融云自研的高性能文件系统YRCloudFile,它不仅支持通用的NFS和SMB访问,而且还有Window和Linux下的私有客户端,给胖客户端提供更好的单客户端性能。还有,现在的AI负载很多已经容器化了,因此CSI的支持也是必须的。焱融追光除了支持CSI标准接口外,还针对容器场景下的运维和监控做了很多增强,让用户使用起来更加方便。
写在后面
从上面的分析我们可以看到,AI存储高速增长,今年就达百亿美金规模。国外的AI存储发展较快,很多都联合NVIDIA推出了AI一体机,但后端的AI存储接口目前也没有超过200GIB。国内厂商虽然在AI一体机有所落后,但在AI存储这块却跟得非常紧,比如焱融科技推出的追光专用AI存储,围绕AI的整个流程进行了设计和优化,不仅在性能上能够充分榨干多个GPU的带宽,而且功能上可以还可以和第三方对象存储配合,兼顾成本和性能,完美解决AI不同阶段对存储的需求。
END
节俭朴实杨超越一年为公司挣7000万,却仍不肯放过一粒米饭1、即便一年能为公司挣7000万,杨超越也仍没改掉她贫穷的习性。2020年她参加《神奇公司在哪里》时跟薛之谦比赛吃饭,期间一个小小的细节让人动容。虽然身处紧张……
航天彩虹研究报告两翼一体,军用无人机领军企业乘风启航(报告出品方作者:东北证券,王凤华、王璐)1。航天彩虹:军用无人机领先企业,无人机新材料两翼布局1。1。公司是国内无人机龙头,高科技薄膜先驱航天彩虹是国内无人机和高……
外媒ASML心里也没底了文C君科讯排版C君科讯头条号原创文章,禁止抄袭,违者必究外媒:ASML心里也没底了造芯的浪潮是从2019年之后刮起来的,因为芯片规则的改变,让我们深刻认识到了……
营养安全的淳璀有机奶粉获年糕妈妈倾力推荐当今社会的宝爸宝妈对于奶粉的选择越来越挑剔,对于奶粉的品质也要求的越来越严格,如何抓住孩子成长的黄金期,把握成长的每一步营养需求,成为了父母极为关注的重点。好环境才会有好奶源,……
新生儿的这几样物品最好不要用新生儿的这几样物品,最好不要用。李时望,副主任医师。第一个:枕头。新生儿的颈椎是直的,有明显的曲度。1岁以内的宝宝,不能拥有高度的枕头。第二个:感温勺。这个并没有什……
4套秋日针织合集将基础款搭出高级感步入秋冬,各类针织单品不可或缺,用一些百搭的基础款给大家整理了4套不同风格的穿搭,希望能给大家提供一些搭配灵感。Look1:鄂尔多斯1980上手就能感受到100的山羊绒……
大雪后冬至前,是一年中补虚的最佳时机!饮食运动精神调养都别忽大雪后冬至前,适合补虚现代社会,人们生活节奏快,工作压力大,常有人会出现疲倦乏力、气短、失眠多梦、食欲不振、畏寒怕冷等症状,中医认为这都属于虚证。而大雪节气后到冬至节气前……
竹荪能减重?一定要吃竹荪的4个理由,再教你一招去除膻臊味我是饮食健康管理师小辉。昨天家里煲了一锅竹荪椰子鸡汤。竹荪口感软嫩滑爽,味道鲜美,唇齿留香。所以今天和大家分享一下竹荪的功效与作用,不过竹荪有一股膻臊味,必须添加一样东西浸泡才……
国庆长假去哪儿?这份成都河畔夜游指南请收好封面新闻记者柴枫桔水生态新夜景公园城市会碰撞出怎样的火花?近日,成都江安河畔,络绎不绝市民和游客前来夜游、赏景、休闲,在这里,水生态价值换新赋能。国庆节,记者打卡成……
太原火工区厂矿搬迁改造,加速产业转型布局,老城北迎来百年蝶变即将走进崭新的2023年,太原城市建设在哪里变化最大?将成为新兴的投资置业沃土?在2022年12月中旬,山西省召开的经济工作会议,给11座地级市建设重点定调,其中明确太原市的两……
辽宁大连海港口岸对俄贸易实现大幅增长大连出入境边防检查站保障船舶快速通关。桂子云摄中新网大连3月24日电(记者杨毅)俄罗斯籍波特瓦号货轮23日靠泊大连辽渔深水卸货码头卸载货物。这是大连湾辽渔深水码头今年靠泊……
人民日报每日金句摘抄1宁走十步远,不走一步险。2青春,是一团燃烧的火,是一段奔涌的河,是最美的奋斗季节,是璀璨的人生诗篇。美好是青春的别名,奋斗是青春的底色,追逐梦想是青春的精神。3社……