游戏电视苹果数码历史美丽
投稿投诉
美丽时装
彩妆资讯
历史明星
乐活安卓
数码常识
驾车健康
苹果问答
网络发型
电视车载
室内电影
游戏科学
音乐整形

榨干GPU,AI存储进入200GIB时代

  AI存储,百亿空间
  IDC预测,全球AI(人工智能)市场支出将在2021年达到850亿美元,并在2025年增至2,000亿美元,五年复合增长率(CAGR)约为24。5。2025年,全球约8的AI相关支出将来自于中国市场,市场规模在全球九个区域中位列第三。
  十四五规划纲要将新一代人工智能作为议题重点提及,加上新基建、数字经济在内的持续利好政策的推动,中国AI市场将稳步发展。根据最新预测,2021年,中国在AI市场的支出规模将达到82亿美元。20212025的五年预测期内,中国市场AI相关支出总量将以22左右的CAGR增长,有望在2025年超过160亿美元。
  人工智能市场的高速发展,也带动了AI存储的发展。根据IDC,从2018年开始,全球AI存储的年复合增长率高达37,到2022年,AI存储的市场规模将达100亿美金。
  也就是说,今年AI存储的市场规模就将进入百亿美金俱乐部了。
  AI存储,IB领跑
  为什么有AI存储这个分类,因为AI场景比较特殊,它和GPU关系密切。由于GPU价格昂贵,AI存储必须足够快,这样才能充分利用GPU的能力,榨干GPU的带宽。
  由计算密集型机器学习(ML)和深度神经网络(DNN)组成的AI工作负载在不同阶段具有不同的输入输出(IO)特征,这要求IO负责人部署互补型存储架构。AI和ML工作负载的独特需求会让IO负责人重新评估其存储选择方法,并采用新的技术和部署方法。
  从上表我们可以看到,AI工作流程一般分5个阶段:采集、数据准备、训练、推理、归档,不同阶段对存储的要求不同。
  ML和DNN工作负载对存储架构有重大影响。由于GPU等更常用的专用处理器(特别是在神经网络的训练阶段)的并行处理能力和绝对密度,从基于磁盘的系统中读取训练数据是最常见的瓶颈之一。IO领导者应该设计他们的网络和存储子系统以减少IO瓶颈,以便他们能够充分利用他们在GPU等专用计算硬件上的投资价值。为了减少GPU空闲时间,使用固态阵列或驱动器,或其他形式的非易失性存储或持久内存来优化预处理流水线变得越来越普遍。由于在训练阶段摄取的数据量很大,最好将这些数据集存储在共享存储中,以便组织可以独立扩展计算和存储环境。集中式存储还有助于进行版本控制,以便用户和应用程序可以在整个组织中处理单个一致的副本。较新的NVMeSSD可以改善与神经网络相关的低带宽和高延迟挑战。
  从AI的负载分析来看,高速的全NVMe闪存的分布式文件系统成为AI存储的最佳形态。
  AI存储的网络接口,毫无疑问必须采用RDMA技术,只有这样才能有效降低系统的时延。RDMA技术原来主要用在Infiniband(IB)网络上,但现在无损以太网也支持。但除了RDMA,IB还具有协议栈简单、处理效率高、管理简单等优点。与以太网的分层拓扑不同,InfiniBand是扁平结构,这意味着每个节点都与所有其他节点直接连接。与TCPIP网络协议相比,IB采用基于信任和流量控制的机制来保证连接的完整性,并且数据包很少丢失。数据传输完毕后,接收端返回一个信号,指示缓冲区空间的可用性。因此,IB协议消除了由于原始数据包丢失而导致的重传延迟,从而提高了协议的性能。
  由于IB的固有优势,目前高端的AI存储,一般优选IB网络,这也可以从历年的全球TOP500超级计算榜单可以看出。
  根据2021年11月的全球TOP500超级计算榜单,InfiniBand连接了全球10大超级计算机中的7台,全球100大计算机中的65台。InfiniBand已成为高性能计算系统的事实标准,被深度学习基础设施广泛采用,并且越来越多地用于超大规模云数据中心。
  InfiniBand提供了许多关键优势。它是一个全传输卸载网络,这意味着所有网络操作都由网络管理,而不是由CPU管理。它是最有效的网络协议,这意味着能够以更少的开销传输更多数据。InfiniBand的延迟也比以太网低得多,最重要的是,它在网络内部集成了处理引擎,可加速深度学习和高性能计算的数据处理。这些是任何计算和数据密集型应用程序的关键技术优势。这就是为什么InfiniBand已成为高性能、科学和产品模拟的公认标准。
  随着GPU的能力越来越强,对带宽要求也愈来愈高。目前IB虽然已经有了400GNDR的产品,但是产品太新,性价比不高,从性价比角度考虑,200GHDRIB是目前高端AI存储的首选。
  200GHDR可以支持目前最高端的应用场景,比如脑映射。而且,现在的AI系统都是多GPU的,更高的速度,就可以支撑更多的GPU。这些因素,使得2022年,AI存储支持200GIB成为一个很大的优势。
  AI存储,国外占优
  许多大型老牌供应商正在针对AI工作负载重新定位其分布式文件系统,同时我们还发现这个领域中涌现出多个新兴供应商。
  国外的一些存储公司,还针对AI推出AI一体机,其中比较有特色的是PureStorage和DDN。
  PureStorage的AI一体机叫AIRI,其早在2018年就发布,刚刚不久前发布了最新一代AIRIS。
  其关键的AI存储采用自研的全闪Scaleout文件系统FlashBladeS,采用自研NVMe盘,存储网络接口目前还是100G的RDMA以太网。
  PureStorage的AI存储FlashBladeS虽然相比上一代,存储介质从TLC转向QLC,性价比上更有优势,但可惜的网络接口依然是100G以太网,而且也不支持Nvidia的GPUDirectStorage(GDS)。PureStorage的首席技术官RobLee说,一项人工智能工作的总工作时间包括搜索源数据集,寻找所需的子集,提取它,然后将它发送到GPU上。搜索和提取过程可能要比数据传输到GPU的时间长得多,而FlashBladeS缩短了这一时间,而GDS仅仅是拥有更快的数据传输时间,不支持GDS对整体时间影响不大。
  但是,作为专做HPC存储的DDN,其推出的AI一体机叫AI,其关键的AI存储基于开源的Lustre文件系统,目前最新的高端型号的AI400X2,也是采用NVMeSSD,但存储网络接口采用了200GHDRInfiniBand,并且支持GDS。
  我们看到,DDN的AI存储优选推荐InfiniBand而不是流行的以太网技术,而且已经开始规模采用200GHDRIB接口。
  国产厂商,迎头赶上
  国产厂商,推出类似PureStorage这样的AIRI通用AI一体机的不多,但推出AI存储的厂商就很多了。
  比如华为,就专门推出了针对HPDA的OceanStorPacific系列。
  其中高端AI场景,就需要采用Pacific最高端的全闪型号Pacific9950了。但从华为官网宣传的规格看,目前Pacific9950虽然同时支持以太网和IB,但是最高速率还是100G。
  反而国内专门做高性能文件系统的初创公司焱融科技,最近发布的全闪分布式文件存储一体机焱融追光F8000X系列,率先支持200GIB双端口,令人眼前一亮。
  焱融追光F8000XAI存储,除了是国内自研存储中第一个支持双端口200GHDRInfiniband接口外,还有其他什么特点呢?
  焱融追光,为AI而生
  从焱融科技的官网介绍看,追光F8000X系列,所有的特性都围绕AI场景而设计,可以说完全是一款为AI而生的专用存储。
  作为AI存储,性能是第一位的。追光F8000X搭载了第三代AMDEPYC计算平台(支持PCIe4。0)和焱融高性能分布式文件存储系统YRCloudFile,采用全NVMeSSD、InfiniBand200G高速RDMA网络,性能表现强劲,可以充分榨干多GPU的带宽。
  软件方面,焱融追光F8000X从客户端到Server端做了全链路的优化(如提供Linux和Windows的高性能并发客户端),不仅能提供高IOPS,还能提供更低的延迟,以及高带宽性能。在实际测试中焱融追光F8000X每节点配置为两颗CPU,32GX8内存,2块200GbpsHDRInfiniBand网卡,存储节点(集群最少三节点起,这里只是为了方便,摊分到单节点看)测试数值如下:
  带宽性能
  IOPS性能
  我们看到,结合InfiniBand强大的网络性能,追光F8000X取得了十分优异的性能测试数据。单个存储节点达到40GBs带宽、200万以上IOPS,80s的时延,同时存储采用分布式架构,性能可以实现线性提升,在6存储节点时性能可达1000万IOPS,210GBs带宽,在高负载情况下能够保持130s以内的延迟。
  除了性能,AI存储也需要讲究成本。从前面的AI负载分析我们可以看到,AI的数据集是非常庞大的,而且需要长期保持。但是,对存储性能要求最高的只是在训练和推理阶段,这两个阶段采用全闪的AI存储是合适的,但是如果数据归档也用全闪,成本就不划算了。而对象存储,是最适合作为归档存储的。焱融追光系列虽然不支持S3访问,不是一个对象存储产品,但是它支持智能分层到第三方对象存储的方式,有效解决了成本的问题。用户可以选择其他厂商的对象存储,或者采用公有云,配合焱融追光AI存储,支撑AI所有阶段对数据的存储和处理要求。
  从AI的流程,我们也看到,训练需要准备大量的数据,数据准备的时间往往大于训练的时间,因此,缩短数据的加载时间,就能够大大缩短整体的时间。焱融追光系列,采用智能数据加载DataLoad技术来解决这个问题。
  DataLoad具体是如何设计的呢?实际上,它的设计和Tiering是非常类似的,主要是场景有所不同。实际上DataLoad的实现几乎是能完整复用Tiering(分层)的实现。
  焱融追光的Tiering没有做物理切片。在不做物理切片的情况下,可以直接把5GB的数据文件关联到YRCloudFile,S3对象和YRCloudFile文件很直观地一一对应起来,这天然满足了DataLoad功能的用户需求和设计需求。而在做物理切片的情况下,一个5GB的对象需要先切成很多小块,然后才能再写回对象存储里。
  用户通过YRCloudFileDataLoad功能,将S3上的数据直接关联为YRCloudFile文件系统中的目录和文件,直接满足用户利用S3上已知数据的计算需求。
  比如用户在S3bucket中已有100万个object,现在要使用YRCloudFileDataLoad的话S3和文件系统的连接。DataLoad会自动扫描S3bucket,根据S3object的路径,在YRCloudFile中创建出对应的目录和文件,然后用户业务就可以像使用本地文件一样,使用这些DataLoad关联下来的S3数据集。
  焱融追光在实现DataLoad时,也做了充分的性能考虑。比如DataLoad在创建对象和文件的关联时,将其分为不同的阶段,比如扫描S3bucket阶段、创建文件阶段、数据拉取阶段等,每个阶段都支持配置不同的策略,比如扫描bucket时,可以通过设置pattern去过滤需要的数据。比如在数据拉取时,默认配置为异步地、按需地拉取。
  另外,用户在使用DataLoad时,除了一开始建立起对象和文件的关联后,用户可能还需要实时感知S3bucket中对象的变化,比如对象的新增和删除等。YRCloudFileDataLoad实现了订阅机制,并适配了阿里云、腾讯云等各种云产商各异的订阅通知机制,对用户提供一致的订阅功能体验。
  最后一点,就是AI存储需要共享存储,而焱融追光软件就是焱融云自研的高性能文件系统YRCloudFile,它不仅支持通用的NFS和SMB访问,而且还有Window和Linux下的私有客户端,给胖客户端提供更好的单客户端性能。还有,现在的AI负载很多已经容器化了,因此CSI的支持也是必须的。焱融追光除了支持CSI标准接口外,还针对容器场景下的运维和监控做了很多增强,让用户使用起来更加方便。
  写在后面
  从上面的分析我们可以看到,AI存储高速增长,今年就达百亿美金规模。国外的AI存储发展较快,很多都联合NVIDIA推出了AI一体机,但后端的AI存储接口目前也没有超过200GIB。国内厂商虽然在AI一体机有所落后,但在AI存储这块却跟得非常紧,比如焱融科技推出的追光专用AI存储,围绕AI的整个流程进行了设计和优化,不仅在性能上能够充分榨干多个GPU的带宽,而且功能上可以还可以和第三方对象存储配合,兼顾成本和性能,完美解决AI不同阶段对存储的需求。
  END

能不能来广东?詹姆斯被曝想要父子联手,无奈布朗尼只有CBA实202122赛季CBA常规赛第三阶段的比赛还没有正式开打,关于卫冕冠军广东男篮本赛季的冲冠之路已经非常困难。按照目前的积分榜排名来看,广东队本赛季常规赛结束的时候极有可能会锁定……实话实说电动车就不是为跑高速设计的,1000km续航是畸形产马斯克早在很久以前就说过,特斯拉拥有生产600英里以上续航的能力,但他却迟迟没有行动。不设计过长续航的电动车,是企业理性思考的第一步,长续航车辆的确能够在一次性充满电之后……摊牌了!胡明轩一直受重用另有隐情,两点原因,杜锋这回正面回应在帮助中国男篮拿到世界杯资格之后,杜锋指导功成身退,卸任国家队的主教练。对于杜锋指导的下课,网络上基本形成了两个观点,一种观点表达出可惜之情,另一种观点就认为杜锋的下课有咎由自……2025年广东生态旅游年接待游客量将达3。3亿人次珠三角广州帽峰山的游客人数逆势飘红;粤西高州荔枝古树群年接待游客超200万人次;粤北韶关银杏王成游人眼中的世外桃源;粤东蕉岭的毛竹产业吸引市民到乡镇吸氧近日,记者从广东省林业局……世界大赛暴露李盈莹十大技术缺点第十,一传稳定性尚待提高。很多盈吹们说李盈莹接了较多一传,而且到位率还比较高,他们就认为李盈莹的一传能力很强。其实这是错误的,李盈莹被追发时,站着等球到位率还可以,但需要……18省份去年出生人口全部下降,其中11省份降幅超一成2022年各地的出生人口如何?根据第一财经记者统计,目前,已经有18个省份公布了2022年的出生人口数据,从数据来看,这些省份的出生人口数量和出生率均出现下降。3月……大草直子的穿搭总给人带来自信,50个子不高,基础单品穿出优雅你是喜欢夸张的欧美路线,还是比较内敛优雅的日系路线。后者更适合我们亚洲人,因为从身材和容貌上我们是比较相似的。很多日本模特都被视为穿衣的典范,其中五十多岁的大草直子的日常造型充……30岁,独立于青春以外的美,3点参考一下30岁的你,会焦虑吗?会有压力吗?回答当然是肯定的,但是这个压力我认为更多的是来自步入30岁之前的成长压力,是对未知年龄的恐惧,但是存在的压力和焦虑是一种状态而非结果。享受30……星爷招聘Web3人才,Web3又是什么呢?下面为大家详细介绍Web3营销爆发前夜,品牌Web3营销指南Web3。0一词包含多层含义,用来概括互联网发展过程中某一阶段可能出现的各种不同的方向和特征。Web3。0充满了争议和分歧,它到……连升5级!中国女篮实力榜高居世界第2首战VS韩国郑薇预定开门中国女篮目前已经成为中国篮球在世界范围内扬眉吐气的根本,和男篮相比,中国女篮脚踏实地,用一场场胜利巩固了在世界范围内的排名。上一次奥运会之后,中国女篮综合排名位于世界第七位,而……艾瑞发布2022年第三方支付行业研究报告跨境B端市场机会丰富11月17日,第三方咨询机构艾瑞发布《2022年第三方支付行业研究报告》(下称《报告》),从行业现状、发展趋势、破局策略等方面纵览和分析了第三方支付行业全景图。支付成产业……中国科学家首次在月球上发现新矿物并命名为嫦娥石9月9日,中国传统节日中秋佳节前夕,国家航天局、国家原子能机构联合在京发布嫦娥五号最新科学成果:中国科学家首次在月球上发现的新矿物,被命名为嫦娥石。这是我国在空间科学领域取得的……
节俭朴实杨超越一年为公司挣7000万,却仍不肯放过一粒米饭1、即便一年能为公司挣7000万,杨超越也仍没改掉她贫穷的习性。2020年她参加《神奇公司在哪里》时跟薛之谦比赛吃饭,期间一个小小的细节让人动容。虽然身处紧张……航天彩虹研究报告两翼一体,军用无人机领军企业乘风启航(报告出品方作者:东北证券,王凤华、王璐)1。航天彩虹:军用无人机领先企业,无人机新材料两翼布局1。1。公司是国内无人机龙头,高科技薄膜先驱航天彩虹是国内无人机和高……外媒ASML心里也没底了文C君科讯排版C君科讯头条号原创文章,禁止抄袭,违者必究外媒:ASML心里也没底了造芯的浪潮是从2019年之后刮起来的,因为芯片规则的改变,让我们深刻认识到了……营养安全的淳璀有机奶粉获年糕妈妈倾力推荐当今社会的宝爸宝妈对于奶粉的选择越来越挑剔,对于奶粉的品质也要求的越来越严格,如何抓住孩子成长的黄金期,把握成长的每一步营养需求,成为了父母极为关注的重点。好环境才会有好奶源,……新生儿的这几样物品最好不要用新生儿的这几样物品,最好不要用。李时望,副主任医师。第一个:枕头。新生儿的颈椎是直的,有明显的曲度。1岁以内的宝宝,不能拥有高度的枕头。第二个:感温勺。这个并没有什……4套秋日针织合集将基础款搭出高级感步入秋冬,各类针织单品不可或缺,用一些百搭的基础款给大家整理了4套不同风格的穿搭,希望能给大家提供一些搭配灵感。Look1:鄂尔多斯1980上手就能感受到100的山羊绒……大雪后冬至前,是一年中补虚的最佳时机!饮食运动精神调养都别忽大雪后冬至前,适合补虚现代社会,人们生活节奏快,工作压力大,常有人会出现疲倦乏力、气短、失眠多梦、食欲不振、畏寒怕冷等症状,中医认为这都属于虚证。而大雪节气后到冬至节气前……竹荪能减重?一定要吃竹荪的4个理由,再教你一招去除膻臊味我是饮食健康管理师小辉。昨天家里煲了一锅竹荪椰子鸡汤。竹荪口感软嫩滑爽,味道鲜美,唇齿留香。所以今天和大家分享一下竹荪的功效与作用,不过竹荪有一股膻臊味,必须添加一样东西浸泡才……国庆长假去哪儿?这份成都河畔夜游指南请收好封面新闻记者柴枫桔水生态新夜景公园城市会碰撞出怎样的火花?近日,成都江安河畔,络绎不绝市民和游客前来夜游、赏景、休闲,在这里,水生态价值换新赋能。国庆节,记者打卡成……太原火工区厂矿搬迁改造,加速产业转型布局,老城北迎来百年蝶变即将走进崭新的2023年,太原城市建设在哪里变化最大?将成为新兴的投资置业沃土?在2022年12月中旬,山西省召开的经济工作会议,给11座地级市建设重点定调,其中明确太原市的两……辽宁大连海港口岸对俄贸易实现大幅增长大连出入境边防检查站保障船舶快速通关。桂子云摄中新网大连3月24日电(记者杨毅)俄罗斯籍波特瓦号货轮23日靠泊大连辽渔深水卸货码头卸载货物。这是大连湾辽渔深水码头今年靠泊……人民日报每日金句摘抄1宁走十步远,不走一步险。2青春,是一团燃烧的火,是一段奔涌的河,是最美的奋斗季节,是璀璨的人生诗篇。美好是青春的别名,奋斗是青春的底色,追逐梦想是青春的精神。3社……
友情链接:易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网