神秘的COPAGPU,NVIDIA下一代GPU架构昭然若揭
GPU发展日新月异,不仅和电脑普通用户密切相关,而且现在俨然已经成为全球驱动计算性能的重要产品,NVIDIA则是这个行业当下的佼佼者,在独立GPU份额方面是处于第二位的AMD的5倍。
如此强劲的竞争态势,在高收益高回报的同时,业界也是虎视眈眈,AMD和Intel都透过各种方式向外界透露了它们下一代GPU的部分特性。例如AMD方面是引入辅片(chiplet)技术,将GPU的部分功能拆开,然后以不同的最佳化制程生产并最终放到同一枚GPU芯片上。而Intel则简单暴力许多,以重新打造的Xe架构为基础,衍生除了XeHPC版高性能GPU,提供最多4片GPU裸芯集成到同一枚芯片上。
NVIDIA其实很早就有多芯片方案,不知道大家还是否记得NVIDIA多年前曾经提起的梯队项目:
NVIDIA梯队项目
不过梯队或者说Echelon其实只是NVIDIA公布过的面向E级超算的解决方案之一,台底下显然还有我们未曾了解的方案,例如今年发布的Grace处理器,它虽然只是一个纯CPU方案,但是内部集成了强大的一致性互连能力,可以和多枚GPU实现非常夸张的高速互连,彻底解决了CPU和GPU之间的数据交换效率。
但是故事并未结束,根据论文网站arxiv上的一篇NVIDIA发表的论文《GPUDomainSpecializationviaComposableOnPackageArchitecture》,该公司手头还有一个名为COPAGPU的项目,这个项目的特别之处在于实现了高度模块化的GPU组合设计:
组合灵活的COPAGPU模块化设计
COPAGPU是可实现灵活组合的多模块化GPU方案,能针对不同的需求实现围绕GPU的不同的功能模块组合。
例如上图中,左侧是基本的GPU设计,右上是集成HBM内存的方案,右下则是集成大容量高速缓存的方案,其中后者有点类似于AMD的InfinityCache。
按照NVIDIA这篇论文的介绍,透过COPAGPU,可以对基础GPU实现强化深度学习能力,此时可以达到4倍的内存带宽、32倍的片上封装缓存、2。3倍的内存带宽,而且可以支持规模缩减的高性能计算设计。
和传统的GPU设计相比,深度学习优化的COPAGPU可以做到16倍的缓存容量、1。6倍的内存带宽,每个GPU的训练和推理性能分别提升了31和35,在横向训练的应用场景里,GPU的数量可以籍此减少50。
按照目前的论文来看,COPAGPU的最大亮点是高速缓存架构的多样性设计。
论文中提到了一个代号GPUN的NVIDIA前瞻GPU设计,该设计提供了24TFLOPSFP32的通用计算性能,是目前A100的1。2倍,但是其FP16性能已然提升到了779TFLOPS,是A100的2。5倍,L2Cache达到了60MiB,内存带宽更是跃升至2。7TBs的水平(是搭配HBM2内存的A100的1。72倍)。
考虑到单精度性能变化不大,我相信GPUN只是一个研究用的设计,在论文撰写的时候以FPGA的方式运行,但是假以时日,它的某些特性很可能会应用到NVIDIA的下一代GPU上,结合COPAGPU的设计,相信NVIDAI在下一代竞争中不会处于落后的状态。
iPhone13系列配色规格曝光大疆Mavic3渲染图泄露iPhone13系列多款配色及存储规格曝光9月10日,教师节,祝天下所有的老师节日快乐,我是龙二Pro,来看今天的科技V报,距离iPhone13系列的发布仅剩下几天的时间……
阿里事件会反转?今天看了好多文章大多说阿里女员工事件会反转,真特么恶心,看来阿里的公关能力不是一般的强大。在警方没有公布之前,就大量的做舆论引导其心可诛!亚朵为什么会积极的跳出来发这个声……
三四线城市遍布机器人,中国智造机器人大量上岗曾经,机器人在科幻电影里叱咤风云。现如今,随着科技的快速发展、国家政策的推动以及AI相关技术的不断突破,机器人也走出荧屏,进入人们的生活。种类繁多的机器人已经成为人们生产生活的……
鸿蒙手表WATCH3来了!时隔四年华为重启旗舰手表系列5月7日早间,华为官方终端微博发文称,腕上智慧,一表万象,正式宣布华为WATCH3旗舰归来。这款新旗舰也将会在6月2号的发布会上与大家见面。距华为上一款WATCH数……
告别了!高速ETC挪车卡,支付宝向车主扔出强势新技能了!随着科技的不断发展,现在对于车主在用车生活上可是越来越便捷了,高速收费站从人工现金支付到手机支付,如今实现了车牌付的功能,大大提高了通行效率。在挪车上也有了全新的改变,不再怕信……
小红书女性虚荣感乐园还是潮流风向标?作者胜男在跨境电商领域久战不下后,2019年,小红书开始彻底、全面地审视盘活自身的种草属性,单一化的电商模式遭到抛弃。一系列的新措施被推出,1月,小红书上线品牌合作……
如何判定新买的笔记本是否是全新机器新买的笔记本也叫新机,那么什么叫全新机器呢?那就是自己买的笔记本,是没有开过机的,记住是没有开过机的。笔记本出厂前,一般是会将电池置于运输模式,也就是我们常说的上锁。目的……
华为手机能超越苹果手机吗?坚信华为手机一定会超越苹果手机,只是时间有长短,但不是未来,未来有点太遥远。完全在于华为自己的修为!华为在中国网络上早已宇宙第一,银河系早已被海军踩在脚下没所……
MicroLED真的会取代LCD和OLED吗?业内根据LED芯片尺寸的大小,来定义不同的LED技术。比如,当LED芯片尺寸小于150m时,被称为miniLED;而当LED芯片尺寸在50m以下时,被称作microLED。伴随……
集聚创新发展要素,答好制造业转型必选题我国制造业规模庞大、体系健全,市场空间巨大。在数字技术加速赋能的大趋势下,将数字经济融于制造业的发展,加快制造业与数字经济深度融合,驱动制造业数字化转型,对于推动实现我国经济高……
光伏HJT技术或已进入低成本商业化量产确定性高的右侧作为最受欢迎的下一代光伏技术之一,HJT(异质结)技术具有许多其他技术无法比拟的优势。在日前召开的2021HJT异质结商业化量产高峰论坛上,不少业内人士表达了对异质结技术的看好……
英特尔600系列芯片组阵容泄露,包括HEDT平台的X699传闻英特尔计划于2021年10月或11月(大概在10月25日到11月19日之间)发布第12代酷睿系列处理器,随着发布日期的逐渐逼近,有越来越多的消息传出。此前有报道指出,英特尔……