华为与X86芯片商的业务交集,主要发生在桌面级和服务器领域。 虽然华为有自己的鲲鹏920芯片,现阶段也可以规模量产7nm鲲鹏芯片的服务器和台式机产品,但考虑到华为目前暂时失去了先进工艺的晶圆代工能力,因此除开鲲鹏库存,华为服务器和桌面级消费业务,亟需依赖英特尔、AMD的CPU芯片。 在桌面市场,华为笔记本2020年销量估计在五六百万台左右,服务器年销量在百万台的规模。英特尔和AMD成为最先向华为亮绿灯的美系供应商,是因为这部分业务,与华为其他业务相比,体量不大。华为与联想、浪潮一样,接受英特尔、AMD服务器和桌面级的芯片,这其中,美商其实有更大的利益输出。 所以,英特尔断供更多是那些末路之人,秀存在的手段,能够执行到什么层次,出现什么结果还不好说。话说前几天,华为基于英特尔第11代CPU的2021版新款笔记本,已经发布了。 但是,服务器和桌面级核心领域,我们必须要有自己的一席之地,这是未来科技战略:智能计算的基础。尤其是疫情仍在持续,凸显手机销量下降趋势的同时,反逼出智能计算的发展如火如荼。尤其在云服务领域,已经将数据存储和处理从手机和笔记本电脑等边缘设备转移到数据中心。 有一个数据有力地说明了服务器芯片的重要性:台积电在2020年上半年业务增长迅猛,其生产的芯片的销售量几乎都在下降,但除了一个领域,居然增长了12,那就是高端服务器和电脑芯片。什么是CPU? CPU是电子设备上的核心单元,其工作就是运行操作系统和各种应用,处理数据并输出。CPU发展到现在,已经开始出现多核心。比如华为最新的麒麟9000就包含一个大核、三个中核、四个小核。在服务器领域,甚至可以搭载多个CPU,而每个CPU拥有多个核心。 要设计制造一个CPU,芯片设计公司首先要决定的是CPU的核心架构,从而要选择工作指令集ISA,指令集为处理器提供指令,它是连接软件和硬件的纽带。不同的ISA设计,带来的是上层应用不可以兼容运行,除非有专门的仿真环境作为桥梁。但仿真带来的是性耗的损失。 ISA有两种基本类型:速度更快的CISC(复杂指令集)架构和更省电的RISC(精简指令集)架构。这意味着CISC可以在一条指令中完成多件事情,而RISC可能需要多条不同的指令来完成同样的任务。 RISC著名的代表架构是:Arm、MIPS和RISCV。而CISC的代表就是英特尔和AMD拥有的x86架构。 在Arm与x86竞争的过去十年中,Arm已经赢得了智能手机等低功耗设备的选择,而x86在桌面级和数据中心领域有着绝对的优势,但Arm体系正在其消费生态的阔步成长下,浸入x86的领地。 这一切源于Arm的开放性,使得更多科技巨头参与进来,巨量投入资金和科研力量来发展ARM架构的CPU设计。苹果、高通、华为,不断迭代其SOC技术,ARM体系正在步入需要提高电源效率的笔记本电脑和服务器设备中,苹果的笔记芯片M1和华为的鲲鹏920就是其中的佼佼者,这让步履相对缓慢的X86开始感受到巨大的寒意。我们距离世界先进水平还有多远? 华为是中国芯的龙头代表。从目前来看,通过世界排名前三的研发投入,华为凭借对ARM的打磨,已经有了麒麟9000和鲲鹏920等世界级的芯片。虽然现在的华为正在经历缺芯之殇,但这毕竟代表着国产CPU完全可以崛起,并在世界先进芯片行列中占有一席之地。 当前国产通用CPU处理器,与世界最先进水平相比仍有一些差距,但已从十年前基本不可用发展到今天完全可用,甚至开始有独立于海外的知识产权,拥有不再受制约的IP架构,国产CPU应用开始从专用领域转向公开市场,这是具有里程碑意义的重要一步。 华为的鲲鹏是迄今为止,国产服务器CPU领域最成功的产品。乐观的分析认为,2020年有可能交付150万到200万颗鲲鹏服务器芯片。 不过,鲲鹏的库存能支持多久呢? 龙芯是最早的国产商用CPU,而且在艰难的探索历程中,龙芯意外获得了MIPS的产权,龙芯在此基础上研发的龙芯指令集LoongArch,成为我们真正意义上可以不被掐住脖子的核心技术。 申威则是我国另外一款,具有完全自主知识产权的处理器系列。申威也是目前Alpha指令集阵营中仅存的硕果,拥有自主扩展指令和发展路线的自主权。2016年6月20日,搭载40960块申威26010高性能处理器的神威太湖之光超级计算机,在法兰克福世界超算大会(ISC)上,登顶榜单之首,成为世界上首台运算速度超过十亿亿次的超级计算机。 但是除了鲲鹏和申威在服务器和超算领域,进入世界级的一线产品行列,我们其他的桌面处理器,距离英特尔和AMD的新一代芯片,差距不小。比如:龙芯目前最先进的3A4000通用处理性能,只相当于AMD公司28nm工艺的最后产品。我们的桌面Cpu单核性能,也与英特尔、AMD主流CPU差距较大。国产CPU盘点 龙芯 龙芯已经买断MIPS指令集的产权,并在此基础上研发出国产指令集LoongArch。兼容MIPS,部分兼容x86、arm、riscv。 国产CPU领域,只有龙芯和下面将要介绍的申威,拥有自主可控的核心IP。 龙芯最新一代的CPU是4核的3A5000正在流片阶段,这款处理器使用1416nm工艺。目前龙芯的桌面CPU已经可以商用,但服务器CPU由于核数较少,暂时落后于其他国产基于X86和ARM的CPU。龙芯服务器CPU需要等待正在研发的3C5000。 值得一提的是,嵌入式龙芯,已经应用在我国的航天级业务上,北斗导航卫星搭载的就是龙芯抗辐射CPU。 申威 搭载40960块申威的神威太湖之光,曾经多次在TOP500上名列第一,目前在世界超算界也处于第三位。目前,申威已经开始把服务器作为发力的方向。 申威的指令集来自Alpha架构,而Alpha已经被束之高阁,指令集和微结构都已经不再更新,技术专利已经过期。申威是目前世界上唯一的Alpha捍卫者,并且在此基础上,拥有了自主扩展指令和发展路线的自主权。 申威用实践证明,独立自主与CPU高性能可以兼得,没必要一定依附于X86和ARM,中国人自主定义指令集完全走得通。 2020年面向服务器的SW3232已经开始流片阶段。作为自主产权的申威在提升的道路上,显然不如其他基于ARM和risc的众多产品,能做到突飞猛进。 鲲鹏 目前没有迹象表明,ARM对华为有断供行为。而且华为已经获得ARMV8永久授权,在此基础上,华为将V8的上限,通过自研延伸多远,谁也数不清。 一些数据可以证明华为在V8上的延伸能力:华为麒麟9000的主核没有采用最新的A78,而骁龙888采用的ARM嫡亲大核X1,号称比A77提升30性能。然而Geekbench5的测试表明,麒麟9000的单核多核得分为:10433647,骁龙888得分为11273679,单就计算性能来说,差距极小。 鲲鹏920处理器正是华为在ARMV8上杰作,48核的鲲鹏920与同时代最强的Intel至强8180性能相当,但鲲鹏920能耗比对方低20,64核的鲲鹏920测试性能要优于Intel至强818033左右。从某种意义上来说,鲲鹏920的闪亮度绝不比身为网红的苹果M1差。 如果芯片代工供应链得力,鲲鹏的飞翔高度不可限量。 飞腾 ARM体系的飞腾,是国产桌面级CPU的领先者。新一代的桌面级CPU:飞腾腾锐D2000刚刚发布,基于14nm工艺,拥有8个FTC663内核,最高主频2。6GHz。 在高性能服务器方面,下一代腾云S5000系列会升级到7nm工艺,在今年有可能发布。 兆芯 兆芯是国产CPU在x86架构方面保持独立的尝试。兆芯拥有x86指令集的使用权。虽然无法在高端领域与英特尔、AMD竞争,但兆芯在低端服务器、台式电脑和笔记本领域取得了进展。 兆芯最新的KX6000,已经把主频做到2。7G至3。0G。KX6000采用16nm工艺,集成8核。其CPU性能与2017年的英特尔i5相当,这足以让兆芯满足办公领域的要求。兆芯也在规划7nm制程的CPU。让我们继续关注性能数据。 兆芯的最大的优势就是能跑Windows,但X86的架构约束度有多大,是需要担心的最大问题。 海光 2016年,AMD公司与天津海光达成了合作,授权海光生产Zen架构的CPU。但现在外部环境早已巨变。 AMD也表态:与海光的合作关系目前仅止于第一代Zen架构技术,不提也罢。结语 随着产业政策的不断加码,国产CPU在近几年发展快了起来。 我们正在寻求设计和制造更先进的国产芯片,以取代进口,遏制核心芯片掐脖子现象,而服务器、桌面级芯片是其中的关键。尤其是这个市场的稳定和增长,意味着它拥有很高的战略价值,即使进入壁垒很高,我们也伸开腿蹚出一条道路。 我们已经能够获得低端CPU的独立发展,目前需要向高性能计算领域追赶。虽然与世界先进的差距比较大,而且伴随着芯片产业链制造环节的诸多风险,甚至还有资源分化的担忧,但面对当前风云变幻的国际产业环境下,我们只能努力向前,克服诸多困难,完善我们自己的软硬件科技生态。