这几年,全球数据呈现指数级上升,大数据应用也已深度融入千行百业。但由于我国信息技术起步晚,以IBM、Oracle、EMC为核心的IOE架构长期在中国市场占据垄断地位,特别是金融、电力、电信等重点行业。 如今,在国际战略博弈加剧背景下,我国重点行业核心业务系统基础软硬件随时存在供应短缺风险,数据安全问题也是摆在明面上。十四五规划和2035年远景目标纲要也明确提出要坚持自主可控、安全高效。 从另一方面来看,我国大数据产业迅猛发展,对于数据存储系统的性能需求也在不断提升,企业业务量、用户数、数据类型快速增加,而传统IOE架构弹性扩展受限,制约业务进一步发展,且基于这三家厂商垄断性和生态封闭性导致使用过程中维护、升级成本过高,诸如种种,无法实现当下各行业追求降本增效的效果,也因此,去IOE势在必行。 那么,现在我国去IOE进展如何?以及分布式改造都存在哪些问题? 总体来看,我国去IOE改造呈现去I进展较快,去E逐步推进,去O比较谨慎的现状。其中,在去I方面,国产X86产品的计算能力基本可以对等替代IBM小型机;去E方面,以华为为代表的国产存储也迎头赶上;在去O方面,则可以使用MySQL开源数据库替代。 当互联网线上业务的快速发展,带来指数级上升的访问量,海量数据的分析存储常态化,数据库由集中式转向分布式也渐成趋势。 但实际上,部署、迁移、运维所产生的额外成本,在一定程度上却抵消掉分布式改造带来的收益。比方说,企业不得不采用国产硬件推积的方式来实现原系统的性能和功能,导致成本相比原系统达1。5倍以上,同时,设备和数据库数量的则更加也加剧机房建设、运维等方面问题。 无法真正实现弹性伸缩、按需扩容也是与分布式改造初衷相背离的因素之一。比如,某省电信在用MySQL开源数据库替换Oracle数据库进行分布式改造并迁移后,和服务器、存储器等硬件的性能扩展无法适配,出现资源预留过多、设备使用率低等问题。 其实以上这些问题也是提出去IOE理念的阿里在去IOE深入后,从可用到好用面临的问题。最终的解决办法竟是借鉴IOE架构来实现的,这一点在其去IOE利器PolarDB数据库架构中体现最为明显,可谓用魔法打败魔法。另一方面集中式本身就是分布式出现后才有的相对概念。分布式技术,如分布式存储就是传统磁盘阵列技术中孕育的,作为母体,集中式架构天然包含了分布式的技术元素。所谓阴在阳之内,不在阳之对,架构是融合发展而非替代。 目前来看,分布式和集中式架构并重发展依旧式主流趋势。而在去年底,国家工业信息安全发展研究中心发布《中国企业数据领域分布式改造及产业能力建设白皮书》,谈及分布式发展问题时,建议我国应注重分布式和集中式架构并重发展,加强关键技术应用创新。 因此,在重点行业业务场景可以持续推进分布式改造,对降低成本、提高应用创新成本下降以及打破国外厂商垄断起到作用,但依旧需警惕改造用力过猛,稳扎稳打,不断打磨技术以适应改造过程可能出现的问题。 最后,还是要正视传统IOE架构的优势,目前在众多领域中依然是首选,应着力提升国产基础设备的单体性能,以实现高质量国产化替代。