纠纷奇闻社交美文家庭
投稿投诉
家庭城市
爱好生活
创业男女
能力餐饮
美文职业
心理周易
母婴奇趣
两性技能
社交传统
新闻范文
工作个人
思考社会
作文职场
家居中考
兴趣安全
解密魅力
奇闻笑话
写作笔记
阅读企业
饮食时事
纠纷案例
初中历史
说说童话
乐趣治疗

从卡脖子到主导,国产数据库40年的演变

4月8日 赤雷榭投稿
  六代繁华,春去也,更无消息。空怅望、山川形胜,已非畴昔。王谢堂前双燕子,乌衣巷口曾相识。元词作家萨都刺《满江红六代繁华》
  说起国产数据库的开山始祖,非人民大学的萨师煊教授莫属,而萨师煊正是元代文豪萨都刺的后人,萨师煊与其弟子王珊合著数据库系统概论,直到现在依旧是目前我国数据库领域的经典教材。
  早在1978年,萨师煊教授就开始为中国人民大学的同学们普及数据库的知识。而彼时刚刚恢复高考不久,数据库这个概念还属于非常新潮的名词,不过正是在萨老师的带领与指引下,国产数据库40年来由默默无闻到真正的爆发;从单节点到蚂蚁分布式数据库速度之王OceanB从单一功能的TP、AP库到混合式HTAP数据库天云的H从数据仓库、数据湖分立到仓湖一体的MaxC从SQL、NoSQL再到NewSQL的TiDB;从传统数据库到专业的物联网时序数据库TDE更遑论刚刚入选Gartner领导象限的最新一代阿里云数据库PolarDB。
  2010年7月11日萨师煊教授在北京与世长辞,而彼时像PolarDB、TiDB、TDEngine这些国产数据库的典范,根本都还没有出生。须臾之间,可谓是国产数据库的丰收年之2020已然进入了倒计时,从蚂蚁的OceanBase再破TPC速度记录,到阿里云PorlarDB首进Gartner数据库领域的领导者象限;再到华为GaussDB革命性功能全密态的发布,国产数据库可谓是精彩纷呈。而今时今日,读到这阕六代繁华,回首过往,实在令人感慨万千,在这里,谨以此文向数据库前辈们致敬,也希望能为正走在数据库道路上的从业者带来一些思考!缘起国际巨头的傲慢与偏见
  数据库的起源可以追溯到上世纪60年代。当时CPU刚进入集成电路时代,计算机算力、内存都较之前的晶体管时代有了大幅提升,不少企业也开始使用计算机进行数据管理。不过当时的计算机系统缺乏有效范式来描述复杂的数据关系,因此当时库管系统还一直处于非常简陋的雏形状态。
  直到1970年,关系数据库之父、IBM研究员E。F。Codd在《CommunicationsofACM》杂志上发表了一篇名为ARelationalModelofDataforLargeSharedDataBanks的论文,这也成为了数据库历史上的奠基之作。后来ACM在1983年把这篇论文列为创刊25年中最具里程碑意义的25篇论文之一,因为在这篇论文中首次提出了关系模型的概念。
  关系本是数学中的一个基本概念,由集合中的任意元素所组成的若干有序偶对表示,用以反映客观事物间的一定关系。像数字之间的大小关系、人之间的亲属关系、商品流通中的购销关系等等。用关系的概念来建立数据模型,用以描述、设计与操纵数据库,E。F。Codd是第一人。
  不过虽然关系型数据库的理论在1970年就问世了,但是市场上却迟迟不见关系型数据库的商用产品。这其中最主要的原因是IBM虽然率先提出关系数据库理论,但当时蓝色巨人的反应实在太迟钝了,他们在1973年才启动SystemR项目来研究关系型数据库的实际可行性,不过也受限于当时IMS层次型数据库火爆的销售情况,因此IBM对于SystemR项目的关系数据库不怎么感兴趣。
  1977年6月,LarryEllison和他的甲骨文抓住了关系型数据库这个巨大的商业机会,并通过引入SQL语言、原子事务等关键特性,在数据库领域迅速站稳了脚跟,并在1989年正式进入中国。
  彼时,中国数据库市场上像FoxBASE、dBase之类的产品都远远没有Oracle那样突出的实力,因此,甲骨文入华后不到五年,恰逢我国推进九七工程(1997年,在全国电信企业全面实现市话业务计算机综合管理),由于电话资费大幅下降,普通家庭都安装得起电话了,这也使甲骨文的Oracle数据库在中国的销售情况迎来爆发式增长,不过单向的技术依赖,让我们处于被动的位置。一举打破Oracle垄断的支付宝核心OceanBase
  随着移动互联网大潮来临,我国IT巨头应用方面的创新几乎做到了天下第一,无论是O2O、共享单车、移动支付领域是如此类,我们做的确实好,但是各大科技企业的核心数据库C位却一直被Oracle与MySQL等国外产品牢牢把持着。
  不过国外厂商的最强神话终于在2019年的国庆节被成功打破。蚂蚁的Oceanbase数据库成功登顶世界上最权威的数据库评测机构TPC(国际事务处理性能委员会)排行榜榜首。
  在今年5月,OceanBase再次将自己之前创造的记录提升了近11倍,将甲骨文、IBM等一众老牌数据库巨头甩在身后,正式宣告国产数据库落后于国际先进水平的时代已成过往云烟,自研数据库产品自此站起来了。
  不过回顾过往,彼时OceanBase的诞生纯属意外。OceanBase的创始人阳振坤绝对是天才中的天才,在1984年考入北京大学数学系,3年修完本科,不到2年硕士毕业。师从王选院士并获得博士学位后,32岁的阳振坤就成为了北大首批长江学者奖励计划的特聘教授之一。如果继续沿着这条路走下去,相信阳振坤会成为萨教授那样的学术泰斗,不过象牙塔的生活对于阳老师来说还是太乏味了,受到了导师王选院士的影响,阳老师立志要做出一款能够名垂青史的作品。
  2010年,45岁的阳老师加盟阿里,组建了一支自研数据库的团队。
  2012年,时任蚂蚁金服CTO的程立决定将支付宝1的交易库存数据在OceanBase上进行试运行,而这一试不要紧,OceanBase不负众望,超额完成任务成功运行了10的数据,这也让OceanBase在阿里内部一战成名。混合型HTAP天云Hubble数据库
  在传统关系型TP数据库的范式中,数据类似于随时会被加工改造的零件,而数据库则是零件的加工厂。举例说明,使用ATM取款时,取款人的账户余额和ATM的钞箱余额都是在数据库的加工下随时会变化的零件,因此TP数据库一般用于联机交易,关键是响应速度要快。而在AP数据仓库,则把数据看做是已经被加工好的成形货物,没有实时修改的需求,但是要进行大量的关联计算以挖掘数据价值,因此AP数据仓库大多被用于客户画像、营销策分析。
  而TP与AP相对独立发展的趋势,随着实际业务的需要而发生改变,例如银行实时风控体系、电商实时推荐营销系统等都是需要综合TP与AP特性的场景,因此HTAP的概念在2014年被Gartner正式提出。
  HTAP(HybridTransactionalAnalyticalProcessing)是在保留原有在线交易功能的同时,强调了数据库原生计算分析的能力。支持混合负载的数据库能够避免在传统架构中,在线与离线数据库之间大量的数据交互,同时也能够针对最新的业务数据进行实时统计分析。
  天云数据的Hubble就是一款整合了TP与AP特性的混合式HTAP数据库。值得一提的是,Hubble作为原创国产数据库获得了全国首届信创产业生态创新大赛中的一等奖。
  在同一数据库实例下,同时支撑高并发低延迟的OLTP事务和海量密集计算的OLAP分析作业,这不是一个简单的任务,而Hubble的方案是引入损失函数动态评价SQL逻辑计划的执行成本、CBO代价优化解析、Sharding切片线程级别物理资源匹配不同计算负载、TP和AP双引擎调度执行、随机和序列化IO对存储的访问、依靠数据副本机制同时支持KV键值存储和列存存储交出了完美的答案。这意味着一张表可以同时支持行存和列存,真正的融合了存储结构,避免了在交易和分析数据库间每夜ETL数据搬家的繁琐运维工作和数据冗余。
  天云Hubble数据库借助优化便捷SQL服务替代ESHBase方案,节省昂贵Hadoop开发成本;以高并发实时流升级,完成了Flink不能处理更多事实表的金融反欺诈和复杂权益服务;多表关联AP计算方面,Hubble的性能是Impala的231,在开放的大数据生态中,Hubble完全可以作为计算组件与开源组件协同工作,嵌入并服务主流数据中台环境。NewSQL的典范TiDB
  2005年,谷歌首次提出了大数据的概念。对于大数据(BigData),Gartner给出了这样的定义:
  大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。
  也就是说大数据是指传统的SQL数据库无法处理的大量数据,这也就是我们目前常说的NoSQL型数据库,这是一种基于KeyValue寻址的数据库,这种数据库专门为海量数据存储服务,不过NoSQL要求数据之间的关联计算不能太多,比如字节、快手这样的视频社交APP,数据虽然是天量级的,但是用户每条动态之间所需要的关联计算不多,这样的场景下使用NoSQL数据库就比较合适了。
  而我们前文提到的TP、AP数据库,都要进行数据之间的关联计算,比如电商平台上客户的一笔交易既要更新商家的库存又要更新买家的帐户余额,或者基于用户画像时要将客户的各项理财变动情况进行整体建模计算,这种关联计算的场景就是SQL数据库的天下了。
  原本SQL与NoSQL的应用场景两不重叠,井水不犯河水。不过,从最新的如直播带货需求来看,要求数据库既提供海量数据存储服务又提供高性能关联计算服务,这就是NewSQL的领域。
  而打通NoSQL与SQL任督二脉,打造NewSQL数据库的明星产品中典范当属PingCAP的TiDB了。PingCAP的联合创始人黄东旭出身于微软,不过黄东旭在程序员中绝对堪称异类,他不止是位编程高手,绘画和摇滚水平之高甚至还远在代码能力之上,是IT业内闻名的文艺青年,其创建的TiDB(https:github。compingcaptidb)数据库代码优雅,结构清晰,颇有艺术气息,用他的话来说TiDB的目标是尝试让用户像使用和操作Oracle、MySQL传统数据库那样顺手,与此同时,还能拥有弹性伸缩的高扩展、高可用性架构。
  PingCAP今年有两个大动作,一是在数据库顶会VLDB上发表论文《TiDB:ARaftbasedHTAPDatabase》;二是继续将云原生进行到底,其把TiDB与和Kubernetes紧密结合,使得TiDB用户可以快速对集群进行扩缩容,滚动升级,这也反应了PingCAP在技术方面有非常深入的分析和思考。TiDB的设计架构定位就是坚定地朝着云原生NewSQL的方向发展。这也是PingCAP站上风口,在D轮融资2。7亿美元的主要原因。
  金融级核心GoldenDB
  笔者作为一名长期从事金融科技的程序员,对于数据库技术对外依赖感触是相当深刻的,因为我国银行业的绝对核心支付系统(CNAPS),直到2013年底,我们才用自研二代支付系统将国外方案取代。
  一直以来,一致性问题是金融级数据库的重要讨论话题。分布式数据库的语境下一致性就是指各个数据库分片的数据是否一致,何时一致。如果更新过的数据能被后续的访问都能看到,这是强一致性;如果能容忍后续的部分或者全部访问不到,则是弱一致性;如果经过一段时间后要求能访问到更新后的数据,则是最终一致性。金融级的数据库必须要保证强一致性,也就是只要数据更新,就必须被后续的访问所看到。
  在金融数据库方面,中信银行与中兴通讯联合研发的GoldenDB在今年5月份成功上线。GoldenDB成功取代了在中信银行核心系统服役了几十年的IBMAS400据库。为解决一致性问题,中信银行的数据库专家们创造性的提出在GoldenDB数据库引入全局事务协调器GTM,实现基于中间件的强一致性事务控制,完成分布式事务的全生命周期管理。保证异常场景下的数据一致性,解决分布式数据库可能的脏读问题,在数据备份恢复过程中,保证各全局事务组的操作统一执行或回滚。
  分布式事务中最重要的是原子性和隔离性。所谓原子性就是指事务像原子一样不可分割,比如用户在支付宝上还信用卡,那么支付宝的余额和信用卡的还款记录就需要同时成功或者失败,不能出现一边成功而另一边失败的情况,一般来讲原子性可通过已提交事务的回滚来实现。
  真正的难点在于隔离性,隔离性主要是处理读写冲突和写写冲突。分布式事务提交时可能出现部分节点成功,而另外一部分失败的情况,此时中信银行的数据库天团又提出在这种情况发生时,将已经成功提交的节点上进行回滚。根据全局事务GTID在Binlog中查找已提交事务信息,生成反向SQL语句并执行以实现数据回滚。通过以上的机制,就保证分布式数据库可以用于银行的动帐类业务,防止错账的发生。最终,银行核心系统完全实现了分布式数据库的分布式迁移,并随之完成国产化替代。传统数据库的终结者PolarDB
  2010年前后,中国的互联网企业普遍迎来了一波流量爆发。其中,继2003年推出支付宝以后,淘宝在2005年到2012年的交易迅速增长,交易额从80亿元、200亿元到1000亿,直到破万亿。不过这种爆炸式增长,也成为了阿里人甜蜜的负担,因为阿里电联用户的增长速度已经渐渐超出系统处理能力的提升速度,而原有一直沿用的IOE(IBM的小型机、Oracle的数据库和EMC的存储)中心化系统与这种高用户并发的场景几乎格格不入,且暂不论达到如此性能的IOE系统成本会有多惊人,问题的关键在于即使是当时最强大的科技公司,也没有经历过上亿用户同时在线的业务场景,使用国外的产品方案有如南辕北辙,无法真正解决问题。
  正因此,王坚院士率先提出去IOE的目标,通过打造阿里自己的技术来解决用户爆发工资长的问题。
  在IOE架构的系统中提升算力的思路是让服务器越来越强,云计算的分布式思路是只需要增加服务器节点的数量,就能处理更多的并发服务请求,而分布式系统的业务连续性,并不是靠高可用性来保证,而是靠整个服务体系的容错能力造就的。在不断探索的过程中,我们也诞生了新的分布式架构,通过发挥云计算的威力,使得看似普通的虚拟机集群,能够碾压一体机,能够为亿万用户同时提供优质的服务。
  欲戴皇冠,必承其重,很多公司都会要管理远超自身运维能力的大规模数据库集群,DBA团队维护对于很多企业尤其是初创企业来说成本不低,因此DBaaS(DatabaseasaService)逐渐兴起。用王坚院士的话来说,未来使用数据库服务就像使用自来水和电一样简单,业界一般认为将传统业务上云成本可以降低一半,而将数据库业务上云成本可以降低三分之二,因此很多研究机构都认为云数据库才代表着数据库的未来走向,比如Gartner就预计到2023年全球75的数据库都会跑在云上,可以说云数据库未来很可能会终结掉传统数据库的存在,因此谁能在云数据库方面依靠,谁就可以在云计算与数据库两个方面都取得优势。
  根据Gartner上周发布的2020年度全球数据库魔力象限评估结果,阿里云凭借PolarDB的强大性能首次挺进全球云数据库供应商的第一阵营,进入领导者(LEADERS)象限,而腾讯和华为也都入选了特定领域者象限,这是有史以来中国数据库首次有三家厂商同时入选Garner的魔力象限。
  Gartner在报告中指出阿里云拥有丰富的数据库种类覆盖度和完善的产品布局,为用户提供了多种关系型和非关系型数据库产品,还提供了混合云环境部署,同时集成了备份、数据迁移与同步等能力。这样的评价也充分体现了阿里云PolarDB的不俗实力,同时也预示着像阿里云、华为这样的中国云厂商未来不可限量。
  PolarDB的创始人李飞飞与阳振坤一样同样是少年天才,在初中毕业后,李飞飞直接进入了国家教委理科实验班,并被保送进入清华学习。博士毕业后他在犹他大学计算机系任教,从助理教授一路做到正教授,后来在时任阿里集团CTO行癫的支持下,李飞飞加入阿里创立了PolarDB。
  图片来源:阿里云技术公众号,已获作者授权
  PorlarDB除了在索引结构、锁机制等传统数据库组件进行优化以外,还特别针对云服务特有的全球跨域数据同步与容灾需求,进行了重点设计,我们知道很多云服务客户的业务遍及世界各个大洲,因此对于云数据库的跨域数据同步也会有非常高的要求。PolarDB全球数据库(PolarDBGlobalDatabaseNetwork,PolarDBGDN)采用了数据库物理日志异步复制的方案。PolarDBGDN通过高并发流水线技术将同步速度提升7倍,将数据跨大洲同步延迟控制在2秒内。全局读写分离技术结合多级别的一致性能力,让业务不用做任何的改造的前提下降低整体的访问延迟,全面满足了云用户的需求。最后
  今年是国产数据库的丰收年,除了上述数据库外,国产时序数据库TDengine背后的涛思数据在2020年4月完成A轮2000万美元融资,8月将集群版开源,连续6天在GitHub全球趋势排行榜上位居第一;OceanBase在工行的理财核心系统得到应用与验证;PolarDBX应用于中国邮政核心系统中,帮助邮政成功渡过1亿件的交易峰值;中国联通基于PolarDBX等技术重构了其核心IT架构,实现对3。6亿用户的无缝广覆盖,成为全球最大的云上BSS系统。相信国产数据库的未来可期,也愿今日国产数据库之世如众人所愿!
投诉 评论 转载

和平精英极寒模式3。0全面来袭你可以捡枪,但不能抢我的秋裤IT之家12月6日消息近期,和平精英官方带来了极寒模式3。0的爆料,极寒天气即将来袭!在未来一段时间内,经典模式雪地地图将会受到极寒天气的间歇性困扰!在极寒模式中,极光城……小米招聘啦岗位职责:1、总体负责AI视觉能力在小爱的落地;2、参与人工智能Android软件的需求工作,撰写相关技术文档;3、负责人工智能Android软件的设计和开发……沉默的初心vivoTWSNeo真无线耳机林氏评测2020年3月6号,vivo智能终端这个账号,发送了注册以来的第一条微博,如果这件事早发生四年,我会更开心许多。四年前的2016年3月1号,vivo在北京水立方发布了Xp……雪花挂代码遭破解,化名黑花挂,和平精英用就封号10年IT之家11月6日消息今日,腾讯游戏安全中心表示,《和平精英》此前曾处理过一款名为雪花挂的作弊软件。如今,有人破解了雪花挂的代码,并包装化名为黑花挂,重新在一些社交平台上传播。……即将发布的RedmiK50值得你掏钱购买吗?实际上,我也没买K40。为什么?因为没钱。真的。春节过后,所有的奖金和工资,全部花完了,奈何?我去实体店看了,k40,手感不是一般的好,对于工薪阶层,足够了。但我的……逆水寒首发英伟达RTXGI全局光照技术,带来更加真实的间接光IT之家11月6日消息根据英伟达官方的消息,在过去的两年中《逆水寒》游戏中陆续上线了光追反射、光追阴影、DLSS等尖端图形技术。现在,英伟达携手网易雷火工作室公布《逆水寒》游戏……农村基建一百年不回本,曾被外国嘲笑,如今令他们瞠目结舌不出所料,今年中央一号文件再次聚焦三农问题,巩固脱贫成果和乡村振兴,强调要加强乡村公共基础设施建设,提升农村的基本公共服务水平。基建,再度被中国强调。事实上,从上世纪90……GOG喜加一电子脉冲易死版限时两天免费领IT之家11月14日消息白嫖从未停止,恭喜各位本周喜加一名单再增加一位。GOG平台的《电子脉冲:易死版(Teleglitch:DieMoreEdition)》限时2天免费领取,……每周喜加一盘点Epic圣书物语免费领感谢IT之家网友肖战割割的线索投递!IT之家11月13日消息每周一次的白嫖时间又来了,快来跟我一起点击链接领取入库关闭吧。Epic……国产四大厂商正式发力芯片市场,国产造芯潮来了?你看好吗一部手机有上百甚至上千个芯片,不同的芯片取决于不同的功能和价值,而如今国产的手机太过于依赖国外的配件,导致随时都有可能被卡脖子的现象!所以国产手机从华为的事件当中也意识到了芯片……高通供应分配将向智能手机倾斜点名中国5G手机强劲需求据MobileWorldLive报道,高通的领导层告诉投资者,该公司正在抵御供应紧张的逆风,并从5G手机的强劲需求中受益,尤其是在中国。在第四财季财报电话会议上,高通首席……从卡脖子到主导,国产数据库40年的演变六代繁华,春去也,更无消息。空怅望、山川形胜,已非畴昔。王谢堂前双燕子,乌衣巷口曾相识。元词作家萨都刺《满江红六代繁华》说起国产数据库的开山始祖,非人民大学的萨师煊教授莫……
EA公布死亡空间重制版实机演示并宣布将于2023年初发售用科技演绎大自然艺术之美荣耀9XPro全息冰岛白图赏暴雪首款魔兽手游,魔兽弧光大作战正式公布部分地区再补货索尼PS5光驱版京东4428元索尼PS5Pro早期爆料最早2023年底发布,性能提升1倍电视机拥有摄像头是怎样一种体验?真香现场来了腾讯START云游戏平台新游上线音乐游戏永不言弃4,支持Wi浙江推号店一体战略下线淘宝外链内容社区小红书自建电商闭环在玩异度之刃决定版之前,你必须要知道的事情索尼明日举行新一期PlayStation游戏发布会,战神诸神支付宝开通了地下室,这是什么想干啥?幻塔国际服将于4月开测,由腾讯代理怀孕时间到底怎么计算我的偶像七年级作文500字4篇德国人声称,中国人在唐朝时期就发现了氧气,比欧洲早了1000戴望舒诗歌断指原文及赏析靠近古今医案研读姚炳洲治胃脘痛(十二指肠憩室兼胃下垂)案李玉成暴露本心?与马玉琴直播唱歌表情很痛苦,网友想新欢直说电视剧何以笙箫默观后感日本工人遭核废料轰炸,经历83天非人痛苦,死时已无人形用牛奶制作辅食可给宝宝补钙孕妇测胎心率的注意事项农村电商的利润怎么来?有哪些盈利模式?

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找美丽时装彩妆资讯历史明星乐活安卓数码常识驾车健康苹果问答网络发型电视车载室内电影游戏科学音乐整形