陪跑 40 多年中国数据库终于迎来黄金时代

来源：未知编辑：天选资讯时间：2023-03-22

　　2023 年两会期间，最新组建的国家数据局，引发了人们的特别关注。

　　有人认为，它的成立意味着数字中国将进入快车道；更有人认定，以数据库技术为核心的数据安全领域，有望迎来大提速。

　　人们每天社交、餐饮、游戏、支付、打车等日常活动，离不开各种各样的程序应用。它们的背后，都离不开数据库。

　　上世纪 70 年代，IBM 的天才研究员科德，率先提出关系型数据库的理论、模型，甚至把查询语言 SQL 也琢磨了出来。

　　但当时的蓝色巨人，沉浸在大型计算机巨大的商业成功里，对数据库软件兴趣寥寥。

　　彼时，神州大地万物复苏，中国计算机学会敏锐把握到了科技的脉搏，在黄山召开了第一届数据库年会。

　　80 年代，美国数据库市场迎来井喷，甲骨文的 Oracle、IBM 的 DB2、微软的 SQLServer等，如雨后春笋般冒了出来。

　　产业的风口，让甲骨文迎来了发展的春天。它不但创造了连续 12 年销售翻番的奇迹，成长为全球第二大软件公司；连埃里森本人也一度问鼎硅谷首富，与比尔 · 盖茨不相伯仲。

　　不过 1996 年，诞生在瑞典的免费数据库 MySQL，给巨头们带来了一丝挑战。但在霸主甲骨文坚持不懈的猎杀下，2009 年 MySQL 也臣服在甲骨文麾下。

　　美国的数据库产业在高歌猛进，中国的数据库技术却尘封在象牙塔里。结果 90 年代，当甲骨文们来到中国，基本是大杀四方的状态。

　　1995 年，邮电部提出九七工程，使得国内第一批数据库企业有了发展的土壤，在少数大学和国家机关得到应用。

　　但最终，还是甲骨文乘着工程的东风，接连拿下东北邮电、中国电信等超级大单。

　　至此，中国的金融、电信、航空等领域，逐渐被 IOE（即 IBM 的小型机、Oracle 的数据库、EMC 的存储设备）横扫。

　　据全国人大代表、合肥工业大学应用数学所所长檀结庆调研统计，2020 年之前，甲骨文、IBM、微软等巨头把持了 87.7% 的全球份额，处于绝对垄断地位。

　　2009 年，淘宝跃升为 Oracle 全球居前的超级应用集群。但集群的 CPU 跑得冒了烟，依然抵挡不住双十一的超级洪流。

　　与此同时，通信技术不断向 3G、4G、5G 演进，让图片、语音、视频等非结构化数据，呈现指数级规模的暴涨。

　　战无不胜的 Oracle，怎么就扛不住了？这来自于关系型数据库和非关系型数据库的区别。

　　我们可以把关系型数据库，看成一家火锅店。在 Oracle 支持下，它每天能招待 1000 位客人，很不错了。

　　但现在，店里突然涌进了 1000 万客人。他们不但要吃火锅，还要泡温泉、做美甲、放烟花、坐过山车……

　　在天量的、爆发式增长的非结构化数据面前，传统的关系型数据库的天花板被冲破了。

　　于是，一场由关系型向非关系型、由集中式向分布式转型的数据库革命，爆发了！

　　在分布式数据库的世界里，数据库不会再集中于单机或一地，而会将查询、存储、事务管理等核心功能，扩展到多机或多地。

　　于是，200 万人在 A 区吃火锅，300 万人在 B 区泡温泉，400 万人在 C 区做美甲……

　　另外，云计算还能通过存算分离、弹性分配等手段，打破资源瓶颈，让分布式数据库自由伸缩、无限扩展。

　　也就是说，哪怕游乐场突然闯进 1 亿人，分布式数据库遇强更强，照样能铺开。

　　因此在 Gartner 看来，云化、分布式数据库将主导未来，引领数据库技术的新趋势。预计 2023 年，75% 的数据库会运行在云端；2024 年，全球数据库市场规模突破千亿美元，分布式数据库将成为最主要的市场增量。

　　如今，再造一个 Oracle，做不到也没必要。云化、分布式数据库，成为中国数据库换道超车的唯一机会。

　　2022 年 4 月，中国邮政储蓄银行（以下简称邮储银行）的新一代个人业务分布式核心系统成功上线。

　　这一出手，就建成了全球最大的银行分布式新核心系统。其中，华为云 GaussDB功不可没。

　　众所周知，核心系统是银行的大脑和心脏，不但承担至关重要的任务，而且在亿万次存储、计算中不容丝毫闪失。

　　邮储银行的老核心系统，使用的正是关系型、集中式 Oracle 数据库。但伴随金融服务在线化，交易频次越来越高，容量瓶颈、性能支撑、业务负载的挑战越来越大。一旦碰到交易高峰，系统资源缺乏弹性，拥堵成了家常便饭，严重影响用户体验。

　　如今，以华为云 GaussDB 等为代表的中国分布式数据库打破了这个铁律。

　　新系统上线后，邮储银行一举实现日均 20 亿笔、峰值 6.7 万笔 / 秒的超强交易处理能力。即便面对 6.5 亿客户、4 万多个网点的数据冲击，依然游刃有余。

　　全天联机平均耗时从 93 毫秒减少到 65 毫秒，批处理时间从 4.5 小时缩短到 3 小时，较老核心系统提升 30% 以上性能。

　　2022 年三季度，邮储银行迎来结息大考。过去耗时 140 分钟的任务，新核心系统仅用 25 分钟完成，性能、效率大幅提升，充分验证了中国数据库在安全可控上的承载能力。

　　实际上，在海量数据、任务并发的情况下，要实现数据处理不出错，是一件非常非常困难的事情。

　　这就像在 1000 万人涌动的游乐场里，要求游客不踩掉鞋、不走丢人、不传错菜。

　　但在银行、电信、电力、航空等系统中，就是苛求不出错、稳定压倒一切。

　　与此同时，GaussDB 再次通过中国信通院防篡改、智能化、分布式事务基础能力三大专项严苛评测。

　　所谓防篡改，就是在极端情况下，数据库依然要具备识别风险、防止篡改、备份还原的能力。

　　所谓智能化，就是数据库不但要提供智能运维，而且通过趋势预测算法，帮管理者智能决策、推理预警，让系统更加安全可靠。

　　所谓分布式事务型数据库基础能力，就是一旦出现大规模数据需求，数据库要能迅速反应，就近调集分布式的 CPU、内存、存储等系统资源，高效处理海量数据的能力。

　　如此强悍实力的背后，则是华为云 GaussDB 在全球范围内累计获得的 700 多件专利，在提供有力的支撑。

　　即便在数据库综合要求最严苛的金融业，GaussDB 在包括工商银行、邮储银行、建设银行、华夏银行等规模落地，以及拥有永安保险、甘肃医保、一汽集团等重点行业客户。

　　IDC 发布的《2021 年上半年中国关系型数据库软件市场跟踪报告》显示，在传统部署模式市场中，华为、阿里、达梦、人大金仓的市占率，分别为 14.7%、5.7%、5.7%、5.0%。

　　今天，中国的分布式数据库正趋于成熟，获得市场认可。只要假以时日，就有望在时代的大潮中崛起。

　　IDC 数据显示，全球每年的数据量呈现爆发式增长，预计从 2018 年的 33ZB 增至 2025 年的 175ZB。

　　数据的计算载体，早就从大型机、小型机、PC，演变成云、边、端的联网计算，高并发、低时延的交互计算。

　　而华为云 GaussDB 却实现在内存中的运算态加密，从而成为业界第一款纯软全密态的数据库，实现了对数据全生命周期的完整保护。

　　但华为云 GaussDB，直接打通了软硬件任督二脉，将数据库性能发挥到极致。

　　硬件上，GaussDB 拥有鲲鹏处理器的多线程、原子指令、SCM 的字节寻址持久化等能力；软件上，又实现了动态编译、SQL By Pass 等。

　　于是，基于鲲鹏两路服务器，GaussDB 32 节点处理能力达到了惊人的 1500 万 tpmC（即每分钟系统处理新订单个数），百亿数据量查询秒级响应。

　　对此，GaussDB 开发出一系列强悍的迁移工具。如数据库迁移工具 UGO，实现了异构数据库对象和应用迁移，语法转化率达 90% 以上；数据在线迁移工具 DRS，可实现数据的在线迁移、数据校验。

　　此外，由于是自己人，GaussDB 完全能够为企业量身打造数据库架构 + 应用 + 数据一体化的迁移方案。

　　1978 年，Oracle 在美国第二次石油危机引发的滞胀下诞生，草创之初 Bug 频出、骂声一片。美国海军、CIA、NASA 硬是顶着被骗的压力，让 Oracle 闯过了生死关。

　　此后，又经过全球用户 40 多年不断的实践、反馈、打磨、培训，Oracle 才拥有了成熟、稳定的口碑。

　　显然，中国数据库不可能一夜成熟，也必然要经历漫长打磨的过程。但只要今天播下宽容、创新的种，对襁褓中的中国数据库多采购、多使用、多呵护，明天才能收获卓越、成熟的果。

　　本文仅代表作者个人观点，部分图片来自网络、图虫创意、东方 IC，未能核实版权归属的，不为商业用途，如有侵犯，敬请作者与我们联系

上一篇：标签：数据库
下一篇：Greenplum数据库走出的创新派快公司