海贝

首页 » 常识 » 预防 » 计算机数据库行业研究谁是少年中国甲骨文
TUhjnbcbe - 2023/9/23 20:01:00

(报告出品方/作者:民生证券,吕伟,郭新宇)

1、信创大势所趋,数据库国产化正当时

1.1、数据库:现代管理中不可或缺的核心软件

数据库是现代信息化管理的必然需求。数据库又称为数据管理系统,是承载企业级用户交易数据、客户信息、存货库存等海量数据的载体。随着企业信息化的逐步拓宽,需要处理的数据迅速膨胀。在此背景下,以简单文件作为主要存储形式的初级数据管理模式逻辑上过于简单,且可扩展性差。当系统数据量大或者用户访问量大时,还需要解决数据的完整性、一致性以及安全性等一系列问题。数据库本质是一款数据管理系统,除提供基础的数据存储功能外,还可以对数据进行新增、截取、更新、删除等操作,同时屏蔽数据访问的复杂性,能与多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。以达梦数据为例,其产品涉及数据库、数据服务平台等多个环节,在IT信息化架构中扮演着重要角色。

数据库分类:按其管理的数据结构,数据库可分为关系型数据库、非关系型数据库(NoSQL,包括键值型、文档型、图、对象型等);按其设计架构可分为集中式数据库和分布式数据库;按其部署模式可分为本地数据库和云数据库;按其应用场景可分为OLTP事务型数据库、OLAP分析型数据库、HTAP混合型数据库;按其存储介质可分为磁盘数据库和内存数据库;按其商业模式可分为商业数据库和非商业数据库。目前,国际主流的数据库厂商有Oracle、微软、IBM、MongoDB、亚马逊、谷歌等。近年来我国开始陆续出现商业数据库厂商,其主要代表有达梦数据、人大金仓、神舟通用等。近年来,国内互联网、通信科技巨头华为、腾讯、阿里等公司也纷纷加速布局数据库产业,借助云计算优势进行相关数据库服务的研发。

1.2、回顾发展历程:40载持续耕耘,国产数据库发展正当时

国产数据库发展历程可以分为四个阶段,目前正处于加速发展阶段,多个国产数据库蓬勃发展。技术启蒙阶段(20世纪80年代):年,中国计算机学会首次在*山召开数据库研讨会。从年起,中国计算机学会每年举办一次数据库学术会议。萨师煊教授于同年在人大创办了国内首个计算机本科专业,并编撰了中国第一部数据库教材《数据库系统概论》。

国外厂商垄断阶段(20世纪90年代):年,Oracle正式进*中国市场,成为首个进入中国的软件巨头,随后围绕Oracle生态的众多企业逐渐发展壮大。年,Sybase进入中国大陆;年,IBM进*中国市场并启动“发展中国”战略,协同中国数据库全面开放,带来的DB2和Informix数据库一举拿下中国金融行业的数据库市场。年,Oracle拿下中国邮电部电信总局建设的“九七工程”,成为中国电信行业最大的数据库供应商。

国产启蒙阶段(21世纪初):凭借“”技术计划、“核高基重大科研专项”以及“”研究计划等国家*策的大力扶持和高校研究背景,涌现出一批国产数据库厂商。年,最早的国产数据库厂商——人大金仓成立,依托人大背景,研发了KingbaseES系列数据库产品;年,拥有华中科技大学与多媒体研究所背景的武汉达梦成立,创建了武汉达梦数据库;年,南开大学背景的南大通用成立,创建了南大GBase系统;年,依托中国航天科技集团的神舟通用成立。这一阶段,数据库科研成果产业化,成功从实验室走向市场。

加速发展阶段(21世纪10年代至今):s,随着互联网与云计算的兴起,中国数据库市场及技术日益成熟,一批云计算厂商开始布局数据库行业,新兴的软件厂商、集成商、运营商相继进入市场。年起,阿里云开始使用开源数据库去IOE并提供云托管,衍生出基于MySQL开发的PolarDB,蚂蚁金服自研OceanBase。年,巨杉数据库成立,打造出金融级分布式数据库SequoiaDB等。年,国家将大数据作为国家级发展战略,同年腾讯云推出自主研发的分布式数据库TDSQL。年,星环数据库成立;年,PingCAP成立。年起,打造了各种云原生数据库;年,腾讯云推出自研云原生数据库CynosDB。这一阶段,国产数据库借助国家国产化项目工程及新创产业的发展,逐渐走进世界一流行列。

2、行业前景:信创大潮下百亿市场蓄势待发,优质国产厂商有望受益

2.1、市场空间:国内百亿市场蓄势待发,关系型数据库仍是市场主流

年国内数据库市场规模超亿元,-年复合增速有望达到近30%。根据赛迪顾问数据,年,中国数据库管理系统市场保持快速增长,规模达到.5亿元,-年复合增速达到27%;预计年市场规模达到约亿元,-年复合增速有望达到28%。

数据库可根据数据结构的匹配关系分为关系型数据库和非关系型数据库:1)关系型数据库:关系型数据库模型又称为SQL数据库,是把复杂的数据结构归结为简单的二元关系。在关系型数据库中,对数据的操作几乎全部建立在一个或多个关系表格上,通过对这些关联的表格分类、合并、连接或选取等运算来实现数据库的管理。目前流行的Oracle和MySQL等数据库均为关系型数据库。2)非关系型数据库:非关系型数据库又称为NoSQL数据库,意味着其将不仅仅限于传统的SQL二元模式,而是进行更广泛的拓展。随着互联网web2.0网站的兴起,传统的关系数据库在处理电商、社交等超大规模和高并发的SNS类型动态网站表现出了功能上的欠缺,而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。

我国数据库产品数量分布呈现以关系型为主,非关系型及混合型数据库为辅的局面。1)从产品数量上看:根据中国信通院数据,截至年6月,我国数据库产品共有款,其中关系型数据库81个,非关系型数据库有54个,占比分别为60%和40%。可以看到关系型数据库仍是国内数据库主流。2)从市场份额上看:根据艾瑞咨询数据,年中国数据库市场中,关系型数据库份额超90%。

关系型数据库中,MySQL、PostgreSQL装机量占据主流位置。1)根据中国信通院数据,截至年6月,关系型数据库中基于开源数据库MySQL和PostgreSQL进行二次开发的个数分别为23和24个,依次占关系型数据库比例为28.40%和29.63%,总计占58.03%。2)根据赛迪顾问数据,开源数据库年在中国数据库市场中占有率达到65.0%。在开源数据库中,MySQL数据库凭借其稳定性能、低成本、高可用、成熟生态等优势,装机量领先,达到42.6%;PostgreSQL装机量占比达到15.3%。

2.2、市场格局:海外巨头仍强势,但国产厂商正在奋起直追

Oracle、IBM等国外厂商凭借先发优势在数据库市场中占据了有利地位,但国产厂商正在奋起直追,国产领*企业份额已经接近或超过国外厂商。根据IDC数据,年下半年,在国内关系型数据库市场中,Oracle、微软、SAP、IBM份额总和仍达到近45%。但随着信创等趋势推进,国产厂商开始扮演更重要角色,达梦、人大金仓数据库份额分别约为11%和5%。MySQL、PostgreSQL是数据库市场中两种主要路线。在国产厂商中,依据不同技术路线,可以分为以下几类:1)PG/OpenGauss路线:包括人大金仓、神舟通用、海量数据、阿里旗下数据库、优炫软件等。2)MySQL路线:腾讯、万里开源等。3)纯自研:达梦。4)其他:南大通用。

2.3、信创数据库市场空间测算:到年市场有望超亿元

数据库市场空间:-年数据根据赛迪顾问数据。参照-年复合增速(28%),保守估计假设、年增速为20%、20%。信创目标市场:考虑到年国内服务器出货量中,30%左右为互联网行业(根据IDC、华经产业研究院年数据),但信创主要集中在*府、电信、金融、能源等行业,参考*府、电信、金融市场占比(共约25%)同时考虑还有医疗、教育等细分市场也存在国产替代机遇,因此假设整个市场中40%左右为信创市场。由于服务器和数据库往往成一定比例,因此我们也可以假设整个数据库市场中约40%为信创的目标市场。

海外厂商份额:根据前文数据,年下半年,在国内关系型数据库市场中,Oracle、微软、SAP、IBM份额总和仍达到近45%。考虑到国外大厂在国内长期占据市场优势、有部分海外厂商份额在“其他”里,我们假设年海外厂商总份额仍达到60%。后续随着国产替代推进,-年海外厂商份额逐步下滑至50%/45%/40%/35%/30%/25%(上述假设,基于在未来五年内,在**和重要行业基本实现国产化目标;同时考虑到在部分关键环节中国产替代可能需要一定时间,因此未将国产化率设定为%)。

3、新兴趋势:搜索型数据库新兴力量可期,湖仓一体引领发展潮流

3.1、搜索型数据库:自主化势在必行,国产厂商勇担重任

国产数据库浪潮已起,大多数组织都通过关系型数据库很好地管理与利用了结构化数据,但是很多业务的重要见解都隐藏在非结构化数据中。非关系型数据库又称为NoSQL数据库,意味着其将不仅仅限于传统的SQL二元模式,而是进行更广泛的拓展。随着互联网的兴起,传统的关系数据库在处理电商、社交等超大规模和高并发的SNS类型动态网站表现出了功能上的欠缺,而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。

随着我国数字化转型的蓬勃发展,非结构化数据的处理需要依赖基于全文检索的搜索引擎技术,而目前市场上开放源代码的领先的全文搜索引擎主要是Solr和ElasticSearch(以下简称ES)。ES自发布以来迅速占领了全文搜索引擎市场,目前国内外很多企业已放弃自主研发,逐渐转投ES阵营。根据ES财报显示,公司在年的营业总收入达到8.62亿美金,-年收入复合增速达到52%。

国产厂商奋起发力,TRS海贝大数据管理系统实现从底层到上层的全国产化。TRS海贝大数据管理系统是拓尔思自主研发的一款搜索型数据库,适用于数字、文本、地理位置、结构化数据、非结构化数据等所有数据类型,是目前国内少有的从底层分词算法到全文搜索引擎,以及上层系统都完全自研的纯国产搜索型数据库。在搜索能力方面,相较于以Lucene(Java语言)为引擎的ES,海贝基于一个纯C内核的TRS引擎,系统资源的使用更加合理可控,复杂搜索响应性能更优,并且提供了更加专业的段、句、位检索、XML检索,支持度量衡数据的数值区间检索等高级功能。

3.2、湖仓一体:打通数仓和数据湖,实现优势融合

数据湖、数据仓库均有自身缺点。数据湖用来存储各种格式的原始数据,并能够同时计算结构化、非结构化、半结构化数据,按需计算具有灵活弹性,但由于其包含数据量庞大且类型较多,因此部分时候难以实现快速计算和实时性分析;数据仓库在实时性方面能力较强,但是却多用于结构化数据处理,难以应对多种类型数据。

以Snowflake、Databricks为代表的新一代“湖仓一体”数据库厂商快速崛起。湖仓一体架构下打通了数仓和数据湖,并融合了两种架构的优势,底层多套存储系统并存且互相数据共享,形成了资源池;上层各引擎可以通过一体的封装接口访问,实现了联机交易和联机分析的同时支持。这样既可以实现统一数据底座下的不同平台间的数据互通,又可以支撑联机交易和联机分析的场景,提升数据实时处理能力,同时计算存储分离,按需弹性扩展。典型厂商Snowflake的年营收已经达到12.19亿美元,18-21年收入复合增速达到%。

4、行业主要公司:龙头领衔,群星闪耀

根据墨天轮数据(截至年11月17日),共有个数据库参与墨天轮数据库流行度排行,其中TiDB、OceanBase、达梦、openGauss、GaussDB等数据库排名靠前。

4.1、高斯数据库:商用+自用+开源相结合,龙头铸就成长新道路

华为高斯数据库经历了四个发展阶段,目前正在构建自身生态且生态不断繁荣。1年开始高斯数据库主要用于企业内部自用;年开始实现产品化,到年已经支撑公司内部40+主力产品,在全球70+运营商规模商用3万+套,服务全球20+亿人口;年开始打造开源战略,年6月openGauss正式开源;年至今开源高斯数据库不断完善自身生态,截至年11月17日,高斯开源社区用户已超百万,12款商用版,贡献者超个。

高斯目前采取商用+自用+开源相结合的方式发展,其内核将长期演进。在开源领域,高斯社区将持续构建开放社区治理架构,实现共建、共享、共治。年7月高斯开源社区正式上线,年成立社区理事会。

经过多年发展,openGauss已经具有大量行业核心客户,包括国家电网、邮储银行、民生银行等。同时,openGauss社区理事会于华为全联接大会上正式成立,理事单位由华为、海量数据、神舟通用、云和恩墨、虚谷伟业、深信服、超图软件、中国农业银行、中国建设银行、中国邮*储蓄银行、招商银行、华夏银行、中国民生银行、中国移动、中国电信、中国联通、清华大学等多家openGauss社区合作伙伴、用户和科研院校组成。

4.2、达梦数据:受益信创业绩快速提升,龙头地位凸显

武汉达梦数据库有限公司成立于年,是中国电子信息产业集团(CEC)旗下基础软件企业。专业从事数据库管理系统的研发、销售与服务,可为用户提供大数据平台架构咨询、数据技术方案规划、产品部署与实施等服务。目前武汉达梦拥有全部源代码,具有完全自主知识产权。

自成立以来,达梦数据先后完成并获得数十项国家级或省部级科研开发项目与奖项,逐渐成长为国内数据库行业的领先企业。公司服务于包括建设银行、中国人保、国家电网、中国航信、中国移动、中国烟草等在内的知名用户,成功应用于金融、能源、航空、通信、**机关等数十个领域,拥有建设银行、交通银行、光大银行、兴业银行、广发银行、国开行、中国人寿、邮储银行、中国人保、国家电网、中国航信、中国移动、中国烟草、国家市场监督管理总局、各级人民检察院、各级人民法院、国家发改委、国家移民局、证监会、上交所、深交所等在内的知名用户。在技术端,公司凭借自身长期积累,具有多个重要优势。

产品不断丰富,核心源代码%全自主研发。在产品端,公司通过基础数据库软件、面向不同应用场景的数据库集群软件以及云计算系列软件、大数据系列软件等产品形成以数据库管理系统为核心的产品生态体系,覆盖从数据交换、数据储存、数据治理到数据分析的全产业链。其中,达梦数据库管理系统(简称DM)是达梦数据具有自主知识产权的大型通用关系型数据库,其核心源代码为%全自主研发,不依赖开源数据库。受益于信创推进,业绩快速提升。1)收入端:受益于信创推进,公司收入不断加速增长,-年复合增速达到51%;2)归母净利润端:经过前期投入期,公司在产品、市场等方面成熟后利润开始回升,-年复合增速达到%。

4.3、万里开源:万里数据库拥有“万里前程”

公司重视在信创领域的战略布局,年,公司并购北京万里开源软件有限公司,快速切入数据库市场。在国产数据库方面,公司数据库技术源自于云计算技术,具有先进的并行计算与分布式架构,全面适配国产芯片和操作系统。冉冉升起的数据库“小巨人”:专注于国产、自主可控数据库及Linux操作系统产品研发,处于行业领先。北京万里开源软件有限公司(简称“万里数据库”)成立于年,是专注于国产自主可控数据库产品研发的国家高新技术企业,原MySQL中国研发中心,拥有发明专利、软件著作权百余项。

公司现有员工余人,技术人员占比超70%,设北京(总部)及上海、福州、广州、成都4个研发支持中心。经过22年发展,先后开拓运营商、能源、金融等领域客户,年开始全面适配国产芯片、操作系统。公司入选年度中国信创TOP中榜单;年度信创产业领*企业强中,公司排名48位;年,公司被认定为第4批国家级“专精特新”小巨人。

掌控底层核心代码,已经广泛应用于多个行业。万里数据库的技术底蕴源自对底层核心代码的掌控,始终坚持以“极致稳定、极致性能、极致易用”为目标,通过20余年的研发迭代,产品在功能、性能、稳定、易用等方面均处于行业领先水平,广泛应用于金融、运营商、能源、*府、交通等行业重要业务系统中的超个业务场景,得到了用户和市场的认可与肯定。年4月,公司创立GreatSQL开源社区,通过对MySQL技术的优化,目前已成为国内最主要的MySQL技术开源分支之一。

金融、电信运营商、能源等重要行业已实现应用。前期为了完善数据库产品,公司一直持续进行高强度的研发投入,目前已有金融、电信运营商、能源等重要行业的关键系统应用。1)金融行业:某股份制银行云缴费系统,该系统每天平均承载交易达0万笔,全年满足了近5.5亿名客户的缴费需求,是全国最大的缴费类系统。万里开源数据库将核心交易数据库国产化,打破Oracle数据库垄断。2)电信运营商行业:年7月,中国移动公示,创意信息数据库产品在标包2(分布式)评标中总得分排名第一,中标份额为60%;年再次中标中移动信息-年分布式OLTP数据库及工具框架采购项目。3)能源行业:万里开源数据库与国网联合研发的数据库产品继续推广,已经上线超过个业务系统。

4.4、人大金仓:国产数据库龙头,多个细分领域排名领先

立足自主研发,国产数据库领*企业。北京人大金仓信息技术股份有限公司于年由中共人民大学专家创立,自成立以来,始终立足自主研发,专注数据管理领域,先后承担了国家“”、“核高基”等重大专项,研发出了具有国际先进水平的大型通用数据库产品。经过20余年的发展,人大金仓构建了覆盖数据管理全生命周期、全技术栈的产品、服务和解决方案体系。

市场地位领先,国产龙头未来可期。年,人大金仓实现在国产数据库关键应用领域销售套数占比第一的市场地位。年,人大金仓持续加强自身在重点行业的拓展,关键应用领域销售套数第一,同时在中国石油石化行业市场销售量居国内厂商第一位置。年,金仓数据库管理系统KES入选国务院国资委发布十项国有企业数字技术典型成果,再次彰显数据库领域国家队的实力。以客户为中心,实现合作共赢。人大金仓广泛服务超过20个重点行业,成功案例涉及*务、能源、国防、金融、审计、教育、医疗、农业、水利等多个领域,能源、*工、金融等行业拥有大量优质客户。

抓住发展机遇,共建国产化生态。人大金仓一直坚持打造中国自主的IT底层生态。目前,人大金仓已与致力于国产化领域相关的操作系统、中间件、办公软件等大部分厂商完成兼容适配。下一步,人大金仓将继续与相关生态合作伙伴展开深度合作交流,共同携手在国产化领域进行创新与发展,为用户提供更加完整、优质、安全稳定的产品解决方案与服务体系。产品精益求精,满足时代要求。人大金仓的产品针对性地解决了一些数据使用方面的问题,有效的梳理整合数据资源,高效利用数据资产。产品主要分为通用型数据库、分析型数据库和数据同步软件,以及高可用解决方案等六大类解决方案。

受益于信创推进,业绩快速提升。1)收入端:受益于信创推进,公司收入不断加速增长,-年复合增速达到56%;2)归母净利润端:经过前期投入期,公司在产品、市场等方面成熟后利润开始回升,年利润大幅提升,-年复合增速达到%。

4.5、海量数据:高斯生态核心力量,核心客户验证自身实力

公司的国产化数据库产品主要包括VastbaseG、VastbaseE和配套智能工具。VastbaseG:VastbaseG是公司基于openGauss内核研发的企业级关系型数据库。产品从架构到引擎等多维度均进行了的大范围优化,针对指令集进行了深度适配,是ARM原生的纯国产数据库。Vastbase数据库是海量数据基于开源openGauss内核开发的企业级关系型数据库。融合多年对各行业应用场景的深入理解,Vastbase除了具有openGauss极致的性能以外,还在原有功能基础上增加了大量Oracle兼容特性,并遵循EAL4+标准进行了大幅度的安全增强,同时整合GIS/流计算等一系列专业应用领域的企业级功能。

VastbaseE:VastbaseE云图数据库是海量数据研究院研发的企业级关系型数据库。产品的高性能内核,能够很好地支持高压力地交易和大数据量地分析应用,甚至在混合负载场景,均能表现优异,通过分布式部署架构能够进一步对混合负载提供良好的扩展能力。同时,VastbaseE具备极强的通用性和稳定性,兼容绝大多数国内外IT基础平台,可广泛应用于各类企业级业务系统,也可在空间地理、工业自动化、社交分析、环保监测、人工智能等新兴领域发挥重要价值。

与华为进行多项合作,在高斯开源厂商中是除华为外贡献最大厂商,有望伴随巨头成长做大做强。1)根据年公司官微发布的消息,在“共创未来——比亚迪携手海量数据库Vastbase启动仪式”活动上,公司已与比亚迪达成合作,相关成果于华为全联接大会上进行了展示,并于年9月荣获“华为技术贡献类优秀合作伙伴”奖。2)根据华为高斯

1
查看完整版本: 计算机数据库行业研究谁是少年中国甲骨文