搜索
大数据中国 首页 数据发布 查看内容
2022爱分析·数据库厂商全景报告 | 爱分析报告
2022-12-19 17:42 | 查看: 1126| 评论: 0

4.3超融合数据库

市场定义:

超融合数据库是指在内核层面采用模块化和插件化的架构,通过插拔不同类型的数据引擎,实现对不同模型数据进行处理能力的数据库。超融合数据库能够支持用户在一套系统中统一处理关系、图、时序、文档等多种模型的数据,并同时具备事务和分析处理、流和批处理的能力。

甲方终端用户:

金融、制造、泛互联网行业企业的IT部门、大数据部门、科技创新部门,以及相关业务部门

甲方核心需求:

随着企业业务类型以及数据应用场景的多样化,对多种数据模型进行处理变成了企业的常态化需求。在传统的解决方案中,企业会针对不同数据模型,不同应用场景部署多种类型的数据库系统,但这种方式会造成用户在跨数据库做联合分析时操作流程非常复杂,并且多套系统的维护成本也很高。由于超融合数据库能够使用户用一套数据库系统满足对多种模型的数据进行处理的需求,并在保证性能的前提下简化了系统架构,降低了运维成本,近年来正被一些领先企业所采用。企业对超融合数据库的核心需求包括:

·

能够在特定业务场景中支持对所需的多种数据模型进行处理。如在营销场景中对人群偏好进行分析时,企业需要数据库支持对关系型数据、图数据、搜索引擎等模型数据进行联合分析;在高端制造业有大量物联网设备的生产场景,企业需要数据库支持对关系型数据、时序数据进行联合分析,并支持事务处理。

·

·

在支持多种数据模型的前提下,数据库的使用和运维尽量简化。在数据查询分析方面,企业需要数据库支持使用统一的查询语言来简化跨模型的联合分析,降低对用户的技能要求。在数据库运维方面,企业需要数据库简化其系统架构,无需针对不同数据模型建立不同的开发和运维体系。

·

·

具备与专用数据库同等或更高的性能。由于目前企业主要是在一些新兴的业务场景中采用超融合数据库,而这些场景通常具备数据量大,对于查询分析结果的时效性要求高等特点,因此,企业在这些场景中使用超融合数据库需要避免数据库为支持多模型数据的而牺牲数据库的运行效率,从而获得较高的数据查询分析的性能。

·

·

能与主流的数据库生态在一定程度上开放和兼容。为了与企业内部存量业务和数据系统进行对接,超融合数据库需要支持开放的标准接口,满足用户跨系统的数据迁移、ETL需求,以及能够与常见的计算引擎无缝对接;同时,超融合数据库需要与常用第三方数据库生态工具兼容,满足数据库运维管理中的诸多功能需求。

·

·

产品稳定可靠。与企业对其它数据库产品的要求一样,企业使用超融合数据库时同样需要其产品稳定可靠,避免使用过程中出现系统故障、数据丢失等问题。

·

厂商能力要求:

为满足核心需求,超融合数据库厂商需要具备下述能力:

·

厂商的产品可支持处理多种常用的数据模型,并且不同数据模型之间能够互通互融。为满足企业多种特定业务场景数据分析需求,超融合数据库需要支持关系型数据、宽表、图、时序、文档、队列等常见数据模型,并且这些数据模型之间可以互通互融,使得企业可以通过统一的查询引擎对多模型数据进行联合分析。

·

·

能够在数据库中采用创新性的系统架构来简化运维复杂度,并提升其运行效率。具体而言,厂商需要能够在数据库内核层采用模块化的方式,支持插拔针对不同数据模型的存储引擎和执行器,并使用统一的数据存储、统一的SQL访问接口,从而简化系统架构,便于企业后续扩展新的数据模型,以及大幅降低数据库运维的难度。

·

·

能够针对不同数据处理需求优化做相关技术优化,获得较高的性能表现。如针对时序场景的写入及查询、单表查询、多表关联分析、机器学习以及OLTP等数据处理需求,厂商在对其进行性能优化后,其性能可以比常见的专用数据库或大数据引擎,如InfluxDB 、Clickhouse、HBase、Spark等相同或更高。

·

·

厂商的产品能够对主流的数据库生态开放和兼容。超融合数据库需要兼容多种开源标准接口,如HBase、OpenTSDB、Solr等,并提供数据迁移工具,便于企业对数据进行迁移,实现业务无缝衔接。同时,超融合数据库需要与常用数据库,如Greenplum 、PostgreSQL等的生态工具兼容,满足企业对于超融合数据库的运维管理需求。

·

·

厂商的产品稳定可靠,且经过一定企业用户在业务场景中的验证。具体而言,厂商产品需要获得一定数据库企业用户的采用,并在实际的业务场景中能够稳定可靠的满足用户需求,获得企业用户的认可。同时,厂商需要在产品中提供多副本存储、企业级备份能力等,保障数据的可靠性。

·

入选标准:

1. 符合超融合数据库的厂商能力要求;

2. 近一年在该市场服务客户数5家以上;

3.近一年该市场相关服务收入规模在500万元以上。

代表厂商评估:

YMatrix

厂商介绍:

北京四维纵横数据技术有限公司(简称“YMatrix”) 成立于 2020 年,是一家创新型基础软件公司,致力于物联网时代新一代数据基础设施软件的研发,并提供相关产品、解决方案及一站式商业服务。公司在业界率先提出超融合数据库理念,并发布了 YMatrix 超融合数据库,基于独创的多微内核开放架构,在单一数据库之上,实现多模态数据的融通管理,及全场景查询分析的统一支持。

产品服务介绍:

YMatrix 超融合数据库(简称“YMatrix”)是同时支持在线事务处理(OLTP)、在线分析处理(OLAP)和物联网时序应用的分布式超融合数据库产品,具备严格分布式事务一致性、水平在线扩容、安全可靠、成熟稳定、兼容 PostgreSQL / Greenplum 协议和生态等重要特性。在万物互联的时代,YMatrix可面向物联网应用、工业互联网、智能运维、智慧城市、实时数仓、智能家居、车联网等场景,提供架构简洁、功能丰富的数据基础设施,并已在多家行业头部公司成功实现商业化落地。

厂商评估:

YMatrix超融合数据库产品稳定可靠,支持关系数据、时序数据、GIS 数据、JSON 数据、文本数据、图片等多类型数据的统一处理,简化技术架构,从而降低企业在数据库选型、使用和运维时的成本。YMatrix超融合数据库在OLAP和时序数据处场景具备突出优势,适用工厂数据基座、智能网联汽车、物联设备智能运营、实时数据仓库等场景,且能保障较高的性能。同时,YMatrix具备较完善的数据库生态工具。

·

YMatrix超融合数据库产品稳定可靠,且经历过大规模工业生产场景的使用和验证。YMatrix产品是在分析型数据库Greenplum和关系型数据库PostgreSQL的基础上,做了大量原创性研发工作而构建。由于Greenplum和PostgreSQL技术稳定成熟,且YMatrix的研发团队曾有Greenplum的研发经验,因此YMatrix的稳定性和可靠性得以保正。同时,YMatrix已经在工业生产场景经历过多家头部企业的使用和打磨,使得其针对工业场景的产品性能稳定、功能完善,应用能力较强。

·

·

YMatrix超融合数据库功能丰富,支持多种数据模型,尤其适用于OLAP和时序数据处理的场景。YMatrix内置多个微内核数据引擎,实现了对关系型数据、时序数据、JSON数据、键值数据、GIS数据、文本、图像等多种数据模型的广泛支持,并在数据操作层面支持以标准SQL实现跨数据模型的写入、建模、查询等操作。YMatrix尤其适用于OLAP和时序数据处理的场景,如车联网、智能制造、智慧能源、智慧交通、智慧城市等领域,可应用于工厂数据基座、智能网联汽车、物联设备智能运营、实时数据仓库等场景。

·

·

YMatrix超融合数据库技术架构简化灵活,大幅降低了企业需要运行多种类型的数据库选型、部署以及后续的运维成本。YMatrix采用了创新的“多微内核开放架构”技术架构,实现了数据库的“多核“,面向OLTP、OLAP,时序等场景,每个内核由不同的存储引擎和执行器组成,并针对前述场景专门优化。

·

基于这样的架构,企业后续可以通过YMatrix增加面向新场景的微内核,方便地进行数据分析场景的扩展,避免重新选型和部署一整套新数据库的高成本。同时,YMatrix配备了完善的安装、监控、报警、扩容、容灾等数据库管理运维功能,并可以对多种数据模型进行统一管理,大幅降低了企业部署多套数据库系统的运维复杂度以及运维成本。

例如, 理想汽车在引入 YMatrix 后,在同等数据规模下,整体服务器用量减少三分之二,指标开发周期从按天计算大幅压缩至小时级,同时数据入库速度及查询性能均大幅提升。

·

YMatrix超融合数据库在时序等各类数据使用场景具有较优异的性能表现。YMatrix针对写入和分析等重点领域进行了多达138项深度的指令级的优化。在时序场景的写入能力上,YMatrix在真实的生产场景中写入速度可达1.52亿数据点/秒,满足了新能源汽车(理想汽车)、重型装备制造(三一重工)等行业客户对于超大规模时序数据的写入速度要求。在时序场景的查询性能上,YMatrix的查询耗时在基准测试中是目前国外主流时序数据库的1/5左右;

·

此外,在单表查询性能上,SSB基准测试结果表明YMatrix比ClickHouse快27%;在多表关联分析性能上,对比MPP数据库主流厂商,YMatrix实现了数倍的性能提升;在机器学习场景性能上,YMatrix库内机器学习性能相比Spark提升了8倍;在OLTP场景下,TPC-B国际标准测试结果表明,YMatrix主键查询TPS高达160万,而绝大多数低于TPS5万的水准。

·

YMatrix 超融合数据库支持库内机器学习,生态兼容完备,可以满足企业用户多种类型的数据分析需求。YMatrix 是国内率先具备库内机器学习建模能力的数据库产品,支持通过 Python/R 等语言构建算法模型,并直接在数据库内进行分析运算,帮助用户大幅消除数据的迁移/加载作业量,显著提升数据利用效率。

·

例如:三一重工在预测性维护业务中建立需要基于大量设备数采数据做建模分析,在使用 YMatrix 后,相比过去的 Hadoop + Spark 组合, 不仅技术栈复杂度降低,同时运算速度提升了约 5 倍。同时 YMatrix 全面兼容 Greenplum 和 PostgreSQL 的上下游生态链工具,并支持通过数据联邦对接多类型数据源,满足企业用户在各种复杂分析场景下的数据迁移、ETL、监控及分层存储需求。

典型客户:

理想汽车、小米、三一重工、浪潮、BYD

4.4图数据库

市场定义:

图数据库是以点和边为基本存储单元,为高效存储、查询图模型的数据而专门设计的数据管理系统。在图模型中,数据是以点和边的形式存在,“点”表示实体,“边”表示实体间的关系,从而可以清晰展现数据间的关联关系。图数据库需要将数据以丰富的关联关系表示、支持图查询语言的访问和解析等功能。

甲方终端用户:

金融、政务、能源、泛互联网等行业企业的IT部门、大数据部门、科技创新部门,以及相关业务部门

甲方核心需求:

随着企业业务类型以及数据应用场景的多样化,对于数据之间的关系挖掘逐渐成为典型的业务需求。企业需要将看似离散的数据通过一定的关联关系进行连接,并运用可视化技术描述数据之间的相互联系。例如,知识图谱、金融反诈、社交网络、智能物联网等业务应用下,需要对图数据进行高效的查询和计算。由于图数据库相比传统的关系型数据库具备对图模型数据更加高效的存储和查询性能,近年来被许多企业所采用。企业对图数据库的核心需求包括:

·

高性能的图存储和计算。金融、政务、能源等行业有大量图模型的应用,例如金融风控、反欺诈、能源管理等。企业希望图数据库相比关系型数据库拥有更高的图模型存储效率和更低的存储成本,并且在多度关系或者多点遍历的复杂关系查询上更具备优势。

·

·

快速上手的查询分析功能。由于图数据库目前没有统一的标准查询语言,并且图分析的使用对于专业知识的要求程度较高,业务分析人员可能会缺少相关的知识技能上手使用。因此,企业需要图数据库具备一定的功能设计来降低图数据库的使用门槛,方便图数据的查询分析以及图算法的应用。

·

·

具备高可用和一定的稳定可靠性。企业需要图数据库具备一定的防范和恢复措施来应对突发的服务中断情况,保证数据服务的高可用性,避免数据错误、数据丢失的发生。同时,作为图数据应用的底层支撑,企业希望图数据库能够平滑稳定的运行,并且具备一定的服务响应灵敏度。

·

此外,部分企业对于图数据库还有以下期望需求:

·

能够支持行业知识图谱。作为图数据最基本和广泛的应用,知识图谱在金融、公安等行业有大量的使用需求。因此,企业希望图数据库厂商能够提供行业知识图谱的整体解决方案。

·

·

能够进行云化部署。由于数据上云趋势逐渐明显,部分企业希望将图数据库同其他数据库一起在云上部署,方便总体资源的规划和管理。

·

·

满足信创要求。在公安、政务等敏感度较高的行业,企业需要使用核心技术自主可控的产品来保证数据的安全性,因此会依据信创测试报告或信创名录进行选型。

·

厂商能力要求:

基于上述核心需求,图数据库厂商需具备以下能力:

·

厂商的产品具备高性能图存储和计算能力。厂商产品能够通过分布式部署实现大规模的图数据存储,并且保证高效的图数据访问读取。在对于数据关系的分析上,厂商产品要能够实现全图查询、遍历迭代的高效性,并且能够完成多样的图分析算法。

·

·

厂商的产品具备易用性。在图数据的查询上,厂商产品的查询语言能够让用户快速上手使用,并且需要支持常用的图算法。此外,厂商需提供可视化分析工具以及常用的分析函数,使得业务用户可以通过拖拉拽的方式在常用场景,如信用卡套现、贷后失联修复、客户贡献度评价等,快速实现图分析功能。

·

·

厂商产品能够稳定可靠地运行,并且持续提供可用的服务。厂商产品具备一定的数据冗余机制,满足分布式下的数据一致性,而且在服务器出现故障时能够保证数据不丢失且服务持续可用。此外,厂商产品经过多场景的打磨验证,能够满足金融、政务、能源等行业不同应用场景下对于图数据库稳定可靠运行的需求。

·

针对部分企业的期望需求,图数据库厂商需具备以下能力:

·

厂商能够提供针对不同行业提供知识图谱解决方案。厂商能够依据行业需求提供金融、政务、能源等行业的知识图谱解决方案,输出包括图谱构建、开发工具等在内的知识图谱整体解决方案。

·

·

厂商的产品能够采用云原生技术。面对企业数据上云的需求,厂商需要提供图数据库的云化部署,并且应用云原生技术实现企业资源隔离、多租户等需求。

·

·

厂商的产品要满足信创要求。在敏感度较高的行业,厂商产品需要通过信创测试来证明技术的自主可靠性。此外,由于某些企业进行了全国产化软硬件部署,厂商产品也需要做相应适配保证在国产化IT环境中的顺利运行。

·

入选标准:

1. 符合图数据库的厂商能力要求;

2. 近一年在该市场服务客户数5家以上;

3.近一年该市场相关服务收入规模在500万元以上。

免责声明: 除非特别声明,文章均为投稿或网络转载,仅代表作者观点,与大数据中国网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。如果本文内容有侵犯你的权益,请发送信息至ab12-120@163.com,我们会及时删除

最新评论

关闭

站长推荐上一条 /1 下一条

 
 
大数据行业交流
大数据行业交流
大数据求职招聘
大数据求职招聘
站长电话:
15010106923
微信联系:
hb-0310
站长邮箱:
ab12-120@163.com
大数据中国微信

QQ   

版权所有: Discuz! © 2001-2013 大数据.

GMT+8, 2024-5-5 07:45 , Processed in 0.109019 second(s), 23 queries .

返回顶部