GreenPlum tidb 性能比较 - HelloWorld开发者社区

GreenPlum tidb 性能比较

Stella981

2021-10-11 18:29 • 阅读 1585

主要的需求

针对大体量表的OLAP统计查询，需要找到一个稳定，高性能的大数据数据库，具体使用

数据可以实时的写入和查询，并发的tps不是很高
建立数据仓库，模式上主要采用星星模型、雪花模型，或者宽表
前端展示分为3类 saiku、granafa、c#代码开发
数据体量：事实表在3-5亿、维度表大的在500万左右
数据集成：可以和现在使用的kettle进行无缝集成

基于以上需求，前期使用tidb，但是在大体量表的olap查询性能不是很好，使用tipark 离线计算还可，但是时间上无法满足系统需求，初步了解到mpp架构的greenplum。因此先期进行了简单比较

基础测试数据表说明

数据表

订单宽表，数据表字段为300个左右

基本的测试结果 --不包含并发测试

集群基本配置：

Greenplum 4台8核56G，9个segments 表：列存，无索引

tidb ：6台8核56G，ssd

tpc-ds

GreenPlum tidb 性能比较

tpc-h

GreenPlum tidb 性能比较

其余测试 --

GreenPlum tidb 性能比较

GreenPlum tidb 性能比较

小结

针对OLAP的查询，greenplum 的分析统计性能要优于tidb
在greenplum不使用索引的情况下，点差要比tidb 差不少，增加对应的索引之后，性能差不多，但是greenplum 不建议使用索引
greenplum在列存的场景下，查询的列的个数对性能影响较大。

下一步验证

1.星星模型下的性能，考虑事实表 3亿，维度表 500万，

2.3亿的订单数据是否需要使用分区表

3.报表导出场景是否可以使用gp

4. sqlserver的存储过程是否可以迁移到greenplum

tidb greenplum 数据表 https 前端前端

点赞

收藏

评论区

Stella981

Lv1

接天莲叶无穷碧，映日荷花别样红。

文章

1.7w

粉丝

45

获赞

30

热门文章

OpenVPN下载、安装、配置及使用详解

OpenWrt 路由器过滤广告的N种方法

GitHub神器，一个可以白嫖全网无损音乐的神器

Python—执行系统命令的四种方法（os.system、os.popen、commands、subprocess）

SS端加密以及obfs混淆