请问下，比如用值分区定义了一百万个分区，但是实际导入数据只导入了10个分区，因为DDB是导入数据才实际生成分区，那么在这种情况下，相比于只定义10个分区，查询效率会有多大影响？

默认排序时间排序

2 个回答

Polly 2023-05-25 10:16

测试了 OLAP 引擎，以下两个分区方案，数据量为 47,723,974

方案一：

db1 = database(, VALUE, 2020.01.01..2021.01.01)
db2 = database(, HASH, [SYMBOL, 10])
db = database(dbName, COMPO, [db1, db2])

测试 select count(*) 的耗时为：22.582 ms

方案二：

db1 = database(, VALUE, 2000.01.01..2100.01.01)
db2 = database(, HASH, [SYMBOL, 100])
db = database(dbName, COMPO, [db1, db2])

测试 select count(*) 的耗时为：8623.119 ms

wfHuang 2023-05-25 10:02

如果指定查询条件，性能影响不大。但如果没有where过滤，做一些简单查询，譬如select count(*) from t, 性能会有一定影响，因为元素据查询的时候，潜在的分区数多很多。

相似问题