初始化分区数对于查询效率的影响

请问下,比如用值分区定义了一百万个分区,但是实际导入数据只导入了10个分区,因为DDB是导入数据才实际生成分区,那么在这种情况下,相比于只定义10个分区,查询效率会有多大影响?

请先 登录 后评论

2 个回答

Polly

测试了 OLAP 引擎 ,以下两个分区方案,数据量为 47,723,974

方案一: 

db1 = database(, VALUE, 2020.01.01..2021.01.01)
db2 = database(, HASH, [SYMBOL, 10])
db = database(dbName, COMPO, [db1, db2])

测试 select  count(*)  的耗时为:22.582 ms

方案二:

db1 = database(, VALUE, 2000.01.01..2100.01.01)
db2 = database(, HASH, [SYMBOL, 100])
db = database(dbName, COMPO, [db1, db2])

测试 select  count(*)  的耗时为:8623.119 ms

请先 登录 后评论
wfHuang

如果指定查询条件,性能影响不大。但如果没有where过滤,做一些简单查询,譬如select count(*) from t, 性能会有一定影响,因为元素据查询的时候,潜在的分区数多很多。

请先 登录 后评论