请问为什么两个最佳实践的测试结果得出相反的结论

我浏览了Tutorials_CN中的两个最佳实践案例,分别是:1. 基于DolphinDB的因子计算最佳实践,2. 中高频多因子库存储最佳实践,在这两篇文章中都分别对tsdb的窄表模式和宽表模式进行了性能对比,但是得出的结论正好想法,1中推荐采用宽表模式,2中推荐采用窄表模式,请问这如何理解?谢谢!

请先 登录 后评论

最佳答案 2023-06-09 15:24

并非相反结论。这是不同时期,不同场景、数据量级别下,综合权衡需求下的推荐选择。

首先 第一篇 基于DolphinDB的因子计算最佳实践 发表较早。
这篇文章中的因子存储场景考虑的是想对通用的场景。

从因子存储和查询两个进行了测试。从当时的测试结果来看给出的推荐。

attachments-2023-05-QCiO9KRz646c795175dd5.png


其次  第二篇文章中高频多因子库存储最佳实践 是继第一篇文章之后。
越来越多的客户使用DolphinDB. 使用场景也推进到了
快照级 1000 因子 和 是十分钟级一万个因子,这种数据动辄 十 T以上的场景。
DolphinDB 做为时序数据库。我们的宽表完全可以支持一万列以及这个数量级数据的存储。
但是DolphinDB 架构的本身设计上优先考虑的是海量数据高效写入、查询、计算。

在数以 十T 计算的数据量级下,进行新增因子的宽表更新,确实耗时较长。为了
保证客户使用的全方位写、查、改、删、算的高效、灵活。DolphinDB 对于窄表的存储
的数据查询以宽表模式返回,进行了大量的优化工作。使窄表模式存储数据,

在中高频场景因子能够提供更加全方位高效和灵活的使用方式。之后我们再次进行了大量的

测试验证。并撰写了这篇 中高频多因子库存储最佳实践 ,以供DolphinDB 用户的参考。

以上就是两篇文章的原由

最后,感谢您对 DolphinDB 的喜爱,以及认真阅读我们的教程。
DolphinDB 感谢有你,相伴前行!




请先 登录 后评论

其它 0 个回答