jiajia xu
jiajia xu

性别: 注册于 2021-04-30

向TA求助
20金币数
120 经验值
0个粉丝
主页被访问 1456 次

最近动态

2021-12-21 14:52 回答问题

比如把矩阵中小于5的值指定为5,有三种方法实现: 方法一: iif(a<5, 5, a) 方法 二: (a<5) *5 + (a>=5) * a 方法三: m=each(def(mutable x){x[x<5]=5;return x},a)

2021-11-18 12:06 回答问题

“,”进行连接时,在查询时会按照顺序对“,”前的条件层层进行过滤,因此,条件的先后顺序不同,在执行查询时会有区别。当过滤条件都与序列无关时,条件的先后顺序不影响查询结果,建议将过滤能力强的条件放前面,这样可以极大的减少后面查询的数据量;当过滤条件包含序列相关(如:deltas, ratios, ffill, move, prev,cumsum等)的条件时,先后顺序会影响查询结果。   and进行连接时,当过滤条件都与序列无关时,系统内部对and进行了优化,即将and转换为“,”,此时,使用and和使用“

2021-11-12 11:18 回答问题

对于2.0引擎,指定databse参数为engine = “OLAP”。 分区:对于不同level的数据,由于数据量大小不同,为保证最佳性能,尽量将数据均匀分区。合理分区的原则:将每个表的每个分区的数据量控制在压缩前100M左右。 针对行情数据,通常可用时间和产品标识两个维度来进行分区。这里对股票和时间字段采用组合分区。 为保证合理的分区粒度: 股票字段:股票数据较为均匀:可以采用哈希分区,随着数据量的增大,哈希分区有利于维护各个分区粒度均匀,拓展性较好。不同股票字段数据量差异大:可以考虑采用范围分