可以用字典实现,将表B读到内存里用字典存起来,用id做字典的key。具体实现示例如下: // 模拟表A,表B n = 5000 tableB = table("no."+string(1..n) as `id, rand(1..10, n) as value) rowA = 100000000 rowA = 100000000 tableA = table(rand("no."+string(1..n), rowA) as `id, rand(1..100000, rowA) as `col1, rand(1...
回答于 2021-11-28 18:32
DolphinDB函数体内只能引用函数参数和函数内的局部变量,不能使用函数体外定义的变量,可以使用共享表。所以candidates2这个变量要么你作为参数传进去,要么在函数里面定义。 方法1:给append_plan函数增加一个参数,比如filters,调用函数时filters位置填candidates2 def append_plan(csEngine1,msg,filters){ ... }...
回答于 2021-11-28 16:26
目前可以用DolphinDB插件来调用python的功能模块,包括自己写的自定义函数。请参考DolphinDB Py Plugin教程 https://gitee.com/dolphindb/DolphinDBPlugin/blob/master/py/README.md 另外,dolphindb明年3月份会推出beta版本,原生支持用python语言来操控DolphinDB的数据分析场景。
回答于 2021-11-25 11:45
提高写入效率的建议 1、提高网速。分布式系统的数据写入过程中有很多网络传输过程,建议至少万兆以太网,以避免网络延迟过高。 2、批量写入,不建议单条写入。因为单条记录写入也要把所有过程都进行一遍,延迟就会高,比如写log、打开一个事务、多个来回的网络传输等等,这些都是无法避免的开销,只有在写数据的那一步...
回答于 2021-11-25 11:16