Juntao Wang 的回答 - DolphinDB问答社区

0 赞同

查询Count总数，与分段查询Count数目再求和结果不一致。

请确认下，11:35 之后没数据了吗？

回答于 2021-10-16 11:19

1 赞同

查询最新一条数据的时间慢，如何优化？

因为TradingDate在分布式表中是以升序存储，如果数据量大的话，使用order by做个降序排列会比较耗时。可以使用context by + limit -1，取每只股票最新时间。 timer result = select * from t1 where TradingDate between 2015.12.20 : 2016.01.20 context by Symbol order by TradingDate limit -1 或者，使用last函数...

回答于 2021-10-16 11:18

0 赞同

如何合并两张表中有值的列，无值的空列也要保留？

可以以表1作为最终结果模板，因为表1除了Timestamp列均为空，可以将表1比表2多出来的列取出，再添加到表2，并调整顺序。示例代码如下： Timestamp = 2014.01.06T09:30:03.000 2014.01.06T09:30:06.000 2014.01.06T09:30:09.000 2014.01.06T09:30:12.000 2014.01.06T09:30:15.000 2014.01.06T09:30:18.000 2014.01.06T09:30...

回答于 2021-10-16 11:15

0 赞同

使用Kafka插件时，Kafka带有kerberos认证的，如何配置kerberos认...

Kafka 插件教程中有个例子，可以参照这种写法。 Kerberos 相关字段名可以参照教程中链接查询。Kafka 插件教程：kafka/README.md · dolphindb/DolphinDBPlugin - Gitee

回答于 2021-10-06 22:06

0 赞同

因子计算速度很慢，如何使用并行计算提速？

可以使用分区内存表并行加速，代码优化如下： def alpha147SQL(vector) { ... } input = select tradingdate, symbol, closeprice from loadTable("dfs://shenwan", "level2") where tradingdate = 2020.01.02 db = database("", HASH, [SYMBOL, 20]) pt = db.createPartitionedTable(input, "input", `symbol) pt.appen...

回答于 2021-10-06 21:46

0 赞同

HDF5 Plugin读取h5文件，return -1

我们测试了下，使用HDF 官方HDFView 也无法打开您给的h5 文件。 pandas 会用特殊格式保存dataframe 到h5，建议在to_hdf5()函数内加上参数format="table", data_columns=True 生成通用的h5文件再尝试下。这里有些相关讨论，您可以看下：https://stackoverflow.com/questions/30773073/save-pandas-dataframe-using-h5py-fo...

回答于 2021-09-21 13:52

0 赞同

Dolphin如何计算Alpha 147因子？

def olss(x, y) { return ols(x, y)[1] } def alpha147SQL(vector) { n = 12 sequence = 1..n mean_12 = mavg(vector, 12) return moving(olss{, sequence}, mean_12, 12) } pt = select tradingdate, symbol, closeprice from loadTable("dfs://test", "test") where tradingdate = 2021.01.02 alpha147DDBSql = se...

回答于 2021-09-21 13:48

0 赞同

ploadText返回的顺序分区内存表中数据顺序与CSV文件中是否一致？

ploadText导入后的顺序与CSV文件一致的。如果CSV文件中数据是按Time列递增，导入后可以使用 isMonotonicIncreasing() 函数验证下。

回答于 2021-09-10 20:44

0 赞同

备份时GUI显示完成，Server报错tcmalloc: allocation failed 139...

控制台打印没有时间戳，难以确定是否是备份时报的这个错误。确认是否成功备份的话可以使用loadBackup 这个函数验证一下。

回答于 2021-09-10 20:42

0 赞同

plot函数绘制一个几百万数据量的向量，图出不来？

可以先做个聚合计算。通常绘图组件不会绘制几百万的数据量，这样下载数据和渲染数据都会耗费非常大量的时间，常规做法是将数据源降精度，比如将秒级数据降为分钟数据。 timer avgSpread = select avg((ofr-bid)/(ofr+bid)*2) as avgSpread from quotes where date=2007.08.31, symbol=`LEH, time between 09:30:00 : 15:...

回答于 2021-09-10 20:40

254 个回答