如何把csv中的datetime和毫秒数2列合并成timestamp并导入到分布式表里

csv有两个字段,insert_time和mills,insert_time的数据格式是2020-01-01 12:30:00,mills是整数,记录的是毫秒数,
用loadTextEx导入csv时怎么把这两个字段合并成TIMESTAMP导入到表里?

请先 登录 后评论

1 个回答

wale

我写了一个简单的 demo供参考:

db = database("dfs://testdb", VALUE, 2022.01.01..2022.01.03)
t = table(1:0, [`time], [TIMESTAMP])
createPartitionedTable(dbHandle=db, table=t, tableName=`pt1, partitionColumns=`time)
s = extractTextSchema("D:/data/data1.csv")
update s set type="TIMESTAMP" where name = `a
loadTextEx(db, `pt1, `time, "D:/data/data1.csv", schema=s, transform=def(t):table(t.a+t.b as time))
select * from loadTable(db, `pt1)


csv 文件就是两列

a, b
2023.01.01 12:00:00, 120
请先 登录 后评论