现在有张表需要对字段数据类型进行变更,但是表的数据量又比较大,内存放不下,有没有什么好办法
可不可以增加列然后删除列,或者直接修改列的类型?
修改分布式表的列类型,这个暂时不支持。有replaceColumn函数,但是不支持分布式表。
可以通过addColumn方式给分布式表增加新的数据列,但是暂时没有计划支持,删除分布式表的某一列。
drop某一列,虽然使用频率低,但是要做到读写隔离,而且还需要锁定所有chunk,修改tbl元数据等,比较复杂,暂时不支持。
这个可以通过提交任务,每个任务读取一个分区的数据,然后对内存表进行修改,再保存到新的分布式表中。