Python API 如何创建按年分区的数据库

  我按年分区的创库语句如下,但是似乎创建出来的数据库依旧是按天分区的

def create_database(self) :

self.partition_value_array = np.array(pd.date_range(start = "20141231", end = "20241201", freq = "Y"), dtype="datetime64[D]")

self.current_database_path = "dfs://database_1"
self.current_database_name = "dfs_database_1"

if self.current_session.existsDatabase(self.current_database_path) :

self.current_session.dropDatabase(self.current_database_path)

self.current_dfs_database = self.current_session.database(dbName = self.current_database_name, partitionType = ddb.settings.VALUE, partitions = self.partition_value_array, dbPath = self.current_database_path)
请先 登录 后评论

1 个回答

Polly

VALUE 是值分区,默认自动拓展,因此您的脚本实际是按天分区的。可以参考以下脚本,按年分区:

yearRange = np.array(pd.date_range(start='2011-01-01', periods=10, freq='12M'), dtype="datetime64[M]")
db = s.database(dbName='mydb', partitionType=keys.RANGE, partitions=yearRange, dbPath="dfs://testdb")
请先 登录 后评论