動的パーティショニング
Dynamic partitioningは、事前定義されたルールに従ってローリング方式でパーティションの追加と削除を行い、それによってTableパーティションのライフサイクル(TTL)を管理し、データストレージの圧迫を軽減します。ログ管理や時系列データ管理などのシナリオでは、dynamic partitioningを使用して期限切れのデータをローリング削除することが一般的です。
以下の図は、dynamic partitioningを使用したライフサイクル管理を示しており、次のルールが指定されています:
- Dynamic partitionスケジューリング単位
dynamic_partition.time_unitがDAYに設定され、日単位でパーティションを整理します; - Dynamic partition開始オフセット
dynamic_partition.startが-1に設定され、1日前からのパーティションを保持します; - Dynamic partition終了オフセット
dynamic_partition.endが2に設定され、今後2日間のパーティションを保持します。
上記のルールに従って、時間の経過とともに、常に合計4つのパーティションが保持されます:過去の日のパーティション、当日のパーティション、および今後2日間のパーティションです。

使用制限
Dynamic partitioningを使用する場合、以下のルールに従う必要があります:
- Dynamic partitioningはCross-Cluster Replication(CCR)と同時に使用すると失敗します。
- Dynamic partitioningはDATE/DATETIME列のRangeタイプパーティションのみをサポートします。
- Dynamic partitioningは単一のパーティションキーのみをサポートします。
Dynamic Partitionの作成
Table作成時に、dynamic_partitionプロパティを指定することでdynamic partitionedTableを作成できます。
CREATE TABLE test_dynamic_partition(
order_id BIGINT,
create_dt DATE,
username VARCHAR(20)
)
DUPLICATE KEY(order_id)
PARTITION BY RANGE(create_dt) ()
DISTRIBUTED BY HASH(order_id) BUCKETS 10
PROPERTIES(
"dynamic_partition.enable" = "true",
"dynamic_partition.time_unit" = "DAY",
"dynamic_partition.start" = "-1",
"dynamic_partition.end" = "2",
"dynamic_partition.prefix" = "p",
"dynamic_partition.create_history_partition" = "true"
);
上記の例では、以下の仕様でdynamicパーティションTableが作成されました。
詳細なdynamic_partitionパラメータについては、Dynamic パーティション Parameter デスクリプションを参照してください。
Dynamicパーティションの管理
Dynamicパーティションプロパティの変更
ALTER TABLE文を使用してdynamicパーティショニングを変更する場合、変更は即座には有効になりません。dynamicパーティションはdynamic_partition_check_interval_secondsパラメータで指定された間隔でポーリングおよびチェックされ、必要なパーティションの作成および削除操作を完了します。
以下の例では、ALTER TABLE文を使用してnon-dynamicパーティションTableをdynamicパーティションTableに変更しています:
CREATE TABLE test_dynamic_partition(
order_id BIGINT,
create_dt DATE,
username VARCHAR(20)
)
DUPLICATE KEY(order_id)
DISTRIBUTED BY HASH(order_id) BUCKETS 10;
ALTER TABLE test_partition SET (
"dynamic_partition.enable" = "true",
"dynamic_partition.time_unit" = "DAY",
"dynamic_partition.start" = "-1",
"dynamic_partition.end" = "2",
"dynamic_partition.prefix" = "p",
"dynamic_partition.create_history_partition" = "true"
);
動的パーティション調度状況の確認
SHOW-DYNAMIC-PARTITION を使用して、現在のデータベースにおけるすべての動的パーティションTableの調度状況を確認できます:
SHOW DYNAMIC PARTITION TABLES;
+-----------+--------+----------+-------------+------+--------+---------+-----------+----------------+---------------------+--------+------------------------+----------------------+-------------------------+
| TableName | Enable | TimeUnit | Start | End | Prefix | Buckets | StartOf | LastUpdateTime | LastSchedulerTime | State | LastCreatePartitionMsg | LastDropPartitionMsg | ReservedHistoryPeriods |
+-----------+--------+----------+-------------+------+--------+---------+-----------+----------------+---------------------+--------+------------------------+----------------------+-------------------------+
| d3 | true | WEEK | -3 | 3 | p | 1 | MONDAY | N/A | 2020-05-25 14:29:24 | NORMAL | N/A | N/A | [2021-12-01,2021-12-31] |
| d5 | true | DAY | -7 | 3 | p | 32 | N/A | N/A | 2020-05-25 14:29:24 | NORMAL | N/A | N/A | NULL |
| d4 | true | WEEK | -3 | 3 | p | 1 | WEDNESDAY | N/A | 2020-05-25 14:29:24 | NORMAL | N/A | N/A | NULL |
| d6 | true | MONTH | -2147483648 | 2 | p | 8 | 3rd | N/A | 2020-05-25 14:29:24 | NORMAL | N/A | N/A | NULL |
| d2 | true | DAY | -3 | 3 | p | 32 | N/A | N/A | 2020-05-25 14:29:24 | NORMAL | N/A | N/A | NULL |
| d7 | true | MONTH | -2147483648 | 5 | p | 8 | 24th | N/A | 2020-05-25 14:29:24 | NORMAL | N/A | N/A | NULL |
+-----------+--------+----------+-------------+------+--------+---------+-----------+----------------+---------------------+--------+------------------------+----------------------+-------------------------+
7 rows in set (0.02 sec)
Historical パーティション Management
startとend属性を使用してダイナミックパーティションの数を指定する場合、長い待機時間を回避するために、履歴パーティションは一度にすべて作成されません。現在の時刻以降のパーティションのみが作成されます。すべてのパーティションを一度に作成する必要がある場合は、create_history_partitionパラメータを有効にする必要があります。
例えば、現在の日付が2024-10-11で、start = -2およびend = 2を設定した場合:
create_history_partition = trueが指定されている場合、すべてのパーティションが即座に作成され、5つのパーティション[10-09, 10-13]が作成されます。create_history_partition = falseが指定されている場合、10-11以降のパーティションのみが作成され、3つのパーティション[10-11, 10-13]が作成されます。
Dynamic Partitionパラメータ説明
Dynamic Partitionプロパティパラメータ
Dynamic Partitionルールパラメータはdynamic_partitionがプレフィックスとして付けられており、以下のルールパラメータで設定できます:
| パラメータ | 必須 | 説明 |
|---|---|---|
dynamic_partition.enable | No | Dynamic Partition機能を有効にするかどうか。TRUEまたはFALSEに設定できます。他の必要なDynamic Partitionパラメータが指定されている場合、デフォルトでTRUEになります。 |
dynamic_partition.time_unit | Yes | Dynamic Partitionスケジューリングの単位。HOUR、DAY、WEEK、MONTH、またはYEARに設定でき、それぞれ時間、日、週、月、年単位でのパーティション作成または削除を示します。 |
dynamic_partition.start | No | Dynamic Partitionの開始オフセットで、負の数値です。デフォルト値は-2147483648で、履歴パーティションは削除されないことを意味します。time_unit属性に応じて、現在の日(週/月)を基準としたこのオフセット前のパーティションが削除されます。このオフセット後から現在の時刻までの履歴パーティションが作成されるかどうかは、dynamic_partition.create_history_partitionに依存します。 |
dynamic_partition.end | Yes | Dynamic Partitionの終了オフセットで、正の数値です。time_unit属性に応じて、現在の日(週/月)より前の指定された範囲内のパーティションが事前に作成されます。 |
dynamic_partition.prefix | Yes | 動的に作成されるパーティション名のプレフィックス。 |
dynamic_partition.buckets | No | 動的に作成されるパーティションに対応するバケット数。このパラメータを設定すると、DISTRIBUTEDで指定されたバケット数が上書きされます。 |
dynamic_partition.replication_num | No | 動的に作成されるパーティションに対応するレプリカ数。指定されない場合、Table作成時に指定されたレプリカ数がデフォルトになります。 |
dynamic_partition.create_history_partition | No | デフォルトはfalseです。trueに設定すると、Dorisは以下のルールに従ってすべてのパーティションを自動的に作成します。また、FEパラメータmax_dynamic_partition_numは、一度に多数のパーティションを作成することを避けるためにパーティションの総数を制限します。作成されるパーティション数がmax_dynamic_partition_num値を超える場合、操作は禁止されます。start属性が指定されていない場合、このパラメータは効果を持ちません。 |
dynamic_partition.history_partition_num | No | create_history_partitionがtrueに設定されている場合、このパラメータは作成する履歴パーティション数を指定します。デフォルト値は-1で、設定されていないことを意味します。この変数はdynamic_partition.startと同じ機能を持つため、同時に設定するのはどちらか一方のみを推奨します。 |
dynamic_partition.start_day_of_week | No | time_unitがWEEKに設定されている場合、このパラメータは週の開始日を指定します。値の範囲は1から7で、1は月曜日、7は日曜日を表します。デフォルトは1で、週が月曜日から始まることを意味します。 |
dynamic_partition.start_day_of_month | No | time_unitがMONTHに設定されている場合、このパラメータは月の開始日を指定します。値の範囲は1から28で、1は月の初日、28は28日を表します。デフォルトは1で、月が初日から始まることを意味します。29日、30日、または31日からの開始は、うるう年やうるう月による曖昧さを避けるためサポートされていません。 |
dynamic_partition.reserved_history_periods | No | 保持する必要がある履歴パーティションの時間範囲。dynamic_partition.time_unitが"DAY/WEEK/MONTH/YEAR"に設定されている場合、[yyyy-MM-dd,yyyy-MM-dd],[...,...]の形式で設定する必要があります。dynamic_partition.time_unitが"HOUR"に設定されている場合、[yyyy-MM-dd HH:mm:ss,yyyy-MM-dd HH:mm:ss],[...,...]の形式で設定する必要があります。設定されていない場合、デフォルトで"NULL"になります。 |
dynamic_partition.time_zone | No | Dynamic Partitioningのタイムゾーンで、デフォルトはサーバーのシステムタイムゾーン(例:Asia/Shanghai)です。その他のタイムゾーン設定については、Time Zone Managementを参照してください。 |
FE設定パラメータ
FEのDynamic Partitionパラメータ設定は、FE設定ファイルまたはADMIN SET FRONTEND CONFIGコマンドで変更できます:
| パラメータ | デフォルト値 | 説明 |
|---|---|---|
dynamic_partition_enable | false | DorisのDynamic Partition機能を有効にするかどうか。このパラメータはDynamic PartitionTableのパーティション操作にのみ影響し、通常のTableには影響しません。 |
dynamic_partition_check_interval_seconds | 600 | Dynamic Partitionスレッドの実行頻度(秒単位)。 |
max_dynamic_partition_num | 500 | Dynamic PartitionTable作成時に作成可能なパーティションの最大数を制限し、一度に多数のパーティションを作成することを避けます。 |
Dynamic パーティション ベストプラクティス
例1:日単位でパーティション化し、過去7日間と現在日のパーティションを保持し、今後3日間のパーティションを事前作成する。
CREATE TABLE tbl1 (
order_id BIGINT,
create_dt DATE,
username VARCHAR(20)
)
PARTITION BY RANGE(create_dt) ()
DISTRIBUTED BY HASH(create_dt)
PROPERTIES (
"dynamic_partition.enable" = "true",
"dynamic_partition.time_unit" = "DAY",
"dynamic_partition.start" = "-7",
"dynamic_partition.end" = "3",
"dynamic_partition.prefix" = "p",
"dynamic_partition.buckets" = "32"
);
例2: 月単位でパーティション分割し、履歴パーティションは削除せず、次の2か月分のパーティションを事前作成します。さらに、各月の開始日を3日に設定します。
CREATE TABLE tbl1 (
order_id BIGINT,
create_dt DATE,
username VARCHAR(20)
)
PARTITION BY RANGE(create_dt) ()
DISTRIBUTED BY HASH(create_dt)
PROPERTIES (
"dynamic_partition.enable" = "true",
"dynamic_partition.time_unit" = "MONTH",
"dynamic_partition.end" = "2",
"dynamic_partition.prefix" = "p",
"dynamic_partition.buckets" = "8",
"dynamic_partition.start_day_of_month" = "3"
);
例3:日単位でパーティション化し、過去10日間と今後10日間のパーティションを保持し、期間[2020-06-01, 2020-06-20]と[2020-10-31, 2020-11-15]の履歴データを保持する。
CREATE TABLE tbl1 (
order_id BIGINT,
create_dt DATE,
username VARCHAR(20)
)
PARTITION BY RANGE(create_dt) ()
DISTRIBUTED BY HASH(create_dt)
PROPERTIES (
"dynamic_partition.enable" = "true",
"dynamic_partition.time_unit" = "DAY",
"dynamic_partition.start" = "-10",
"dynamic_partition.end" = "10",
"dynamic_partition.prefix" = "p",
"dynamic_partition.buckets" = "8",
"dynamic_partition.reserved_history_periods"="[2020-06-01,2020-06-20],[2020-10-31,2020-11-15]"
);