メインコンテンツまでスキップ
バージョン: 4.x

動的パーティショニング

Dynamic partitioningは、事前定義されたルールに従ってローリング方式でパーティションの追加と削除を行い、それによってTableパーティションのライフサイクル(TTL)を管理し、データストレージの圧迫を軽減します。ログ管理や時系列データ管理などのシナリオでは、dynamic partitioningを使用して期限切れのデータをローリング削除することが一般的です。

以下の図は、dynamic partitioningを使用したライフサイクル管理を示しており、次のルールが指定されています:

  • Dynamic partitionスケジューリング単位dynamic_partition.time_unitがDAYに設定され、日単位でパーティションを整理します;
  • Dynamic partition開始オフセットdynamic_partition.startが-1に設定され、1日前からのパーティションを保持します;
  • Dynamic partition終了オフセットdynamic_partition.endが2に設定され、今後2日間のパーティションを保持します。

上記のルールに従って、時間の経過とともに、常に合計4つのパーティションが保持されます:過去の日のパーティション、当日のパーティション、および今後2日間のパーティションです。

dynamic-partition

使用制限

Dynamic partitioningを使用する場合、以下のルールに従う必要があります:

  • Dynamic partitioningはCross-Cluster Replication(CCR)と同時に使用すると失敗します。
  • Dynamic partitioningはDATE/DATETIME列のRangeタイプパーティションのみをサポートします。
  • Dynamic partitioningは単一のパーティションキーのみをサポートします。

Dynamic Partitionの作成

Table作成時に、dynamic_partitionプロパティを指定することでdynamic partitionedTableを作成できます。

CREATE TABLE test_dynamic_partition(
order_id BIGINT,
create_dt DATE,
username VARCHAR(20)
)
DUPLICATE KEY(order_id)
PARTITION BY RANGE(create_dt) ()
DISTRIBUTED BY HASH(order_id) BUCKETS 10
PROPERTIES(
"dynamic_partition.enable" = "true",
"dynamic_partition.time_unit" = "DAY",
"dynamic_partition.start" = "-1",
"dynamic_partition.end" = "2",
"dynamic_partition.prefix" = "p",
"dynamic_partition.create_history_partition" = "true"
);

上記の例では、以下の仕様でdynamicパーティションTableが作成されました。

詳細なdynamic_partitionパラメータについては、Dynamic パーティション Parameter デスクリプションを参照してください。

Dynamicパーティションの管理

Dynamicパーティションプロパティの変更

Tip:

ALTER TABLE文を使用してdynamicパーティショニングを変更する場合、変更は即座には有効になりません。dynamicパーティションはdynamic_partition_check_interval_secondsパラメータで指定された間隔でポーリングおよびチェックされ、必要なパーティションの作成および削除操作を完了します。

以下の例では、ALTER TABLE文を使用してnon-dynamicパーティションTableをdynamicパーティションTableに変更しています:

CREATE TABLE test_dynamic_partition(
order_id BIGINT,
create_dt DATE,
username VARCHAR(20)
)
DUPLICATE KEY(order_id)
DISTRIBUTED BY HASH(order_id) BUCKETS 10;

ALTER TABLE test_partition SET (
"dynamic_partition.enable" = "true",
"dynamic_partition.time_unit" = "DAY",
"dynamic_partition.start" = "-1",
"dynamic_partition.end" = "2",
"dynamic_partition.prefix" = "p",
"dynamic_partition.create_history_partition" = "true"
);

動的パーティション調度状況の確認

SHOW-DYNAMIC-PARTITION を使用して、現在のデータベースにおけるすべての動的パーティションTableの調度状況を確認できます:

SHOW DYNAMIC PARTITION TABLES;
+-----------+--------+----------+-------------+------+--------+---------+-----------+----------------+---------------------+--------+------------------------+----------------------+-------------------------+
| TableName | Enable | TimeUnit | Start | End | Prefix | Buckets | StartOf | LastUpdateTime | LastSchedulerTime | State | LastCreatePartitionMsg | LastDropPartitionMsg | ReservedHistoryPeriods |
+-----------+--------+----------+-------------+------+--------+---------+-----------+----------------+---------------------+--------+------------------------+----------------------+-------------------------+
| d3 | true | WEEK | -3 | 3 | p | 1 | MONDAY | N/A | 2020-05-25 14:29:24 | NORMAL | N/A | N/A | [2021-12-01,2021-12-31] |
| d5 | true | DAY | -7 | 3 | p | 32 | N/A | N/A | 2020-05-25 14:29:24 | NORMAL | N/A | N/A | NULL |
| d4 | true | WEEK | -3 | 3 | p | 1 | WEDNESDAY | N/A | 2020-05-25 14:29:24 | NORMAL | N/A | N/A | NULL |
| d6 | true | MONTH | -2147483648 | 2 | p | 8 | 3rd | N/A | 2020-05-25 14:29:24 | NORMAL | N/A | N/A | NULL |
| d2 | true | DAY | -3 | 3 | p | 32 | N/A | N/A | 2020-05-25 14:29:24 | NORMAL | N/A | N/A | NULL |
| d7 | true | MONTH | -2147483648 | 5 | p | 8 | 24th | N/A | 2020-05-25 14:29:24 | NORMAL | N/A | N/A | NULL |
+-----------+--------+----------+-------------+------+--------+---------+-----------+----------------+---------------------+--------+------------------------+----------------------+-------------------------+
7 rows in set (0.02 sec)

Historical パーティション Management

startend属性を使用してダイナミックパーティションの数を指定する場合、長い待機時間を回避するために、履歴パーティションは一度にすべて作成されません。現在の時刻以降のパーティションのみが作成されます。すべてのパーティションを一度に作成する必要がある場合は、create_history_partitionパラメータを有効にする必要があります。

例えば、現在の日付が2024-10-11で、start = -2およびend = 2を設定した場合:

  • create_history_partition = trueが指定されている場合、すべてのパーティションが即座に作成され、5つのパーティション[10-09, 10-13]が作成されます。
  • create_history_partition = falseが指定されている場合、10-11以降のパーティションのみが作成され、3つのパーティション[10-11, 10-13]が作成されます。

Dynamic Partitionパラメータ説明

Dynamic Partitionプロパティパラメータ

Dynamic Partitionルールパラメータはdynamic_partitionがプレフィックスとして付けられており、以下のルールパラメータで設定できます:

パラメータ必須説明
dynamic_partition.enableNoDynamic Partition機能を有効にするかどうか。TRUEまたはFALSEに設定できます。他の必要なDynamic Partitionパラメータが指定されている場合、デフォルトでTRUEになります。
dynamic_partition.time_unitYesDynamic Partitionスケジューリングの単位。HOURDAYWEEKMONTH、またはYEARに設定でき、それぞれ時間、日、週、月、年単位でのパーティション作成または削除を示します。
dynamic_partition.startNoDynamic Partitionの開始オフセットで、負の数値です。デフォルト値は-2147483648で、履歴パーティションは削除されないことを意味します。time_unit属性に応じて、現在の日(週/月)を基準としたこのオフセット前のパーティションが削除されます。このオフセット後から現在の時刻までの履歴パーティションが作成されるかどうかは、dynamic_partition.create_history_partitionに依存します。
dynamic_partition.endYesDynamic Partitionの終了オフセットで、正の数値です。time_unit属性に応じて、現在の日(週/月)より前の指定された範囲内のパーティションが事前に作成されます。
dynamic_partition.prefixYes動的に作成されるパーティション名のプレフィックス。
dynamic_partition.bucketsNo動的に作成されるパーティションに対応するバケット数。このパラメータを設定すると、DISTRIBUTEDで指定されたバケット数が上書きされます。
dynamic_partition.replication_numNo動的に作成されるパーティションに対応するレプリカ数。指定されない場合、Table作成時に指定されたレプリカ数がデフォルトになります。
dynamic_partition.create_history_partitionNoデフォルトはfalseです。trueに設定すると、Dorisは以下のルールに従ってすべてのパーティションを自動的に作成します。また、FEパラメータmax_dynamic_partition_numは、一度に多数のパーティションを作成することを避けるためにパーティションの総数を制限します。作成されるパーティション数がmax_dynamic_partition_num値を超える場合、操作は禁止されます。start属性が指定されていない場合、このパラメータは効果を持ちません。
dynamic_partition.history_partition_numNocreate_history_partitiontrueに設定されている場合、このパラメータは作成する履歴パーティション数を指定します。デフォルト値は-1で、設定されていないことを意味します。この変数はdynamic_partition.startと同じ機能を持つため、同時に設定するのはどちらか一方のみを推奨します。
dynamic_partition.start_day_of_weekNotime_unitWEEKに設定されている場合、このパラメータは週の開始日を指定します。値の範囲は1から7で、1は月曜日、7は日曜日を表します。デフォルトは1で、週が月曜日から始まることを意味します。
dynamic_partition.start_day_of_monthNotime_unitMONTHに設定されている場合、このパラメータは月の開始日を指定します。値の範囲は1から28で、1は月の初日、28は28日を表します。デフォルトは1で、月が初日から始まることを意味します。29日、30日、または31日からの開始は、うるう年やうるう月による曖昧さを避けるためサポートされていません。
dynamic_partition.reserved_history_periodsNo保持する必要がある履歴パーティションの時間範囲。dynamic_partition.time_unitが"DAY/WEEK/MONTH/YEAR"に設定されている場合、[yyyy-MM-dd,yyyy-MM-dd],[...,...]の形式で設定する必要があります。dynamic_partition.time_unitが"HOUR"に設定されている場合、[yyyy-MM-dd HH:mm:ss,yyyy-MM-dd HH:mm:ss],[...,...]の形式で設定する必要があります。設定されていない場合、デフォルトで"NULL"になります。
dynamic_partition.time_zoneNoDynamic Partitioningのタイムゾーンで、デフォルトはサーバーのシステムタイムゾーン(例:Asia/Shanghai)です。その他のタイムゾーン設定については、Time Zone Managementを参照してください。

FE設定パラメータ

FEのDynamic Partitionパラメータ設定は、FE設定ファイルまたはADMIN SET FRONTEND CONFIGコマンドで変更できます:

パラメータデフォルト値説明
dynamic_partition_enablefalseDorisのDynamic Partition機能を有効にするかどうか。このパラメータはDynamic PartitionTableのパーティション操作にのみ影響し、通常のTableには影響しません。
dynamic_partition_check_interval_seconds600Dynamic Partitionスレッドの実行頻度(秒単位)。
max_dynamic_partition_num500Dynamic PartitionTable作成時に作成可能なパーティションの最大数を制限し、一度に多数のパーティションを作成することを避けます。

Dynamic パーティション ベストプラクティス

例1:日単位でパーティション化し、過去7日間と現在日のパーティションを保持し、今後3日間のパーティションを事前作成する。

CREATE TABLE tbl1 (
order_id BIGINT,
create_dt DATE,
username VARCHAR(20)
)
PARTITION BY RANGE(create_dt) ()
DISTRIBUTED BY HASH(create_dt)
PROPERTIES (
"dynamic_partition.enable" = "true",
"dynamic_partition.time_unit" = "DAY",
"dynamic_partition.start" = "-7",
"dynamic_partition.end" = "3",
"dynamic_partition.prefix" = "p",
"dynamic_partition.buckets" = "32"
);

例2: 月単位でパーティション分割し、履歴パーティションは削除せず、次の2か月分のパーティションを事前作成します。さらに、各月の開始日を3日に設定します。

CREATE TABLE tbl1 (
order_id BIGINT,
create_dt DATE,
username VARCHAR(20)
)
PARTITION BY RANGE(create_dt) ()
DISTRIBUTED BY HASH(create_dt)
PROPERTIES (
"dynamic_partition.enable" = "true",
"dynamic_partition.time_unit" = "MONTH",
"dynamic_partition.end" = "2",
"dynamic_partition.prefix" = "p",
"dynamic_partition.buckets" = "8",
"dynamic_partition.start_day_of_month" = "3"
);

例3:日単位でパーティション化し、過去10日間と今後10日間のパーティションを保持し、期間[2020-06-01, 2020-06-20]と[2020-10-31, 2020-11-15]の履歴データを保持する。

CREATE TABLE tbl1 (
order_id BIGINT,
create_dt DATE,
username VARCHAR(20)
)
PARTITION BY RANGE(create_dt) ()
DISTRIBUTED BY HASH(create_dt)
PROPERTIES (
"dynamic_partition.enable" = "true",
"dynamic_partition.time_unit" = "DAY",
"dynamic_partition.start" = "-10",
"dynamic_partition.end" = "10",
"dynamic_partition.prefix" = "p",
"dynamic_partition.buckets" = "8",
"dynamic_partition.reserved_history_periods"="[2020-06-01,2020-06-20],[2020-10-31,2020-11-15]"
);