CREATE ASYNC MATERIALIZED VIEW
デスクリプション
非同期マテリアライズドビューを作成するためのステートメントです。カラム名と型はマテリアライズドビューのSQLステートメントから導出されます。カスタムカラム名は許可されていますが、カラム型を定義することはできません。
Syntax
CREATE MATERIALIZED VIEW
[ IF NOT EXISTS ] <materialized_view_name>
[ (<columns_definition>) ]
[ BUILD <build_mode> ]
[ REFRESH <refresh_method> [<refresh_trigger>]]
[ [DUPLICATE] KEY (<key_cols>) ]
[ COMMENT '<table_comment>' ]
[ PARTITION BY (
{ <partition_col>
| DATE_TRUNC(<partition_col>, <partition_unit>) }
)]
[ DISTRIBUTED BY { HASH (<distribute_cols>) | RANDOM }
[ BUCKETS { <bucket_count> | AUTO } ]
]
[ PROPERTIES (
-- Table property
<table_property>
-- Additional table properties
[ , ... ])
]
AS <query>
どこで:
columns_definition
: -- Column definition
<col_name>
[ COMMENT '<col_comment>' ]
refresh_trigger
: ON MANUAL
| ON SCHEDULE EVERY <int_value> <refresh_unit> [ STARTS '<start_time>']
| ON COMMIT
必須パラメータ
1. <materialized_view_name>
マテリアライズドビューの識別子(名前)を指定します。Tableが作成されるデータベース内で一意である必要があります。
識別子は文字から始まる必要があり(Unicode名前サポートが有効な場合、任意の言語の任意の文字を使用可能)、識別子文字列全体がバッククォートで囲まれていない限り(例:
My Object)、スペースや特殊文字を含むことはできません。識別子は予約キーワードにはできません。
詳細については、識別子と予約キーワードの要件を参照してください。
2. <query>
マテリアライズドビューを作成する際の必須パラメータです。データを投入するSELECT文を指定します。
オプションパラメータ
1. <key_cols>
Tableのキーカラムです。Dorisでは、キーカラムはTableの最初のK列である必要があります。キー制限とキーカラムの選択方法の詳細については、「データモデル」章の該当セクションを参照してください。
2. <build_mode>
更新タイミング:マテリアライズドビューを作成後すぐに更新するかどうかです。
IMMEDIATE:即座に更新します。デフォルトはIMMEDIATEです。
DEFERRED:遅延更新です。
3. <refresh_method>
更新方法:
COMPLETE:すべてのパーティションを更新します。
AUTO:増分更新を試行し、前回のマテリアライズドビュー更新以降に変更されたパーティションのみを更新します。増分更新ができない場合、すべてのパーティションが更新されます。
パーティション化されたマテリアライズドビューがCOMPLETE更新モードを使用する場合、すべてのパーティションデータの完全更新を実行し、実質的に非パーティション化マテリアライズドビューに退化します。
4. <refresh_trigger>
トリガー方法:
MANUAL:手動更新です。
ON SCHEDULE:スケジュール更新です。
ON COMMIT:トリガー更新で、ベースTableデータの変更がマテリアライズドビューの更新をトリガーします。
5. <refresh_unit>
定期更新の時間単位です。現在サポートされている単位は、MINUTE、HOUR、DAY、WEEKです。
6. <partition_col>
PARTITION BYが指定されていない場合、デフォルトで1つのパーティションのみが存在します。
パーティションフィールドが指定されている場合、そのフィールドがどのベースTable由来かを自動的に推論し、ベースTableと同期します(現在、内部TableとHiveTableをサポート)。内部Tableの場合、パーティションフィールドは1つのみ許可されます。
マテリアライズドビューは、パーティションロールアップを通じてパーティション数を削減することもできます。現在、パーティションロールアップ機能は
date_truncをサポートしています。
7. <partition_unit>
パーティションロールアップの集約粒度です。現在サポートされている単位は、HOUR、DAY、WEEK、QUARTER、MONTH、YEARです。
8. <start_time>
スケジュール開始時刻は将来、つまり現在時刻より後の時刻である必要があります。
9. <table_property>
内部Tableで使用されるプロパティで、その大部分はマテリアライズドビューで使用でき、マテリアライズドビュー固有のプロパティも含まれます。以下に一覧を示します:
| プロパティ名 | 説明 |
|---|---|
| grace_period | クエリ書き換え時にマテリアライズドビューデータに許可される最大遅延秒数です。マテリアライズドビューのパーティションAとベースTableデータが不整合で、パーティションAの最後の更新時刻が10:15:00、現在のシステム時刻が10:15:08の場合、このパーティションは透過的に書き換えられません。しかし、grace_periodが10に設定されている場合、このパーティションは透過的書き換えに使用されます。 |
| excluded_trigger_tables | データ更新時に無視するTable名をカンマ区切りで指定します。例:table1,table2。 |
| refresh_partition_num | 1つのINSERT文で更新されるパーティション数で、デフォルトは1です。マテリアライズドビューを更新する際、まず更新対象のパーティションリストを計算し、複数のINSERT文に分割して順次実行します。INSERT文が失敗した場合、タスク全体が停止します。マテリアライズドビューは1つのINSERT文の原子性を保証し、失敗したINSERTは既に正常に更新されたパーティションには影響しません。 |
| workload_group | マテリアライズドビューが更新タスクを実行する際に使用するworkload_groupの名前です。これは、マテリアライズドビューがデータ更新時に使用するリソースを制限し、他のビジネス操作への影響を回避するために使用されます。workload_groupの作成と使用の詳細については、WORKLOAD-GROUPドキュメントを参照してください。 |
| partition_sync_limit | ベースTableのパーティションフィールドが時間型の場合、このプロパティをpartition_sync_time_unitと組み合わせて使用し、ベースTableと同期するパーティションの範囲を設定できます。例えば、2に設定しpartition_sync_time_unitをMONTHに設定すると、ベースTableの過去2か月のパーティションとデータのみが同期されます。最小値は1です。時間の経過とともに、マテリアライズドビューは更新のたびに自動的にパーティションを追加・削除します。例えば、マテリアライズドビューに現在2月と3月のデータがある場合、来月には自動的に2月のデータを削除し、4月のデータを追加します。 |
| partition_sync_time_unit | パーティション更新の時間単位で、DAY/MONTH/YEAR(デフォルトはDAY)をサポートします。 |
| partition_date_format | ベースTableのパーティションフィールドが文字列型の場合、partition_sync_limit機能を使用したい場合は、日付フォーマットを設定してpartition_date_format設定に従ってパーティション時刻を解析できます。 |
| enable_nondeterministic_function | マテリアライズドビュー定義SQLに非決定的関数(current_date()、now()、random()など)を含めることを許可するかどうかです。trueに設定すると含めることを許可し、そうでなければ許可しません。デフォルトは許可しません。 |
| use_for_rewrite | このマテリアライズドビューが透過的書き換えに参加するかどうかを示します。falseに設定すると透過的書き換えに参加しません。デフォルトはtrueです。データモデリングシナリオで、マテリアライズドビューが直接クエリにのみ使用される場合、このプロパティを設定することで、マテリアライズドビューが透過的書き換えに参加せず、クエリ応答速度を向上させることができます。 |
DISTRIBUTED BY句はApache Doris 2.1.10より前では必須です - 省略するとエラーが発生します。 Apache Doris 2.1.10以降、指定されていない場合、デフォルトの分散はRANDOMになります。
Apache Doris 2.1.10/3.0.6より前では、excluded_trigger_tablesプロパティはベースTable名の指定のみをサポートしていました。 これらのバージョン以降、CatalogとDatabaseを含む完全修飾Table名(例:internal.db1.table1)をサポートしています。
アクセス制御要件
このSQLコマンドを実行するユーザーは、少なくとも以下の権限を持つ必要があります:
| 権限 | オブジェクト | 備考 |
|---|---|---|
| CREATE_PRIV | Database | |
| SELECT_PRIV | Table, View | <query>でクエリされるTableやビューに対するSELECT_PRIV権限が必要 |
注意事項
-
マテリアライズドビューDMLおよびDDL制限:
マテリアライズドビューは、列の型変更、列の追加・削除などのスキーマ変更操作をサポートしません。列はマテリアライズドビュー定義SQLから派生するためです。
マテリアライズドビューは手動のinsert intoやinsert overwrite操作をサポートしません。
-
パーティション化マテリアライズドビューの作成条件:
マテリアライズドビューのSQL定義とパーティションフィールドは、パーティション化増分更新を実行するために以下の条件を満たす必要があります:
- マテリアライズドビューで使用されるベースTableの少なくとも1つがパーティションTableである必要があります。
- マテリアライズドビューで使用されるパーティション化ベースTableは、ListまたはRangeパーティション戦略を使用する必要があります。
- マテリアライズドビュー定義SQLのPartition By句にはパーティションフィールドを1つのみ含めることができます。
- マテリアライズドビューSQLのPartition By句のパーティションフィールドは、Select句の後に出現する必要があります。
- マテリアライズドビュー定義SQLでGroup Byを使用する場合、パーティションフィールドはGroup By句の後に出現する必要があります。
- マテリアライズドビュー定義SQLでWindow関数を使用する場合、パーティションフィールドはPartition By句の後に出現する必要があります。
- データ変更はパーティションTableで発生する必要があります。非パーティションTableで発生した場合、マテリアライズドビューは完全ビルドが必要です。
- マテリアライズドビューがJoinのNULL生成側のフィールドをパーティションフィールドとして使用する場合、パーティション化増分更新を実行できません。例えば、LEFT OUTER JOINの場合、パーティションフィールドは右側ではなく左側にある必要があります。
例
- 非パーティション化マテリアライズドビュー
CREATE MATERIALIZED VIEW complete_mv (
orderdate COMMENT 'Order date',
orderkey COMMENT 'Order key',
partkey COMMENT 'Part key'
)
BUILD IMMEDIATE
REFRESH AUTO
ON SCHEDULE EVERY 1 DAY STARTS '2024-12-01 20:30:00'
DISTRIBUTED BY HASH (orderkey) BUCKETS 2
PROPERTIES
("replication_num" = "1")
AS
SELECT
o_orderdate,
l_orderkey,
l_partkey
FROM
orders
LEFT JOIN lineitem ON l_orderkey = o_orderkey
LEFT JOIN partsupp ON ps_partkey = l_partkey
and l_suppkey = ps_suppkey;
- Partitioned Materialized View
以下に示すように、パーティション列が指定されている場合、システムは自動的にその列がどのベースTableから来ているかを識別し、ベースTableのパーティションを同期します。ベースTableは日単位でパーティション化されています(パーティション列:o_orderdate、パーティションタイプ:RANGE)。materialized viewは月単位でパーティション化され、DATE_TRUNC関数を使用してベースTableのパーティションを月単位でロールアップします。
CREATE TABLE IF NOT EXISTS orders (
o_orderkey integer not null,
o_custkey integer not null,
o_orderstatus char(1) not null,
o_totalprice decimalv3(15,2) not null,
o_orderdate date not null,
o_orderpriority char(15) not null,
o_clerk char(15) not null,
o_shippriority integer not null,
o_comment varchar(79) not null
)
DUPLICATE KEY(o_orderkey, o_custkey)
PARTITION BY RANGE(o_orderdate)(
FROM ('2023-10-16') TO ('2023-11-30') INTERVAL 1 DAY
)
DISTRIBUTED BY HASH(o_orderkey) BUCKETS 3
PROPERTIES (
"replication_num" = "3"
);
CREATE MATERIALIZED VIEW partition_mv
BUILD IMMEDIATE
REFRESH AUTO
ON SCHEDULE EVERY 1 DAY STARTS '2024-12-01 20:30:00'
PARTITION BY (DATE_TRUNC(o_orderdate, 'MONTH'))
DISTRIBUTED BY HASH (l_orderkey) BUCKETS 2
PROPERTIES
("replication_num" = "3")
AS
SELECT
o_orderdate,
l_orderkey,
l_partkey
FROM
orders
LEFT JOIN lineitem ON l_orderkey = o_orderkey
LEFT JOIN partsupp ON ps_partkey = l_partkey
and l_suppkey = ps_suppkey;
以下の例では、パーティション列が非date_trunc関数を使用しているため、パーティション化されたマテリアライズドビューを作成できません。エラーメッセージは次のとおりです: because column to check use invalid implicit expression, invalid expression is min(o_orderdate#4)
CREATE MATERIALIZED VIEW partition_mv_2
BUILD IMMEDIATE
REFRESH AUTO
ON SCHEDULE EVERY 1 DAY STARTS '2024-12-01 20:30:00'
PARTITION BY (DATE_TRUNC(min_orderdate, 'MONTH'))
DISTRIBUTED BY HASH (l_orderkey) BUCKETS 2
PROPERTIES
("replication_num" = "3")
AS
SELECT
min(o_orderdate) AS min_orderdate,
l_orderkey,
l_partkey
FROM
orders
LEFT JOIN lineitem ON l_orderkey = o_orderkey
LEFT JOIN partsupp ON ps_partkey = l_partkey
and l_suppkey = ps_suppkey
GROUP BY
o_orderdate,
l_orderkey,
l_partkey;
- Materialized View プロパティの変更 ALTER MATERIALIZED VIEW ステートメントを使用します。
例:
ALTER MATERIALIZED VIEW partition_mv
SET (
"grace_period" = "10",
"excluded_trigger_tables" = "lineitem,partsupp"
);
- マテリアライズドビューのリフレッシュモードの変更 ALTER MATERIALIZED VIEW文を使用します。 例:
ALTER MATERIALIZED VIEW partition_mv REFRESH COMPLETE;
After running SHOW CREATE MATERIALIZED VIEW partition_mv;, you can see that the refresh mode has been changed to COMPLETE.