CREATE ASYNC MATERIALIZED VIEW
デスクリプション
非同期マテリアライズドビューを作成するためのステートメントです。カラム名と型は、マテリアライズドビューのSQLステートメントから導出されます。カスタムカラム名は許可されていますが、カラム型を定義することはできません。
Syntax
CREATE MATERIALIZED VIEW
[ IF NOT EXISTS ] <materialized_view_name>
[ (<columns_definition>) ]
[ BUILD <build_mode> ]
[ REFRESH <refresh_method> [<refresh_trigger>]]
[ [DUPLICATE] KEY (<key_cols>) ]
[ COMMENT '<table_comment>' ]
[ PARTITION BY (
{ <partition_col>
| DATE_TRUNC(<partition_col>, <partition_unit>) }
)]
[ DISTRIBUTED BY { HASH (<distribute_cols>) | RANDOM }
[ BUCKETS { <bucket_count> | AUTO } ]
]
[ PROPERTIES (
-- Table property
<table_property>
-- Additional table properties
[ , ... ])
]
AS <query>
どこで:
columns_definition
: -- Column definition
<col_name>
[ COMMENT '<col_comment>' ]
refresh_trigger
: ON MANUAL
| ON SCHEDULE EVERY <int_value> <refresh_unit> [ STARTS '<start_time>']
| ON COMMIT
必須パラメータ
1. <materialized_view_name>
マテリアライズドビューの識別子(つまり、名前)を指定します。これは、Tableが作成されるデータベース内で一意である必要があります。
識別子は文字で始まる必要があり(Unicode名前サポートが有効な場合、任意の言語の文字を使用可能)、識別子文字列全体がバッククォート(例:
My Object)で囲まれていない限り、スペースや特殊文字を含めることはできません。識別子は予約キーワードにすることはできません。
詳細については、識別子と予約キーワードの要件を参照してください。
2. <query>
マテリアライズドビューを作成する際の必須パラメータです。データを投入するSELECT文を指定します。
オプションパラメータ
1. <key_cols>
Tableのキー列。Dorisでは、キー列はTableの最初のK列である必要があります。キーの制限とキー列の選択方法の詳細については、「データモデル」の章の該当セクションを参照してください。
2. <build_mode>
リフレッシュタイミング:マテリアライズドビューを作成直後にリフレッシュするかどうか。
IMMEDIATE:即座にリフレッシュ。デフォルトはIMMEDIATEです。
DEFERRED:遅延リフレッシュ。
3. <refresh_method>
リフレッシュ方法:
COMPLETE:すべてのパーティションをリフレッシュ。
AUTO:増分リフレッシュを試行し、最後のマテリアライズドビューリフレッシュ以降に変更されたパーティションのみをリフレッシュします。増分リフレッシュが不可能な場合、すべてのパーティションがリフレッシュされます。
パーティション化されたマテリアライズドビューがCOMPLETEリフレッシュモードを使用する場合、すべてのパーティションデータのフルリフレッシュが実行され、事実上パーティション化されていないマテリアライズドビューと同様になります。
4. <refresh_trigger>
トリガー方法:
MANUAL:手動リフレッシュ。
ON SCHEDULE:スケジュールリフレッシュ。
ON COMMIT:トリガーリフレッシュ。ベースTableデータの変更がマテリアライズドビューのリフレッシュをトリガーします。
5. <refresh_unit>
定期リフレッシュの時間単位。現在サポートされている単位はMINUTE、HOUR、DAY、WEEKです。
6. <partition_col>
PARTITION BYが指定されていない場合、デフォルトで1つのパーティションのみが存在します。
パーティションフィールドが指定されている場合、フィールドの由来となるベースTableが自動的に推論され、ベースTableと同期されます(現在、内部TableとHiveTableをサポート)。内部Tableの場合、1つのパーティションフィールドのみが許可されます。
マテリアライズドビューは、パーティションロールアップによってパーティション数を削減することもできます。現在、パーティションロールアップ機能は
date_truncをサポートしています。
7. <partition_unit>
パーティションロールアップの集約粒度。現在サポートされている単位はHOUR、DAY、WEEK、QUARTER、MONTH、YEARです。
8. <start_time>
スケジュール開始時刻は未来、つまり現在時刻より後である必要があります。
9. <table_property>
内部Tableで使用されるプロパティで、その大部分はマテリアライズドビューでも使用でき、マテリアライズドビュー固有のプロパティもあります。以下にリストします:
| プロパティ名 | 説明 |
|---|---|
| grace_period | クエリリライト時にマテリアライズドビューデータに許可される最大遅延秒数。マテリアライズドビューのパーティションAとベースTableデータが一致せず、パーティションAの最後のリフレッシュ時刻が10:15:00で、現在のシステム時刻が10:15:08の場合、パーティションは透過的にリライトされません。ただし、grace_periodが10に設定されている場合、パーティションは透過的リライトに使用されます。 |
| excluded_trigger_tables | データリフレッシュ時に無視するカンマ区切りのTable名。例:table1,table2。 |
| refresh_partition_num | 単一のINSERT文でリフレッシュされるパーティション数、デフォルトは1。マテリアライズドビューをリフレッシュする際、まずリフレッシュ対象のパーティションリストを計算し、複数のINSERT文に分割して順次実行します。INSERT文が失敗すると、タスク全体が停止します。マテリアライズドビューは単一のINSERT文の原子性を保証し、失敗したINSERTは既に正常にリフレッシュされたパーティションに影響しません。 |
| workload_group | マテリアライズドビューがリフレッシュタスクを実行する際に使用するworkload_groupの名前。これは、他のビジネス運用に影響を与えないよう、データリフレッシュ中にマテリアライズドビューが使用するリソースを制限するために使用されます。workload_groupの作成と使用の詳細については、WORKLOAD-GROUPのドキュメントを参照してください。 |
| partition_sync_limit | ベースTableのパーティションフィールドが時刻型の場合、このプロパティをpartition_sync_time_unitと組み合わせて使用し、ベースTableと同期するパーティションの範囲を設定できます。例えば、2に設定し、partition_sync_time_unitをMONTHに設定すると、ベースTableの過去2ヶ月分のパーティションとデータのみが同期されます。最小値は1です。時間の経過とともに、マテリアライズドビューは各リフレッシュ時に自動的にパーティションを追加・削除します。例えば、マテリアライズドビューが現在2月と3月のデータを持っている場合、来月は自動的に2月のデータを削除し、4月のデータを追加します。 |
| partition_sync_time_unit | パーティションリフレッシュの時間単位で、DAY/MONTH/YEAR(デフォルトはDAY)をサポート。 |
| partition_date_format | ベースTableのパーティションフィールドが文字列型の場合、partition_sync_limit機能を使用したい場合は、日付フォーマットを設定してpartition_date_formatの設定に従ってパーティション時刻を解析できます。 |
| enable_nondeterministic_function | マテリアライズドビュー定義SQLに非決定的関数(current_date()、now()、random()など)を含めることを許可するかどうか。trueに設定すると含めることを許可し、そうでない場合は許可しません。デフォルトは許可しません。 |
| use_for_rewrite | このマテリアライズドビューが透過的リライトに参加するかどうかを示します。falseに設定すると、透過的リライトに参加しません。デフォルトはtrueです。データモデリングシナリオで、マテリアライズドビューが直接クエリのみに使用される場合、このプロパティを設定することで、マテリアライズドビューが透過的リライトに参加せず、クエリ応答速度を向上させることができます。 |
DISTRIBUTED BY句は、Apache Doris 2.1.10より前では必須です - 省略するとエラーが発生します。 Apache Doris 2.1.10以降では、指定されていない場合、デフォルトの分散がRANDOMになります。
Apache Doris 2.1.10/3.0.6より前では、excluded_trigger_tablesプロパティはベースTable名の指定のみをサポートしていました。 これらのバージョン以降、CatalogとDatabaseを含む完全修飾Table名(例:internal.db1.table1)をサポートするようになりました。
アクセス制御要件
このSQLコマンドを実行するユーザーは、少なくとも以下の権限を持つ必要があります:
| 権限 | オブジェクト | 備考 |
|---|---|---|
| CREATE_PRIV | Database | |
| SELECT_PRIV | Table, View | <query>でクエリされるTableまたはビューに対するSELECT_PRIV権限が必要 |
注意事項
-
マテリアライズドビューのDMLおよびDDL制限:
マテリアライズドビューは、列の型変更、列の追加・削除などのスキーマ変更操作をサポートしていません。列はマテリアライズドビュー定義SQLから派生するためです。
マテリアライズドビューは、手動でのinsert intoやinsert overwrite操作をサポートしていません。
-
パーティション化されたマテリアライズドビューの作成条件:
マテリアライズドビューのSQL定義とパーティションフィールドは、パーティション化された増分更新を実行するために以下の条件を満たす必要があります:
- マテリアライズドビューで使用されるベースTableの少なくとも1つがパーティションTableである必要があります。
- マテリアライズドビューで使用されるパーティション化されたベースTableは、ListまたはRangeパーティション戦略を使用する必要があります。
- マテリアライズドビュー定義SQLは、パーティション By句で1つのパーティションフィールドのみを持つことができます。
- マテリアライズドビューSQLのPartition By句のパーティションフィールドは、Select句の後に現れる必要があります。
- マテリアライズドビュー定義SQLでGroup Byを使用する場合、パーティションフィールドはGroup By句の後に現れる必要があります。
- マテリアライズドビュー定義SQLでWindow関数を使用する場合、パーティションフィールドはPartition By句の後に現れる必要があります。
- データ変更はパーティションTableで発生する必要があります。非パーティションTableで発生する場合、マテリアライズドビューはフルビルドが必要です。
- マテリアライズドビューがJoinのNULL生成側のフィールドをパーティションフィールドとして使用する場合、パーティション化された増分更新は実行できません。例えば、LEFT OUTER JOINの場合、パーティションフィールドは右側ではなく左側にある必要があります。
例
- パーティション化されていないマテリアライズドビュー
CREATE MATERIALIZED VIEW complete_mv (
orderdate COMMENT 'Order date',
orderkey COMMENT 'Order key',
partkey COMMENT 'Part key'
)
BUILD IMMEDIATE
REFRESH AUTO
ON SCHEDULE EVERY 1 DAY STARTS '2024-12-01 20:30:00'
DISTRIBUTED BY HASH (orderkey) BUCKETS 2
PROPERTIES
("replication_num" = "1")
AS
SELECT
o_orderdate,
l_orderkey,
l_partkey
FROM
orders
LEFT JOIN lineitem ON l_orderkey = o_orderkey
LEFT JOIN partsupp ON ps_partkey = l_partkey
and l_suppkey = ps_suppkey;
- パーティション化されたマテリアライズドビュー
以下に示すように、パーティションカラムが指定された場合、システムは自動的にそのカラムがどのベースTableから来ているかを識別し、ベースTableのパーティションを同期します。ベースTableは日単位でパーティション化されています(パーティションカラム: o_orderdate、パーティションタイプ: RANGE)。マテリアライズドビューは月単位でパーティション化され、DATE_TRUNC関数を使用してベースTableのパーティションを月単位でロールアップします。
CREATE TABLE IF NOT EXISTS orders (
o_orderkey integer not null,
o_custkey integer not null,
o_orderstatus char(1) not null,
o_totalprice decimalv3(15,2) not null,
o_orderdate date not null,
o_orderpriority char(15) not null,
o_clerk char(15) not null,
o_shippriority integer not null,
o_comment varchar(79) not null
)
DUPLICATE KEY(o_orderkey, o_custkey)
PARTITION BY RANGE(o_orderdate)(
FROM ('2023-10-16') TO ('2023-11-30') INTERVAL 1 DAY
)
DISTRIBUTED BY HASH(o_orderkey) BUCKETS 3
PROPERTIES (
"replication_num" = "3"
);
CREATE MATERIALIZED VIEW partition_mv
BUILD IMMEDIATE
REFRESH AUTO
ON SCHEDULE EVERY 1 DAY STARTS '2024-12-01 20:30:00'
PARTITION BY (DATE_TRUNC(o_orderdate, 'MONTH'))
DISTRIBUTED BY HASH (l_orderkey) BUCKETS 2
PROPERTIES
("replication_num" = "3")
AS
SELECT
o_orderdate,
l_orderkey,
l_partkey
FROM
orders
LEFT JOIN lineitem ON l_orderkey = o_orderkey
LEFT JOIN partsupp ON ps_partkey = l_partkey
and l_suppkey = ps_suppkey;
以下の例では、パーティション列が非date_trunc関数を使用しているため、パーティション化されたマテリアライズドビューを作成することができません。エラーメッセージは次のとおりです: because column to check use invalid implicit expression, invalid expression is min(o_orderdate#4)
CREATE MATERIALIZED VIEW partition_mv_2
BUILD IMMEDIATE
REFRESH AUTO
ON SCHEDULE EVERY 1 DAY STARTS '2024-12-01 20:30:00'
PARTITION BY (DATE_TRUNC(min_orderdate, 'MONTH'))
DISTRIBUTED BY HASH (l_orderkey) BUCKETS 2
PROPERTIES
("replication_num" = "3")
AS
SELECT
min(o_orderdate) AS min_orderdate,
l_orderkey,
l_partkey
FROM
orders
LEFT JOIN lineitem ON l_orderkey = o_orderkey
LEFT JOIN partsupp ON ps_partkey = l_partkey
and l_suppkey = ps_suppkey
GROUP BY
o_orderdate,
l_orderkey,
l_partkey;
- マテリアライズドビューのプロパティの変更 ALTER MATERIALIZED VIEW文を使用します。
例:
ALTER MATERIALIZED VIEW partition_mv
SET (
"grace_period" = "10",
"excluded_trigger_tables" = "lineitem,partsupp"
);
- マテリアライズドビューの更新モードの変更 ALTER MATERIALIZED VIEW文を使用します。 例:
ALTER MATERIALIZED VIEW partition_mv REFRESH COMPLETE;
After running SHOW CREATE MATERIALIZED VIEW partition_mv;, you can see that the refresh mode has been changed to COMPLETE.