INSERT
デスクリプション
change文は、データ挿入操作を完了するためのものです。
INSERT INTO table_name
[ PARTITION (p1, ...) ]
[ WITH LABEL label]
[ (column [, ...]) ]
[ [ hint [, ...] ] ]
{ VALUES ( { expression | DEFAULT } [, ...] ) [, ...] | query }
パラメータ
tablet_name: データをインポートする宛先Table。
db_name.table_nameの形式で指定可能partitions: インポートするパーティションを指定する。
table_nameに存在するパーティションである必要がある。複数のパーティション名はカンマで区切るlabel: Insertタスクのラベルを指定する
column_name: 指定する宛先カラム。
table_nameに存在するカラムである必要があるexpression: カラムに割り当てる必要がある対応する式
DEFAULT: 対応するカラムにデフォルト値を使用させる
query: 一般的なクエリ。クエリの結果がターゲットに書き込まれる
hint:
INSERTの実行動作を示すために使用されるインジケータ。次の値のいずれかを選択できる:/*+ STREAMING */、/*+ SHUFFLE */、または/*+ NOSHUFFLE */
- STREAMING: 現在、実用的な効果はなく、以前のバージョンとの互換性のためにのみ予約されている(以前のバージョンでは、このhintを追加するとラベルが返されたが、現在はデフォルトでラベルが返される)
- SHUFFLE: ターゲットTableがパーティションTableの場合、このhintを有効にするとrepartiitonが実行される
- NOSHUFFLE: ターゲットTableがパーティションTableであってもrepartiitonは実行されないが、データが各パーティションに正しくドロップされることを保証するために他の操作が実行される
merge-on-writeが有効なUniqueTableでは、insert文を使用して部分的なカラム更新を実行することもできます。insert文で部分的なカラム更新を実行するには、セッション変数enable_unique_key_partial_updateをtrueに設定する必要があります(この変数のデフォルト値はfalseで、デフォルトではinsert文による部分的なカラム更新は許可されていません)。部分的なカラム更新を実行する際、挿入されるカラムには少なくともすべてのKeyカラムが含まれている必要があり、更新したいカラムを指定する必要があります。挿入される行のKeyカラム値が元のTableに既に存在する場合、同じkeyカラム値を持つ行のデータが更新されます。挿入される行のKeyカラム値が元のTableに存在しない場合、新しい行がTableに挿入されます。この場合、insert文で指定されていないカラムは、デフォルト値を持つかnull許可である必要があります。これらの欠損カラムは、まずデフォルト値で埋められることが試行され、カラムにデフォルト値がない場合はnullで埋められます。カラムがnullにできない場合、insert操作は失敗します。
insert文が厳密モードで動作するかどうかを制御するセッション変数enable_insert_strictのデフォルト値はtrueであることに注意してください。つまり、insert文はデフォルトで厳密モードになっており、このモードでは部分的なカラム更新で存在しないキーを更新することは許可されていません。そのため、insert文を部分的なカラム更新に使用し、存在しないキーを挿入したい場合は、enable_unique_key_partial_updateをtrueに設定し、同時にenable_insert_strictをfalseに設定する必要があります。
注意事項:
INSERT文を実行する際、デフォルトの動作では、文字列が長すぎるなど、ターゲットTable形式に適合しないデータをフィルタリングします。ただし、データをフィルタリングしないことが要求されるビジネスシナリオでは、セッション変数enable_insert_strictをtrueに設定することで、データがフィルタリングされた場合にINSERTが正常に実行されないことを保証できます。
例
testTableにはc1、c2の2つのカラムが含まれています。
testTableに1行のデータをインポートする
INSERT INTO test VALUES (1, 2);
INSERT INTO test (c1, c2) VALUES (1, 2);
INSERT INTO test (c1, c2) VALUES (1, DEFAULT);
INSERT INTO test (c1) VALUES (1);
最初と2番目のステートメントは同じ効果があります。ターゲット列が指定されていない場合、Table内の列順序がデフォルトのターゲット列として使用されます。
3番目と4番目のステートメントは同じ意味を表し、c2列のデフォルト値を使用してデータインポートを完了します。
testTableに複数行のデータを一度にインポートする
INSERT INTO test VALUES (1, 2), (3, 2 + 2);
INSERT INTO test (c1, c2) VALUES (1, 2), (3, 2 * 2);
INSERT INTO test (c1) VALUES (1), (3);
INSERT INTO test (c1, c2) VALUES (1, DEFAULT), (3, DEFAULT);
最初と2番目のステートメントは同じ効果を持ち、2つのデータを一度にtestTableにインポートします
3番目と4番目のステートメントの効果は既知であり、c2列のデフォルト値を使用して2つのデータをtestTableにインポートします
- クエリ結果を
testTableにインポートする
INSERT INTO test SELECT * FROM test2;
INSERT INTO test (c1, c2) SELECT * from test2;
- クエリ結果を
testTableにインポートし、パーティションとラベルを指定する
INSERT INTO test PARTITION(p1, p2) WITH LABEL `label1` SELECT * FROM test2;
INSERT INTO test WITH LABEL `label1` (c1, c2) SELECT * from test2;
キーワード
INSERT
ベストプラクティス
-
返された結果を確認する
INSERT操作は同期操作であり、結果の返却は操作の終了を示します。ユーザーは異なる返却結果に応じて対応する処理を行う必要があります。
-
実行が成功し、結果セットが空の場合
select文に対応するinsertの結果セットが空の場合、以下のように返却されます:
mysql> insert into tbl1 select * from empty_tbl;
Query OK, 0 rows affected (0.02 sec)
-
Query OKは正常な実行を示します。0 rows affectedはデータがインポートされなかったことを意味します。
-
実行が成功し、結果セットが空ではない
結果セットが空ではない場合。返される結果は以下の状況に分かれます:
-
Insertが正常に実行され、可視である:
mysql> insert into tbl1 select * from tbl2;
Query OK, 4 rows affected (0.38 sec)
{'label':'insert_8510c568-9eda-4173-9e36-6adc7d35291c', 'status':'visible', 'txnId':'4005'}
mysql> insert into tbl1 with label my_label1 select * from tbl2;
Query OK, 4 rows affected (0.38 sec)
{'label':'my_label1', 'status':'visible', 'txnId':'4005'}
mysql> insert into tbl1 select * from tbl2;
Query OK, 2 rows affected, 2 warnings (0.31 sec)
{'label':'insert_f0747f0e-7a35-46e2-affa-13a235f4020d', 'status':'visible', 'txnId':'4005'}
mysql> insert into tbl1 select * from tbl2;
Query OK, 2 rows affected, 2 warnings (0.31 sec)
{'label':'insert_f0747f0e-7a35-46e2-affa-13a235f4020d', 'status':'committed', 'txnId':'4005'}
-
Query OKは実行が成功したことを示します。4 rows affectedは合計4行のデータがインポートされたことを意味します。2 warningsはフィルタリングされる行数を示します。
また、json文字列も返します:
```json
{'label':'my_label1', 'status':'visible', 'txnId':'4005'}
{'label':'insert_f0747f0e-7a35-46e2-affa-13a235f4020d', 'status':'committed', 'txnId':'4005'}
{'label':'my_label1', 'status':'visible', 'txnId':'4005', 'err':'some other error'}
```
labelはユーザが指定したラベルまたは自動生成されたラベルです。Labelはこのinsert Into importジョブのIDです。各importジョブは単一データベース内で一意のLabelを持ちます。
statusはimportされたデータが可視かどうかを示します。可視の場合はvisible、不可視の場合はcommittedを表示します。
txnIdはこのinsertに対応するimportトランザクションのidです。
errフィールドは他の予期しないエラーを表示します。
フィルタされた行を表示する必要がある場合、ユーザは以下のstatementを渡すことができます
```sql
show load where label="xxx";
```
返された結果のURLは、間違ったデータをクエリするために使用できます。詳細については、後述のエラー行の表示の概要を参照してください。
**データの不可視性は一時的な状態であり、このバッチのデータは最終的に可視になります**
このバッチのデータの可視ステータスは、次の文で確認できます:
```sql
show transaction where id=4005;
```
戻り値のTransactionStatus列がvisibleの場合、表現データは可視状態です。
-
実行失敗
実行失敗は、データのインポートが成功しなかったことを示し、以下が返されます:
mysql> insert into tbl1 select * from tbl2 where k1 = "a";
ERROR 1064 (HY000): all partitions have no load data. url: http://10.74.167.16:8042/api/_load_error_log?file=__shard_2/error_log_insert_stmt_ba8bb9e158e4879-ae8de8507c0bf8a2_ba8bb9e158e4879_ae8de8507c0
ERROR 1064 (HY000): all partitions have no load dataは失敗の原因を示しています。以下のurlを使用して問題のあるデータをクエリできます:
```sql
show load warnings on "url";
```
特定のエラー行を表示することができます。
-
タイムアウト時間
INSERT操作のタイムアウトは、max(insert_timeout, query_timeout)によって制御されます。両方とも環境変数で、insert_timeoutのデフォルトは4時間、query_timeoutのデフォルトは5分です。操作がタイムアウトを超えた場合、ジョブはキャンセルされます。insert_timeoutの導入は、INSERT文がより長いデフォルトタイムアウトを持つことを保証し、通常のクエリに適用される短いデフォルトタイムアウトの影響を受けることなく、インポートタスクを実行できるようにするためです。
-
Labelとアトミック性
INSERT操作は、インポートのアトミック性も保証します。Import Transactions and Atomicityドキュメントを参照してください。
insert操作でクエリ部分として
CTE(Common Table Expressions)を使用する場合、WITH LABELとcolumn部分を指定する必要があります。 -
Filter Threshold
他のインポート方法とは異なり、INSERT操作ではfilter threshold(
max_filter_ratio)を指定することはできません。デフォルトのfilter thresholdは1で、これはエラーのある行を無視できることを意味します。データがフィルタリングされないことを要求するビジネスシナリオでは、session variable
enable_insert_strictをtrueに設定することで、データがフィルタリングされる場合にINSERTが正常に実行されないことを保証できます。 -
パフォーマンスの問題
VALUESメソッドを使用した単一行の挿入は推奨されません。この方法を使用する必要がある場合は、複数行のデータを1つのINSERT文にまとめて一括コミットしてください。