メインコンテンツまでスキップ
バージョン: 26.x

INSERT

デスクリプション

change文は、データ挿入操作を完了するためのものです。

INSERT INTO table_name
[ PARTITION (p1, ...) ]
[ WITH LABEL label]
[ (column [, ...]) ]
[ [ hint [, ...] ] ]
{ VALUES ( { expression | DEFAULT } [, ...] ) [, ...] | query }

パラメータ

tablet_name: データをインポートする対象Table。db_name.table_nameの形式で指定できます

partitions: インポートするパーティションを指定します。table_nameに存在するパーティションである必要があります。複数のパーティション名はカンマで区切ります

label: Insertタスクのラベルを指定します

column_name: 指定する対象カラム。table_nameに存在するカラムである必要があります

expression: カラムに割り当てる必要がある対応する式

DEFAULT: 対応するカラムにデフォルト値を使用させます

query: 一般的なクエリ。クエリの結果が対象に書き込まれます

hint: INSERTの実行動作を示すために使用される指示子。次の値のいずれかを選択できます:/*+ STREAMING *//*+ SHUFFLE */または/*+ NOSHUFFLE */

  1. STREAMING: 現在は実用的な効果はなく、以前のバージョンとの互換性のためにのみ保持されています。(以前のバージョンでは、このhintを追加するとラベルが返されましたが、現在はデフォルトでラベルが返されます)
  2. SHUFFLE: 対象TableがパーティションTableの場合、このhintを有効にするとrepartiitonが実行されます。
  3. NOSHUFFLE: 対象TableがパーティションTableであってもrepartiitonは実行されませんが、データが各パーティションに正しく配置されることを保証するために他の操作が実行されます。

merge-on-writeが有効になっているUniqueTableの場合、insert文を使用して部分的なカラム更新も実行できます。insert文で部分的なカラム更新を実行するには、セッション変数enable_unique_key_partial_updateをtrue に設定する必要があります(この変数のデフォルト値はfalseで、insert文での部分的なカラム更新はデフォルトで許可されていません)。部分的なカラム更新を実行する場合、挿入するカラムには少なくともすべてのKeyカラムが含まれている必要があり、更新したいカラムを指定する必要があります。挿入する行のKeyカラム値が元のTableに既に存在する場合、同じキーカラム値を持つ行のデータが更新されます。挿入する行のKeyカラム値が元のTableに存在しない場合、新しい行がTableに挿入されます。この場合、insert文で指定されていないカラムは、デフォルト値を持つかnull許可である必要があります。これらの不足しているカラムは、最初にデフォルト値で埋められることを試み、カラムにデフォルト値がない場合はnullで埋められます。カラムがnullにできない場合、insert操作は失敗します。

insert文が厳密モードで動作するかどうかを制御するセッション変数enable_insert_strictのデフォルト値はtrueであることに注意してください。つまり、insert文はデフォルトで厳密モードになっており、このモードでは部分的なカラム更新において存在しないキーの更新は許可されません。したがって、insert文を部分的なカラム更新に使用し、存在しないキーを挿入したい場合は、enable_unique_key_partial_updateをtrueに設定し、同時にenable_insert_strictをfalseに設定する必要があります。

注意:

INSERT文を実行する際、デフォルトの動作では文字列が長すぎるなど、対象Tableの形式に適合しないデータをフィルタリングします。ただし、データがフィルタリングされないことを要求するビジネスシナリオでは、セッション変数enable_insert_stricttrueに設定して、データがフィルタリングされた場合にINSERTが正常に実行されないことを保証できます。

testTableには2つのカラムc1c2が含まれています。

  1. testTableに1行のデータをインポートする
INSERT INTO test VALUES (1, 2);
INSERT INTO test (c1, c2) VALUES (1, 2);
INSERT INTO test (c1, c2) VALUES (1, DEFAULT);
INSERT INTO test (c1) VALUES (1);

最初と2番目のステートメントは同じ効果があります。ターゲットカラムが指定されていない場合、Table内のカラムの順序がデフォルトのターゲットカラムとして使用されます。 3番目と4番目のステートメントは同じ意味を表し、c2カラムのデフォルト値を使用してデータインポートを完了します。

  1. 一度に複数行のデータをtestTableにインポートする
INSERT INTO test VALUES (1, 2), (3, 2 + 2);
INSERT INTO test (c1, c2) VALUES (1, 2), (3, 2 * 2);
INSERT INTO test (c1) VALUES (1), (3);
INSERT INTO test (c1, c2) VALUES (1, DEFAULT), (3, DEFAULT);

最初と2番目のステートメントは同じ効果を持ち、一度に2つのデータをtestTableにインポートします。 3番目と4番目のステートメントの効果は既知であり、c2列のデフォルト値を使用して2つのデータをtestTableにインポートします。

  1. クエリ結果をtestTableにインポートする
INSERT INTO test SELECT * FROM test2;
INSERT INTO test (c1, c2) SELECT * from test2;
  1. クエリ結果をtestTableにインポートし、パーティションとラベルを指定する
INSERT INTO test PARTITION(p1, p2) WITH LABEL `label1` SELECT * FROM test2;
INSERT INTO test WITH LABEL `label1` (c1, c2) SELECT * from test2;

Keywords

INSERT

Best Practice

  1. 返された結果を確認する

    INSERT操作は同期操作であり、結果の返却は操作の終了を示します。ユーザーは異なる返却結果に応じて対応する処理を実行する必要があります。

    1. 実行が成功し、結果セットが空の場合

      select文に対応するinsertの結果セットが空の場合、以下のように返されます:

      mysql> insert into tbl1 select * from empty_tbl;
      Query OK, 0 rows affected (0.02 sec)

Query OKは実行が成功したことを示します。0 rows affectedはデータがインポートされなかったことを意味します。

  1. 実行が成功し、結果セットが空でない場合

    結果セットが空でない場合。返される結果は以下の状況に分かれます:

    1. Insertが正常に実行され、可視である場合:

      mysql> insert into tbl1 select * from tbl2;
      Query OK, 4 rows affected (0.38 sec)
      {'label':'insert_8510c568-9eda-4173-9e36-6adc7d35291c', 'status':'visible', 'txnId':'4005'}

      mysql> insert into tbl1 with label my_label1 select * from tbl2;
      Query OK, 4 rows affected (0.38 sec)
      {'label':'my_label1', 'status':'visible', 'txnId':'4005'}

      mysql> insert into tbl1 select * from tbl2;
      Query OK, 2 rows affected, 2 warnings (0.31 sec)
      {'label':'insert_f0747f0e-7a35-46e2-affa-13a235f4020d', 'status':'visible', 'txnId':'4005'}

      mysql> insert into tbl1 select * from tbl2;
      Query OK, 2 rows affected, 2 warnings (0.31 sec)
      {'label':'insert_f0747f0e-7a35-46e2-affa-13a235f4020d', 'status':'committed', 'txnId':'4005'}

Query OKは実行が成功したことを示します。4 rows affectedは合計4行のデータがインポートされたことを意味します。2 warningsはフィルタリングされる行数を示します。

     またjson文字列も返します:

```json
{'label':'my_label1', 'status':'visible', 'txnId':'4005'}
{'label':'insert_f0747f0e-7a35-46e2-affa-13a235f4020d', 'status':'committed', 'txnId':'4005'}
{'label':'my_label1', 'status':'visible', 'txnId':'4005', 'err':'some other error'}
```

labelは、ユーザーが指定したラベルまたは自動生成されたラベルです。LabelはこのInsert Into importジョブのIDです。各importジョブは、単一のデータベース内で一意のLabelを持ちます。

     `status`は、インポートされたデータが表示可能かどうかを示します。表示可能な場合は`visible`、表示不可能な場合は`committed`を表示します。

`txnId`は、このinsertに対応するimportトランザクションのidです。

`err`フィールドは、その他の予期しないエラーを表示します。

フィルタリングされた行を表示する必要がある場合、ユーザーは以下のステートメントを渡すことができます

```sql
show load where label="xxx";
```

返された結果のURLは、間違ったデータのクエリに使用される可能性があります。詳細については、後述のViewing Error Linesの概要を参照してください。

     **データの不可視性は一時的な状態であり、このバッチのデータは最終的に可視化されます**

このバッチデータの可視ステータスは、以下のステートメントで確認できます:

```sql
show transaction where id=4005;
```

返却された結果のTransactionStatus列がvisibleの場合、表現データは可視状態です。

  1. 実行失敗

    実行失敗は、データのインポートが成功しなかったことを示し、以下が返却されます:

    mysql> insert into tbl1 select * from tbl2 where k1 = "a";
    ERROR 1064 (HY000): all partitions have no load data. url: http://10.74.167.16:8042/api/_load_error_log?file=__shard_2/error_log_insert_stmt_ba8bb9e158e4879-ae8de8507c0bf8a2_ba8bb9e158e4879_ae8de8507c0

ERROR 1064 (HY000): all partitions have no load dataは失敗の理由を示しています。以下のurlを使用して間違ったデータを照会できます:

  ```sql
show load warnings on "url";
```

特定のエラー行を確認できます。

  1. タイムアウト時間

    INSERT操作のタイムアウトは、max(insert_timeout, query_timeout)によって制御されます。両方とも環境変数で、insert_timeoutのデフォルトは4時間、query_timeoutのデフォルトは5分です。操作がタイムアウトを超えた場合、ジョブはキャンセルされます。insert_timeoutの導入は、INSERT文がより長いデフォルトタイムアウトを持つことを保証し、通常のクエリに適用される短いデフォルトタイムアウトによってインポートタスクが影響を受けないようにするためです。

  2. ラベルとアトミシティ

    INSERT操作はインポートのアトミシティも保証します。Import Transactions and Atomicityのドキュメントを参照してください。

    インサート操作でクエリ部分としてCTE(Common Table Expressions)を使用する場合、WITH LABELcolumn部分を指定する必要があります。

  3. フィルタ閾値

    他のインポート方法とは異なり、INSERT操作ではフィルタ閾値(max_filter_ratio)を指定できません。デフォルトのフィルタ閾値は1で、これはエラーのある行を無視できることを意味します。

    データがフィルタリングされないことを要求するビジネスシナリオの場合、session variable enable_insert_stricttrueに設定して、データがフィルタリングされた場合にINSERTが正常に実行されないことを保証できます。

  4. パフォーマンスの問題

    VALUESメソッドを使用した単一行の挿入はありません。この方法を使用する必要がある場合は、複数行のデータを1つのINSERT文にまとめて一括コミットしてください。