EXPLODE-OUTER
説明
explode関数は配列を受け取り、配列の各要素を個別の行にマップします。この関数はLATERAL VIEWと組み合わせて使用し、ネストされたデータ構造を標準的なフラットなTable形式に展開します。explode_outerとexplodeの主な違いは、null値の処理方法です。
構文
EXPLODE(<array>[, ...])
可変パラメータ
<array>配列型。
戻り値
<array>内のすべての要素で構成される単一列、複数行の結果を返します。<array>がNULLまたは空の配列(要素数が0)の場合、NULLを含む1行が返されます。
使用上の注意
<array>パラメータがArray型でない場合、エラーが報告されます。- 複数の配列パラメータがある場合、展開される行数は最も多くの要素を持つ配列によって決定されます。要素数の少ない配列はNULLで埋められます。
例
-
データの準備
create table example(
k1 int
) properties(
"replication_num" = "1"
);
insert into example values(1); -
通常のパラメータ
select * from example lateral view explode([1, 2, null, 4, 5]) t2 as c;+------+------+
| k1 | c |
+------+------+
| 1 | 1 |
| 1 | 2 |
| 1 | NULL |
| 1 | 4 |
| 1 | 5 |
+------+------+ -
複数のパラメータ
select * from example lateral view explode([], [1, 2, null, 4, 5], ["ab", "cd", "ef"], [null, null, 1, 2, 3, 4, 5]) t2 as c0, c1, c2, c3;+------+------+------+------+------+
| k1 | c0 | c1 | c2 | c3 |
+------+------+------+------+------+
| 1 | NULL | 1 | ab | NULL |
| 1 | NULL | 2 | cd | NULL |
| 1 | NULL | NULL | ef | 1 |
| 1 | NULL | 4 | NULL | 2 |
| 1 | NULL | 5 | NULL | 3 |
| 1 | NULL | NULL | NULL | 4 |
| 1 | NULL | NULL | NULL | 5 |
+------+------+------+------+------+
展開後に最も多い行数を持つ配列は
[null, null, 1, 2, 3, 4, 5](c3)で、7行あります。したがって、最終結果は7行となり、他の3つの配列(c0, c1, c2)は不足する行にNULLが埋め込まれます。
-
空の配列
select * from example lateral view explode_outer([]) t2 as c;+------+------+
| k1 | c |
+------+------+
| 1 | NULL |
+------+------+ -
NULLパラメータ
select * from example lateral view explode_outer(NULL) t2 as c;+------+------+
| k1 | c |
+------+------+
| 1 | NULL |
+------+------+ -
非配列パラメータ
select * from example lateral view explode_outer('abc') t2 as c;ERROR 1105 (HY000): errCode = 2, detailMessage = Can not find the compatibility function signature: explode_outer(VARCHAR(3))