メインコンテンツまでスキップ
バージョン: 26.x

LOCAL

デスクリプション

Local table-valued-function(tvf)は、ユーザーがbeノード上のローカルファイルの内容を読み取りアクセスすることを可能にし、リレーショナルTableにアクセスするのと同様に扱えます。現在、csv/csv_with_names/csv_with_names_and_types/json/parquet/orcファイル形式をサポートしています。

syntax

LOCAL(
"file_path" = "<file_path>",
"backend_id" = "<backend_id>",
"format" = "<format>"
[, "<optional_property_key>" = "<optional_property_value>" [, ...] ]
);

Required パラメータ

ParameterデスクリプションRemarks
file_path読み取り対象のファイルパス。user_files_secure_pathディレクトリに対する相対パスで指定します。user_files_secure_pathパラメータはBEの設定項目です。
パスには..を含めることはできません。パターンマッチングにはglobシンタックスを使用できます(例:logs/*.log)。
backend_idファイルが配置されているBEノードのID。show backendsコマンドで取得できます。バージョン2.1.1より前では、Dorisは指定したBEノード上のローカルデータファイルの読み取りのみをサポートしており、BEノードの指定が必要でした。
formatファイル形式。必須項目です。サポートされている形式はcsv/csv_with_names/csv_with_names_and_types/json/parquet/orcです。

Optional パラメータ

ParameterデスクリプションRemarks
shared_storageデフォルトは false。true の場合、指定されたファイルは共有ストレージ(例:NAS)上に配置されます。共有ストレージはPOSIXファイルインターフェースをサポートし、全BEノードにマウントされている必要があります。
shared_storageがtrueの場合、backend_idは省略可能です。DorisはすべてのBEノードを利用してデータにアクセスすることがあります。backend_idが設定されている場合、指定されたBEノードでのみデータにアクセスします。
バージョン2.1.2からサポート
column_separatorカラム区切り文字。オプション。デフォルトは\t
line_delimiter行区切り文字。オプション。デフォルトは\n
compress_type圧縮タイプ。オプション。サポートされているタイプはUNKNOWN/PLAIN/GZ/LZO/BZ2/LZ4FRAME/DEFLATE/SNAPPYBLOCK。デフォルトはUNKNOWNで、uriの拡張子から自動的に推論されます。
read_json_by_lineJSON形式のインポート用。オプション。デフォルトはtrue参照: Json Load
strip_outer_arrayJSON形式のインポート用。オプション。デフォルトはfalse参照: Json Load
json_rootJSON形式のインポート用。オプション。デフォルトは空。参照: Json Load
json_pathsJSON形式のインポート用。オプション。デフォルトは空。参照: Json Load
num_as_stringJSON形式のインポート用。オプション。デフォルトはfalse参照: Json Load
fuzzy_parseJSON形式のインポート用。オプション。デフォルトはfalse参照: Json Load
trim_double_quotesCSV形式のインポート用。オプション。デフォルトはfalse。trueの場合、CSVファイルの各フィールドの最外側のダブルクオートをトリムします。CSV形式用
skip_linesCSV形式のインポート用。オプション。デフォルトは0。CSVファイルの最初の数行をスキップします。形式がcsv_with_namesまたはcsv_with_names_and_typesの場合、このパラメータは無視されます。CSV形式用
path_partition_keysオプション。ファイルパスに含まれるパーティションカラム名を指定します(例:/path/to/city=beijing/date="2023-07-09"の場合、path_partition_keys="city,date"と記入)。パスから対応するカラム名と値を自動的に読み取ってインポートします。
enable_mapping_varbinaryデフォルトは false。PARQUET/ORC読み取り時にBYTE_ARRAY型をSTRING型にマッピングします。有効にすると、VARBINARY型にマッピングします。4.0.3以降でサポート

Access Control Requirements

PrivilegeObject注釈
ADMIN_PRIVglobal

Usage 注釈

  • local tvfのより詳細な使用方法については、S3 tvfを参照してください。両者の唯一の違いはストレージシステムへのアクセス方法です。

  • local tvfを通じたNAS上のデータへのアクセス

    NAS共有ストレージは同時に複数のノードにマウントすることができます。各ノードは、ローカルファイルと同様に共有ストレージ内のファイルにアクセスできます。そのため、NASはローカルファイルシステムとして扱うことができ、local tvfを通じてアクセスします。

    "shared_storage" = "true"を設定した場合、Dorisは指定されたファイルが任意のBEノードからアクセス可能であると判断します。ワイルドカードを使用して一連のファイルが指定された場合、Dorisはファイルへのアクセス要求を複数のBEノードに分散し、複数のノードを使用して分散ファイルスキャンを実行し、クエリパフォーマンスを向上させます。

Examples

指定されたBE上のログファイルを分析する:

select * from local(
"file_path" = "log/be.out",
"backend_id" = "10006",
"format" = "csv")
where c1 like "%start_time%" limit 10;
+--------------------------------------------------------+
| c1 |
+--------------------------------------------------------+
| start time: 2023 年 08 月 07 日 星期一 23:20:32 CST |
| start time: 2023 年 08 月 07 日 星期一 23:32:10 CST |
| start time: 2023 年 08 月 08 日 星期二 00:20:50 CST |
| start time: 2023 年 08 月 08 日 星期二 00:29:15 CST |
+--------------------------------------------------------+

path ${DORIS_HOME}/student.csv に配置されたcsv形式のファイルを読み取りおよびアクセスします:

select * from local(
"file_path" = "student.csv",
"backend_id" = "10003",
"format" = "csv");
+------+---------+--------+
| c1 | c2 | c3 |
+------+---------+--------+
| 1 | alice | 18 |
| 2 | bob | 20 |
| 3 | jack | 24 |
| 4 | jackson | 19 |
| 5 | liming | d18 |
+------+---------+--------+
```--+---------+--------+

Query files on NAS:

select * from local(
"file_path" = "/mnt/doris/prefix_*.txt",
"format" = "csv",
"column_separator" =",",
"shared_storage" = "true");

+------+------+------+
| c1 | c2 | c3 |
+------+------+------+
| 1 | 2 | 3 |
| 1 | 2 | 3 |
| 1 | 2 | 3 |
| 1 | 2 | 3 |
| 1 | 2 | 3 |
+------+------+------+

Can be used with desc function :

desc function local(
"file_path" = "student.csv",
"backend_id" = "10003",
"format" = "csv");

+-------+------+------+-------+---------+-------+
| Field | タイプ | Null | Key | Default | Extra |
+-------+------+------+-------+---------+-------+
| c1 | TEXT | Yes | false | NULL | NONE |
| c2 | TEXT | Yes | false | NULL | NONE |
| c3 | TEXT | Yes | false | NULL | NONE |
+-------+------+------+-------+---------+-------+