バージョン: 2.1

概要

数値型

Dorisは以下の数値データ型をサポートしています：

BOOLEAN

可能な値は2つあります：0はfalseを表し、1はtrueを表します。

詳細については、BOOLEANを参照してください。

整数型

すべて符号付き整数です。INT型間の違いは、占有するバイト数と表現できる値の範囲です：

TINYINT: 1バイト、[-128, 127]
SMALLINT: 2バイト、[-32768, 32767]
INT: 4バイト、[-2147483648, 2147483647]
BIGINT: 8バイト、[-9223372036854775808, 9223372036854775807]
LARGEINT: 16バイト、[-2^127, 2^127 - 1]

浮動小数点型

一般的なプログラミング言語のfloatとdoubleに対応する、精度の低い浮動小数点型FLOATとDOUBLEを含みます

固定小数点型

金融およびその他の厳密な精度を要求するケースで使用される、精密な固定小数点型DECIMAL。

日付型

日付型にはDATE、TIME、DATETIMEがあります。DATE型は日まで正確な日付のみを格納し、DATETIME型は日付と時刻を格納してマイクロ秒まで正確にできます。TIME型は時刻のみを格納し、現在のところTableストレージの構築をサポートしておらず、クエリプロセスでのみ使用できます。

datetime型の計算や数値型への変換を行う場合は、TIME_TO_SEC、DATE_DIFF、UNIX_TIMESTAMPなどの関数を使用してください。数値型として直接変換した結果は保証されません。

詳細については、DATE、TIME、DATETIMEのドキュメントを参照してください。

文字列型

Dorisは固定長と可変長の両方の文字列をサポートしています：

CHAR(M): 固定長文字列。Mはバイト長です。Mの範囲は[1, 255]です。
VARCHAR(M): 可変長文字列。Mは最大長です。Mの範囲は[1, 65533]です。
STRING: デフォルトの最大長が1,048,576バイト（1 MB）の可変長文字列。この最大長はstring_type_length_soft_limit_bytes設定を構成することで最大2,147,483,643バイト（2 GB）まで増やすことができます。

半構造化型

DorisはJSONデータ処理のためのさまざまな半構造化データ型をサポートしており、それぞれ異なる使用例に対応しています。

ARRAY / MAP / STRUCT: ネストしたデータと固定スキーマをサポートし、ユーザー行動やプロファイル分析などの分析ワークロード、およびParquetなどのデータレイク形式のクエリに適しています。固定スキーマのため、動的スキーマ推論のオーバーヘッドがなく、高い書き込みおよび分析パフォーマンスを実現します。
VARIANT: ネストしたデータと柔軟なスキーマをサポートします。ログ、トレース、IoTデータ分析などの分析ワークロードに適しています。任意の有効なJSONデータを受け入れることができ、カラム型ストレージ形式で自動的にサブカラムに展開されます。このアプローチにより、ストレージでの高い圧縮率とデータ集約、フィルタリング、ソートでの高いパフォーマンスを実現します。
JSON: ネストしたデータと柔軟なスキーマをサポートします。高並行性のポイントクエリ使用例に最適化されています。柔軟なスキーマにより任意の有効なJSONデータを取り込むことができ、バイナリ形式で格納されます。このバイナリJSON形式からのフィールド抽出は、通常のJSON文字列を使用するよりも2倍以上高速です。

集約型

集約データ型は集約結果または集約中の中間結果を格納します。集約の多いクエリを高速化するために使用されます。

BITMAP: (UV)統計やオーディエンスセグメンテーションなど、正確な重複除去に使用されます。bitmap_union、bitmap_union_count、bitmap_hash、bitmap_hash64などのBITMAP関数と組み合わせて動作します。
HLL: 近似重複除去に使用され、COUNT DISTINCTよりも優れたパフォーマンスを提供します。hll_union_agg、hll_raw_agg、hll_cardinality、hll_hashなどのHLL関数と組み合わせて動作します。
QUANTILE_STATE: 近似パーセンタイル計算に使用され、PERCENTILE関数よりも優れたパフォーマンスを提供します。QUANTILE_PERCENT、QUANTILE_UNION、TO_QUANTILE_STATEなどの関数と連携します。
AGG_STATE: 集約の高速化に使用され、state/merge/unionなどの集約関数コンビネータと組み合わせて利用されます。

IP型

IPデータ型はIPアドレスをバイナリ形式で格納し、文字列として格納するよりもクエリが高速で空間効率的です。サポートされているIPデータ型は2つあります：

IPv4: IPv4アドレスを4バイトのバイナリ値として格納します。ipv4_*系の関数と組み合わせて使用されます。
IPv6: IPv6アドレスを16バイトのバイナリ値として格納します。ipv6_*系の関数と組み合わせて使用されます。

数値型​

BOOLEAN​

整数型​

浮動小数点型​

固定小数点型​

日付型​

文字列型​

半構造化型​

集約型​

IP型​

数値型

BOOLEAN

整数型

浮動小数点型

固定小数点型

日付型

文字列型

半構造化型

集約型

IP型