APPROX_COUNT_DISTINCT
説明
APPROX_COUNT_DISTINCT関数は、HyperLogLogアルゴリズムに基づいて実装されており、固定サイズのメモリを使用してカラムベースを推定します。このアルゴリズムは、末尾における零分布の仮定に基づいており、精度はデータ分布に依存します。Dorisで使用される固定バケットサイズに基づき、このアルゴリズムの相対標準誤差は0.8125%です。 より詳細で具体的な分析については、関連論文を参照してください
構文
APPROX_COUNT_DISTINCT(<expr>)
パラメータ
| パラメータ | デスクリプション |
|---|---|
<expr> | 取得する必要がある式 |
戻り値
BIGINT型の値を返します。
例
select approx_count_distinct(query_id) from log_statis group by datetime;
+-----------------+
| approx_count_distinct(`query_id`) |
+-----------------+
| 17721 |
+-----------------+