メインコンテンツまでスキップ
バージョン: 26.x

PERCENTILE_APPROX_WEIGHTED

説明

PERCENTILE_APPROX_WEIGHTED関数は重み付き近似パーセンタイルを計算し、主に値の重要度を考慮する必要があるシナリオで使用されます。これはPERCENTILE_APPROXの重み付きバージョンで、各値に重みを指定することができます。

主な特徴:

  1. 重みサポート:各値に対応する重みを割り当てることができ、最終的なパーセンタイル計算に影響します
  2. メモリ効率:固定サイズメモリを使用し、低カーディナリティカラム(大量のデータボリュームだが異なる要素数が少ない)を処理する場合でも低メモリ消費を維持します
  3. 調整可能な精度:圧縮パラメータを通じて精度とパフォーマンスのバランスを取ります

構文

PERCENTILE_APPROX_WEIGHTED(<col>, <weight>, <p> [, <compression>])

パラメータ

Parameterデスクリプション
<col>パーセンタイルを計算する列。サポートされている型: Double
<weight>重み列。正の数である必要があります。サポートされている型: Double
<p>パーセンタイル値。範囲は[0.0, 1.0]。例えば、0.9999パーセンタイルを表します
<compression>オプションパラメータ。サポートされている型: Double。圧縮比率。範囲は[2048, 10000]。値が高いほど精度が高くなりますが、メモリ消費量が増加します。指定されていない場合や範囲外の場合、10000が使用されます。

Return Value

DOUBLE型の値を返します。これは計算された重み付き近似パーセンタイルを表します。 グループ内に有効なデータがない場合、NULLを返します。

Examples

-- Create sample table
CREATE TABLE weighted_scores (
student_id INT,
score DECIMAL(10, 2),
weight INT
) DUPLICATE KEY(student_id)
DISTRIBUTED BY HASH(student_id) BUCKETS AUTO
PROPERTIES (
"replication_allocation" = "tag.location.default: 1"
);

-- Insert example data
INSERT INTO weighted_scores VALUES
(1, 85.5, 1), -- Normal homework score, weight 1
(2, 90.0, 2), -- Important homework score, weight 2
(3, 75.5, 1),
(4, 95.5, 3), -- Very important homework, weight 3
(5, 88.0, 2),
(6, 92.5, 2),
(7, 78.0, 1),
(8, 89.5, 2),
(9, 94.0, 3),
(10, 83.5, 1);

-- Calculate weighted scores distribution
SELECT
-- Calculate 90th percentile for different compression ratios
percentile_approx_weighted(score, weight, 0.9) as p90_default, -- Default compression ratio
percentile_approx_weighted(score, weight, 0.9, 2048) as p90_fast, -- Lower compression ratio, faster
percentile_approx_weighted(score, weight, 0.9, 10000) as p90_accurate -- Higher compression ratio, more accurate
FROM weighted_scores;
+------------------+------------------+------------------+
| p90_default | p90_fast | p90_accurate |
+------------------+------------------+------------------+
| 95.3499984741211 | 95.3499984741211 | 95.3499984741211 |
+------------------+------------------+------------------+
select percentile_approx_weighted(if(score>95,score,null), weight, 0.9) from weighted_scores;

これは非NULL入力のみを考慮します。

+------------------------------------------------------------------+
| percentile_approx_weighted(if(score>95,score,null), weight, 0.9) |
+------------------------------------------------------------------+
| 95.5 |
+------------------------------------------------------------------+
select percentile_approx_weighted(score, weight, 0.9, null) from weighted_scores;

すべての入力値がNULLの場合、この関数はNULLを返します。

+------------------------------------------------------+
| percentile_approx_weighted(score, weight, 0.9, null) |
+------------------------------------------------------+
| NULL |
+------------------------------------------------------+