ワークロード分析診断
クラスターのワークロード分析は、主に2つの段階に分かれています:
- 第1段階はランタイムワークロード分析で、クラスターの可用性が低下した際に、監視を通じてリソース消費量が大きいクエリを特定し、適切にダウングレードを行います。
- 第2段階では、audit logsなどの履歴データを分析して、不合理なワークロードを特定し最適化します。
ランタイムワークロード分析
監視によってクラスターの可用性が低下していることが検出された場合、以下のプロセスに従うことができます:
- まず、監視を使用して現在のクラスターのボトルネックを大まかに判断します。例えば、メモリ使用量過多、CPU使用率が高い、またはIOが高いなどです。すべてが高い場合は、メモリの問題に優先的に対処することをお勧めします。
- クラスターのボトルネックが特定されたら、workload_group_resource_usageTableを参照して、現在のリソース使用量が最も高いGroupを見つけることができます。例えば、メモリのボトルネックがある場合は、メモリ使用量が最も高い上位NのGroupを特定できます。
- リソース使用量が最も高いGroupを特定した後、最初のステップとしてこのGroupのクエリ同時実行数を削減できます。この時点でクラスターリソースは既に逼迫しており、クラスターリソースの枯渇を防ぐために新しいクエリを避ける必要があります。
- 現在のGroupのクエリをダウングレードします。ボトルネックに応じて、異なるアプローチを取ることができます:
- CPUボトルネックの場合は、Groupのcpu_hard_limitを設定し、cpu_hard_limitをより低い値に調整してCPUリソースを自発的に譲ることを検討してください。
- IOボトルネックの場合は、read_bytes_per_secondパラメータを通じてGroupの最大IOを制限します。
- メモリボトルネックの場合は、Groupのmemory_limitを設定し、memory_limit値を下げて一部のメモリを解放します。これにより、現在のGroup内で多数のクエリ失敗が発生する可能性があることに注意してください。
- 上記の手順を完了すると、クラスターの可用性は通常ある程度回復します。この時点で、さらなる分析を行い、このGroupでリソース使用量が増加した主な原因を特定できます。それがこのGroupでのクエリ同時実行数の全体的な増加によるものか、特定の大きなクエリによるものかを判断します。特定の大きなクエリが原因の場合は、これらのクエリを迅速にkillしてクラスター機能を復旧できます。
- backend_active_tasksTableをactive_queriesと組み合わせて使用し、クラスター内で異常なリソース使用量を持つSQLクエリを特定し、kill文を使用してこれらのクエリを終了させ、リソースを解放できます。
履歴データによるワークロード分析
現在、Dorisのaudit logsはSQL実行に関する簡潔な情報を保持しており、これを使用して過去に実行された不合理なクエリを特定し、調整を行うことができます。具体的なプロセスは以下の通りです:
- 監視を確認してクラスターの履歴リソース使用量を確認し、クラスターのボトルネックがCPU、メモリ、IOのいずれかを特定します。
- クラスターのボトルネックが特定されたら、audit logsを参照して、対応する期間中に異常なリソース使用量を持つSQLクエリを見つけることができます。異常なSQLを定義する方法は2つあります:
- ユーザーがクラスター内のSQLのリソース使用量について一定の期待を持っている場合、例えば大部分の遅延が秒単位で、スキャン行数が数千万の場合、スキャン行数が数億または数十億のSQLクエリは異常と見なされ、手動介入が必要です。
- ユーザーがクラスター内のSQLリソース使用量について期待を持っていない場合は、パーセンタイル関数を使用してリソース使用量を計算し、異常なリソース使用量を持つSQLクエリを特定できます。CPUボトルネックを例に取ると、まず履歴期間のクエリCPU時間のtp50/tp75/tp99/tp999を計算し、これらの値を正常とします。これらを現在のクラスターの同期間におけるクエリCPU時間のパーセンタイル関数と比較します。例えば、履歴期間のtp999が1分だったが、現在のクラスターの同期間のtp50が既に1分の場合、履歴データと比較してCPU時間が1分を超えるSQLクエリが多数あることを示しています。したがって、CPU時間が1分より大きいSQLクエリを異常と定義できます。同じロジックが他のメトリクスにも適用されます。
- 異常なリソース使用量を持つSQLクエリを最適化します。例えば、SQLの書き換え、Table構造の最適化、並列性の調整によってSQL クエリあたりのリソース使用量を削減します。
- audit logsでSQLリソース使用量が正常であることが判明した場合は、監視と監査を使用して、その時間に実行されたSQLクエリ数が履歴期間と比較して増加しているかどうかを確認します。そうである場合は、対応する時間帯に上流のアクセストラフィックが増加したかどうかを上流ビジネスに確認し、クラスターをスケールするかキューイングとレート制限を実装するかを決定します。
よく使用されるSQL
ヒント
active_queriesTableはFE上で実行されているクエリを記録し、backend_active_tasksTableはBE上で実行されているクエリを記録することに注意してください。すべてのクエリが実行中にFEに登録されるわけではありません。例えば、stream loadはFEに登録されません。したがって、backend_active_tasksとactive_queriesの間でLEFT JOINを実行した際に一致する結果が得られないことは正常です。
クエリがSELECTクエリの場合、active_queriesとbackend_active_tasksの両方に記録されるqueryIdは同じです。クエリがstream loadの場合、active_queriesTableのqueryIdは空で、backend_active_tasksのqueryIdはstream loadのIDです。
- 現在のすべてのWorkload Groupを表示し、メモリ/CPU/I/O使用量の降順で表示します。
select be_id,workload_group_id,memory_usage_bytes,cpu_usage_percent,local_scan_bytes_per_second
from workload_group_resource_usage
order by memory_usage_bytes,cpu_usage_percent,local_scan_bytes_per_second desc
-
CPU使用率上位N件のSQL。
select
t1.query_id as be_query_id,
t1.query_type,
t2.query_id,
t2.workload_group_id,
t2.`database`,
t1.cpu_time,
t2.`sql`
from
(select query_id, query_type,sum(task_cpu_time_ms) as cpu_time from backend_active_tasks group by query_id, query_type)
t1 left join active_queries t2
on t1.query_id = t2.query_id
order by cpu_time desc limit 10; -
メモリ使用量TopN Sql.
select
t1.query_id as be_query_id,
t1.query_type,
t2.query_id,
t2.workload_group_id,
t1.mem_used
from
(select query_id, query_type, sum(current_used_memory_bytes) as mem_used from backend_active_tasks group by query_id, query_type)
t1 left join active_queries t2
on t1.query_id = t2.query_id
order by mem_used desc limit 10; -
バイト数/行数上位のSqlをスキャンする。
select
t1.query_id as be_query_id,
t1.query_type,
t2.query_id,
t2.workload_group_id,
t1.scan_rows,
t1.scan_bytes
from
(select query_id, query_type, sum(scan_rows) as scan_rows,sum(scan_bytes) as scan_bytes from backend_active_tasks group by query_id,query_type)
t1 left join active_queries t2
on t1.query_id = t2.query_id
order by scan_rows desc,scan_bytes desc limit 10; -
ワークロードグループのスキャン行数/バイト数を表示する。
select
t2.workload_group_id,
sum(t1.scan_rows) as wg_scan_rows,
sum(t1.scan_bytes) as wg_scan_bytes
from
(select query_id, sum(scan_rows) as scan_rows,sum(scan_bytes) as scan_bytes from backend_active_tasks group by query_id)
t1 left join active_queries t2
on t1.query_id = t2.query_id
group by t2.workload_group_id
order by wg_scan_rows desc,wg_scan_bytes desc -
ワークロードグループのクエリキューの詳細を表示します。
select
workload_group_id,
query_id,
query_status,
now() - queue_start_time as queued_time
from
active_queries
where query_status='queued'
order by workload_group_id