バージョン: 4.x

Monitoring

VeloDB Cloudは、warehouseとclusterの健全性とパフォーマンスを追跡し、変化が生じた際に対応できるよう、モニタリングとアラート機能を提供します。

左ナビゲーションのManageグループからMonitoringを開きます。Monitoringには4つのサブページがあります：Metrics、Alerts、Query Audit、Usageです。

Metrics

Metricsページでは以下のことができます：

warehouseまたはcluster別にメトリクスを表示する
Starredを使用して、warehouses間やclusters間で関心のあるメトリクスをピン留めし、一緒に表示する
時間セレクターを調整して、過去15日間までの履歴データを確認する
ほぼリアルタイムの更新（5秒間隔）のために自動更新を有効にする

メトリクスは2つのカテゴリに分かれています：Basic Metrics（物理リソース使用率）とService Metrics（クエリ/ワークロードパフォーマンス）です。

Basic metrics

Basic metricsは、ノード別のclusterの物理的使用率を追跡します。これらは、特定の時間範囲でclusterが健全かどうかを判断し、履歴または現在のクエリがパフォーマンスに影響を与えているかどうかを判断するのに役立ちます。これは、スケールアップ、スケールダウン、またはSQLの最適化を計画する際の有用な入力です。

metrics basic

Metric	What it shows
CPU Utilization	全ノードにわたるCPU使用率のパーセンテージ。スケーリングやその他のリソース集約的な操作のための静穏な時間帯を見つけるのに有用。
Memory Usage	全ノードによって消費されるメモリ。継続的に高い使用量はスケールアップの信号。
Memory Utilization	全ノードのメモリ使用率。継続的に高い使用率はスケールアップの信号。
I/O Utilization	ディスクI/O使用率。継続的に高い値は、クエリパフォーマンスのためにより多くのノードを追加することを示唆。
Network Outbound Throughput	ノードあたりの1秒あたりの平均アウトバウンド速度（MB/s）。ネットワーク経由でデータを読み取るクエリは低速 — ネットワーク読み取りを減らすためにキャッシュを設定。
Network Inbound Throughput	ノードあたりの1秒あたりの平均インバウンド速度（MB/s）。
Cache Read Throughput	1秒あたりのキャッシュ読み取りスループット（MB/s）。
Cache Write Throughput	1秒あたりのキャッシュ書き込みスループット（MB/s）。

Support range:

Metric	Warehouse	Cluster
CPU Utilization	✓	✓
Memory Usage	✓	✓
Memory Utilization	✓	✓
I/O Utilization	✓	✓
Network Outbound Throughput	✓	✓
Network Inbound Throughput	✓	✓
Cache Read Throughput	—	✓
Cache Write Throughput	—	✓

Service metrics

Service metricsは、クエリとワークロードの動作を追跡します：クエリの実行速度、成功数、書き込みパスの動作です。

metrics query

Metric	What it shows
Query Per Second (QPS)	1秒あたりのクエリリクエスト数。ピークQPSは、clusterのサイジング時の有用な入力。
Query Success Rate	成功したクエリのパーセンテージ、1分ごとに更新。異常な下降は、clusterまたはnode障害を示す可能性。
Dead Nodes	cluster内の停止ノード数。
Average Query Runtime	平均クエリ時間、1分ごとに更新。異常な上昇は調査の信号。
Query 99th Latency	99パーセンタイルクエリの応答時間。遅いクエリの速度を反映。
Cache Hit Rate	キャッシュから提供されるI/O操作のパーセンテージ。低い値はキャッシュポリシーの見直しやキャッシュ領域の増加を示唆。
Remote Storage Read Throughput	単位時間あたりにリモートストレージから読み取られるデータ量。
Sessions	warehouseのセッション数（clusterごとには分割されない）。
Load Rows Per Second	レコードが正常に書き込まれる割合。
Load Bytes Per Second	データボリュームが書き込まれる割合。
Finished Load Tasks	最近の期間で完了したロードタスク数。急激な変化はビジネス異常を示す可能性。
Compaction Score	データファイルマージ圧力。高いスコアはより多くのマージ圧力を意味する。
Transaction Latency	書き込みタスクのトランザクション待機時間。低いほどデータがより早くクエリ可能になる。

Support range:

Metric	Warehouse	Cluster
Query Per Second	✓	✓
Query Success Rate	✓	✓
Dead Nodes	—	✓
Average Query Time	✓	✓
Query 99th Latency	✓	✓
Cache Hit Rate	—	✓
Remote Storage Read Throughput	—	✓
Sessions	✓	—
Load Rows Per Second	✓	✓
Load Bytes Per Second	✓	✓
Finished Load Tasks	✓	—
Compaction Score	—	✓
Transaction Latency	✓	—

Alerts

VeloDB Cloudは、追加料金なし（SMSアラート通知を除く）でモニタリングとアラート機能を提供します。clusterモニタリングメトリクスが変化した際に通知されるよう、アラートルールを設定できます。

metrics alerts

View alert rules

Alertsリストは、既存のアラートルールとその現在のアラート状態を表示します：赤い点はルールが発火していることを意味し、緑の点はルールがトリガーされていないことを意味します。

One-click alerts

Enable One-Click Alertをクリックして、基本的なルールセットを自動的に設定します。このルールセットは現在のwarehousesとclustersの両方、および後で作成するものにも適用されます。

Create or edit an alert rule

New Alert Ruleをクリックするか、既存のルールをコピーします。

metrics alerts new alert rule

アラートルールには4つの部分があります：

Part	Description
Rule Name	warehouse内で一意の名前。
Cluster	ルールが適用されるclusters。clusterが削除された場合、そのルールは削除されませんが、無効化されます。
Conditions	1つ以上のメトリクス閾値、and / orで結合。
In Last	ルールが発火する前に条件が保持されなければならない期間。適時性とノイズのバランス。

Notification channels

すべてのアラートルールは1つ以上のチャネルにプッシュできます。各チャネルはアラートメッセージを独立してプッシュします。

In-site notificationとEmail — 通知するユーザーを選択。

SMS — ユーザーを選択するか、電話番号を直接入力。

WeCom — グループロボットを追加し、そのwebhook URLを貼り付け。

PC版WeComで、アラートを受信するグループを開く。
グループを右クリックし、Add Group Bot、次にCreate a Botをクリック。
ボットに名前を付け、Addをクリック。
webhook URLをアラートチャネル設定にコピー。

Note メッセージソースを制限するには、webhook IP許可リストを設定してください。VeloDB CloudサーバーIPは3.222.235.198です。

Lark — カスタムボットを追加し、そのwebhook URLを貼り付け。

対象グループで、Settings → BOTs → Add Bot → Custom Botをクリック。
ボットに名前と説明を付け、Nextをクリック。
webhook URLをアラートチャネル設定にコピー。

Note メッセージソースを制限するには、webhook IP許可リストを設定してください。VeloDB CloudサーバーIPは3.222.235.198です。

DingTalk — カスタムロボットを追加し、そのwebhook URLを貼り付け。完全な手順についてはDingTalkのガイドを参照してください。概要：

対象のDingTalkグループで、Group Settings → Group Assistant → Add Robot → Customを開く。
プロフィール画像、名前、セキュリティ設定を設定（Custom Keywordsを使用し、alertを入力）。
利用規約に同意し、Finishedをクリック。
webhook URLをアラートチャネル設定にコピー。

Note メッセージソースを制限するには、webhook IP許可リストを設定してください。VeloDB CloudサーバーIPは3.222.235.198です。

Alert history

Alertsページでアラート発火履歴を表示し、時間、ルール、またはclusterでフィルタリングできます。

Query Audit

Query Auditは、warehouse内で実行されたクエリを監査・分析するためのワンストップツールです。パフォーマンスの低いクエリを見つけ、トレンドを調査し、個別の問題を診断するために使用します。

リストビューで履歴クエリをフィルタリングし、List Selectionを使用してフィルタにより多くの次元を追加します。

Query IDをクリックしてクエリ詳細ページを開きます。プロファイルキャプチャが有効になっている場合、プロファイルがそこで利用可能です。

audit log

Note 非クエリ文と失敗した文にはQuery IDがありません。

Usage

Usageは、現在のwarehouse内でコンピュート、キャッシュ、ストレージがどのように消費されているかを表示し、コストがどこに向かっているかを確認できます。

左ナビゲーションからMonitoring → Usageを開きます。

usage

組織レベルの請求と支払いチャネルについては、Billingを参照してください。

Metrics​

Basic metrics​

Service metrics​

Alerts​

View alert rules​

One-click alerts​

Create or edit an alert rule​

Notification channels​

Alert history​

Query Audit​

Usage​

Metrics

Basic metrics

Service metrics

Alerts

View alert rules

One-click alerts

Create or edit an alert rule

Notification channels

Alert history

Query Audit

Usage