Monitoring
VeloDB Cloudは、warehouseとclusterの健全性とパフォーマンスを追跡し、変化が生じた際に対応できるよう、モニタリングとアラート機能を提供します。
左ナビゲーションのManageグループからMonitoringを開きます。Monitoringには4つのサブページがあります:Metrics、Alerts、Query Audit、Usageです。
Metrics
Metricsページでは以下のことができます:
- warehouseまたはcluster別にメトリクスを表示する
- Starredを使用して、warehouses間やclusters間で関心のあるメトリクスをピン留めし、一緒に表示する
- 時間セレクターを調整して、過去15日間までの履歴データを確認する
- ほぼリアルタイムの更新(5秒間隔)のために自動更新を有効にする
メトリクスは2つのカテゴリに分かれています:Basic Metrics(物理リソース使用率)とService Metrics(クエリ/ワークロードパフォーマンス)です。
Basic metrics
Basic metricsは、ノード別のclusterの物理的使用率を追跡します。これらは、特定の時間範囲でclusterが健全かどうかを判断し、履歴または現在のクエリがパフォーマンスに影響を与えているかどうかを判断するのに役立ちます。これは、スケールアップ、スケールダウン、またはSQLの最適化を計画する際の有用な入力です。

| Metric | What it shows |
|---|---|
| CPU Utilization | 全ノードにわたるCPU使用率のパーセンテージ。スケーリングやその他のリソース集約的な操作のための静穏な時間帯を見つけるのに有用。 |
| Memory Usage | 全ノードによって消費されるメモリ。継続的に高い使用量はスケールアップの信号。 |
| Memory Utilization | 全ノードのメモリ使用率。継続的に高い使用率はスケールアップの信号。 |
| I/O Utilization | ディスクI/O使用率。継続的に高い値は、クエリパフォーマンスのためにより多くのノードを追加することを示唆。 |
| Network Outbound Throughput | ノードあたりの1秒あたりの平均アウトバウンド速度(MB/s)。ネットワーク経由でデータを読み取るクエリは低速 — ネットワーク読み取りを減らすためにキャッシュを設定。 |
| Network Inbound Throughput | ノードあたりの1秒あたりの平均インバウンド速度(MB/s)。 |
| Cache Read Throughput | 1秒あたりのキャッシュ読み取りスループット(MB/s)。 |
| Cache Write Throughput | 1秒あたりのキャッシュ書き込みスループット(MB/s)。 |
Support range:
| Metric | Warehouse | Cluster |
|---|---|---|
| CPU Utilization | ✓ | ✓ |
| Memory Usage | ✓ | ✓ |
| Memory Utilization | ✓ | ✓ |
| I/O Utilization | ✓ | ✓ |
| Network Outbound Throughput | ✓ | ✓ |
| Network Inbound Throughput | ✓ | ✓ |
| Cache Read Throughput | — | ✓ |
| Cache Write Throughput | — | ✓ |
Service metrics
Service metricsは、クエリとワークロードの動作を追跡します:クエリの実行速度、成功数、書き込みパスの動作です。

| Metric | What it shows |
|---|---|
| Query Per Second (QPS) | 1秒あたりのクエリリクエスト数。ピークQPSは、clusterのサイジング時の有用な入力。 |
| Query Success Rate | 成功したクエリのパーセンテージ、1分ごとに更新。異常な下降は、clusterまたはnode障害を示す可能性。 |
| Dead Nodes | cluster内の停止ノード数。 |
| Average Query Runtime | 平均クエリ時間、1分ごとに更新。異常な上昇は調査の信号。 |
| Query 99th Latency | 99パーセンタイルクエリの応答時間。遅いクエリの速度を反映。 |
| Cache Hit Rate | キャッシュから提供されるI/O操作のパーセンテージ。低い値はキャッシュポリシーの見直しやキャッシュ領域の増加を示唆。 |
| Remote Storage Read Throughput | 単位時間あたりにリモートストレージから読み取られるデータ量。 |
| Sessions | warehouseのセッション数(clusterごとには分割されない)。 |
| Load Rows Per Second | レコードが正常に書き込まれる割合。 |
| Load Bytes Per Second | データボリュームが書き込まれる割合。 |
| Finished Load Tasks | 最近の期間で完了したロードタスク数。急激な変化はビジネス異常を示す可能性。 |
| Compaction Score | データファイルマージ圧力。高いスコアはより多くのマージ圧力を意味する。 |
| Transaction Latency | 書き込みタスクのトランザクション待機時間。低いほどデータがより早くクエリ可能になる。 |
Support range:
| Metric | Warehouse | Cluster |
|---|---|---|
| Query Per Second | ✓ | ✓ |
| Query Success Rate | ✓ | ✓ |
| Dead Nodes | — | ✓ |
| Average Query Time | ✓ | ✓ |
| Query 99th Latency | ✓ | ✓ |
| Cache Hit Rate | — | ✓ |
| Remote Storage Read Throughput | — | ✓ |
| Sessions | ✓ | — |
| Load Rows Per Second | ✓ | ✓ |
| Load Bytes Per Second | ✓ | ✓ |
| Finished Load Tasks | ✓ | — |
| Compaction Score | — | ✓ |
| Transaction Latency | ✓ | — |
Alerts
VeloDB Cloudは、追加料金なし(SMSアラート通知を除く)でモニタリングとアラート機能を提供します。clusterモニタリングメトリクスが変化した際に通知されるよう、アラートルールを設定できます。

View alert rules
Alertsリストは、既存のアラートルールとその現在のアラート状態を表示します:赤い点はルールが発火していることを意味し、緑の点はルールがトリガーされていないことを意味します。
One-click alerts
Enable One-Click Alertをクリックして、基本的なルールセットを自動的に設定します。このルールセットは現在のwarehousesとclustersの両方、および後で作成するものにも適用されます。
Create or edit an alert rule
New Alert Ruleをクリックするか、既存のルールをコピーします。

アラートルールには4つの部分があります:
| Part | Description |
|---|---|
| Rule Name | warehouse内で一意の名前。 |
| Cluster | ルールが適用されるclusters。clusterが削除された場合、そのルールは削除されませんが、無効化されます。 |
| Conditions | 1つ以上のメトリクス閾値、and / orで結合。 |
| In Last | ルールが発火する前に条件が保持されなければならない期間。適時性とノイズのバランス。 |
Notification channels
すべてのアラートルールは1つ以上のチャネルにプッシュできます。各チャネルはアラートメッセージを独立してプッシュします。
In-site notificationとEmail — 通知するユーザーを選択。
SMS — ユーザーを選択するか、電話番号を直接入力。
WeCom — グループロボットを追加し、そのwebhook URLを貼り付け。
- PC版WeComで、アラートを受信するグループを開く。
- グループを右クリックし、Add Group Bot、次にCreate a Botをクリック。
- ボットに名前を付け、Addをクリック。
- webhook URLをアラートチャネル設定にコピー。
Note メッセージソースを制限するには、webhook IP許可リストを設定してください。VeloDB CloudサーバーIPは
3.222.235.198です。
Lark — カスタムボットを追加し、そのwebhook URLを貼り付け。
- 対象グループで、Settings → BOTs → Add Bot → Custom Botをクリック。
- ボットに名前と説明を付け、Nextをクリック。
- webhook URLをアラートチャネル設定にコピー。
Note メッセージソースを制限するには、webhook IP許可リストを設定してください。VeloDB CloudサーバーIPは
3.222.235.198です。
DingTalk — カスタムロボットを追加し、そのwebhook URLを貼り付け。完全な手順についてはDingTalkのガイドを参照してください。概要:
- 対象のDingTalkグループで、Group Settings → Group Assistant → Add Robot → Customを開く。
- プロフィール画像、名前、セキュリティ設定を設定(Custom Keywordsを使用し、
alertを入力)。 - 利用規約に同意し、Finishedをクリック。
- webhook URLをアラートチャネル設定にコピー。
Note メッセージソースを制限するには、webhook IP許可リストを設定してください。VeloDB CloudサーバーIPは
3.222.235.198です。
Alert history
Alertsページでアラート発火履歴を表示し、時間、ルール、またはclusterでフィルタリングできます。
Query Audit
Query Auditは、warehouse内で実行されたクエリを監査・分析するためのワンストップツールです。パフォーマンスの低いクエリを見つけ、トレンドを調査し、個別の問題を診断するために使用します。
リストビューで履歴クエリをフィルタリングし、List Selectionを使用してフィルタにより多くの次元を追加します。
Query IDをクリックしてクエリ詳細ページを開きます。プロファイルキャプチャが有効になっている場合、プロファイルがそこで利用可能です。

Note 非クエリ文と失敗した文にはQuery IDがありません。
Usage
Usageは、現在のwarehouse内でコンピュート、キャッシュ、ストレージがどのように消費されているかを表示し、コストがどこに向かっているかを確認できます。
左ナビゲーションからMonitoring → Usageを開きます。

組織レベルの請求と支払いチャネルについては、Billingを参照してください。